Результаты проведенных исследований направлены на разработку методов распознавания автоматически созданных текстов и могут иметь практическое значение для интернет-пользователей - влиять на их решения о покупках, выборе отеля, маршрута для путешествий, развлечений и в других сферах.
Не секрет, что интернет-отзывы оказывают значительное влияние при выборе нами товаров, услуг, принятии других решений. Однако растущая доступность методов и средств автоматической генерации текстов ставит под вопрос происхождение самих отзывов. В связи с этим сильно вырос интерес к разработке методов, позволяющих распознавать такие тексты, а именно различать автоматически порожденные и, напротив, написанные человеком тексты.
- Есть уже много работ по распознаванию текстов на английском языке, - пояснила ассистент кафедры алгоритмических языков ВМК МГУ Наталья Ефремова. - Наша разработка ориентирована на определенный жанр текста на русском языке, а именно на интернет-отзывы.
В качестве методов распознавания автоматически порожденных текстов была выбрана модель ruRoBERTa, разработанная командой SberDevices специально для обработки русскоязычных текстов.
Результаты исследования представлены на Всероссийской конференции "Ломоносовские чтения-2023".