В России создана новая нейросеть, в шесть раз точнее создающая описания локаций
Она обучилась самостоятельно проверять сгенерированные тексты на наличие галлюцинаций.
Благодаря новому подходу удалось в шесть раз сократить количество неточностей в созданных нейросетью кратких описаниях мест и достопримечательностей
Разработкой занимается "Яндекс" на основе YandexGPT.
Как рассказали "РГ" в пресс-службе компании, переход на обновлённую модель позволил использовать меньше вычислительных мощностей и удешевить работу.
Как нейросеть готовит краткие описания локаций
Создатели технологии рассказали, что краткие описания делаются в несколько этапов. Сначала модель анализирует большое количество отзывов на локацию, а также заполненную владельцем карточку организации в "Картах". Она объединяет важное для посетителей (то, о чём они пишут чаще всего) и особенности места в несколько предложений. Затем модель убирает из текста лишнее, например, слишком общие формулировки, и форматирует описание в заданной стилистике и структуре.
Авторы разработки добавили, что иногда при подготовке описаний нейросеть может добавить несуществующие детали - это называется галлюцинации. Поэтому на финальном этапе она оценивает написанное на правдивость - сравнивает свои ответы с отзывами, на которые опиралась, и удаляет "выдуманное".
Отдельно отмечается, что ранее за создание кратких описаний в "Картах" отвечали пять различных моделей - каждая из них выполняла определённую функцию, например, расставляла запятые или фильтровала отзывы по полезности. Теперь со всеми этими задачами справляется одна обновлённая модель, поэтому для её работы требуется меньше вычислительных мощностей. Переход на новую версию позволил повысить правдивость, точность и качество кратких описаний на 90%. Это решение может быть полезно и другим сервисам компании, которые используют языковую модель для кратких пересказов больших объёмов текстов.
Большой акцент делается на том, что компании удалось повысить качество работы нейросети в том числе и благодаря дообучению. Российский IT-гигант расширил датасет эталонными примерами генераций предыдущих моделей - так модель научилась создавать более полезные описания. Например, теперь при подготовке текстов она реже использует общие фразы, такие как "вкусная еда" или "приятная атмосфера".
Изучить краткие описания достопримечательностей и заведений и, например, выбрать место для встречи с друзьями, можно в карточке организации в блоке "Коротко о месте" и в разделе "Поток" режима персональных рекомендаций "Идеи". В "Картах" доступно уже несколько сотен тысяч карточек с кратким описанием.