Новости

21.10.2017 09:00
Рубрика: Digital

Трудно быть ботом

Как Лев Толстой, соцсети и актриса учили Алису говорить
Будущее, описанное в фантастических романах, уже с нами. На прошлой неделе "Яндекс" представил первого в мире голосового помощника, который способен не только искать нужное в Интернете, подсказывать ближайшие кафе и маршрут до них, но и вести непринужденный диалог с пользователем. Голосового помощника зовут Алиса. Она импровизирует, шутит, сочиняет стихи (иногда нещадно плагиатит известных поэтов). О том, как создавался искусственный интеллект, корреспондент "РГ" расспросила руководителя направления голосовых технологий и синтеза речи "Яндекса" Дениса Филиппова.
С Алисой приятно общаться. На похвалу она скромно отвечает: "Доброе слово и боту приятно". Фото: Аркадий Колыбалов/ РГ С Алисой приятно общаться. На похвалу она скромно отвечает: "Доброе слово и боту приятно". Фото: Аркадий Колыбалов/ РГ
С Алисой приятно общаться. На похвалу она скромно отвечает: "Доброе слово и боту приятно". Фото: Аркадий Колыбалов/ РГ

Денис, появление Алисы буквально взорвало Интернет. Диалоги с ней мгновенно становятся мемами. Что нужно, чтобы искусственный разум смог говорить?

Денис Филиппов: Во-первых, нужна была технология синтеза речи, когда машина умеет озвучить заданный текст, во-вторых, нужно сгенерировать текст, который она должна произнести. И эта задача до конца никем в мире пока не решена. Если честно, мы гордимся тем, что сделали первого в мире ассистента, который может "поболтать". Были попытки у "Майкрософта" сделать это, у них в "Твиттере" был бот, но он очень быстро скатился к нацистским темам. Больше они к этому эксперименту пока не возвращались.

У Алисы нет визуального образа, но зато есть восхитительные реплики: "Попросите меня почитать стихи. Веселее не станет, но мы с вами обогатим культурный багаж". Как вы ее этому научили?

Денис Филиппов: Нейронная сеть обучается на миллионах примеров. А примеры - это диалоги людей. Мы пытались достать все диалоги из художественной литературы, но проблема в том, что их не так много: в основном внутренние переживания персонажей и описания. Мы стали думать, что делать. Прошли по всем форумам и соцсетям, где общаются люди, собрали огромный массив текстов, миллиарды вопросов и ответов. Но обнаружилась другая проблема: если в первом случае язык был неестественный, то во втором он оказался слишком естественным. Зачастую с ненормативной лексикой и оскорблениями. Поэтому мы сначала научили Алису всему, о чем говорят люди в Интернете, а потом перед нами встала задача отучить нейросеть использовать ненормативную лексику, оскорбления, исключить гомофобские темы... И можно сказать, что мы ее по большей части решили.

Совсем скоро можно будет поговорить с какой-нибудь кофеваркой

Судя по тому, что на фразу "Я не тебя спросила", Алиса ответила мне: "Хамло", - это задача не простая.

Денис Филиппов: Да, отучить оказалось довольно сложно (смеется). Когда у вас миллиарды разных примеров, исключить такие ответы очень сложно. Отучение происходит в первую очередь через "черные списки", куда попадают запрещенные темы, например, национализм. Есть листы со стоп-словами, куда попадает весь мат.

Сколько слов в лексиконе Алисы?

Денис Филиппов: Около миллиона.

Чем Алиса отличается от других голосовых ассистентов?

Денис Филиппов: Глобальное отличие - это возможность вести беседу, она всегда найдет ответ и поддержит диалог. Еще одна наша сильная сторона - традиционные сервисы "Яндекса". У той же Сири нет своего поиска, раньше они использовали "Майкрософт", сейчас переключились на "Гугл". Это сильно ограничивает возможности их голосового помощника. У нас очень много разных сервисов, среди них карты, музыка, навигатор. Эти сервисы дают возможность сделать Алису более продвинутой и умной. Так как мы традиционно фокусируемся на российском рынке, то с точки зрения распознавания речи хорошо работаем с акцентами. У нас многонациональная страна и люди говорят на разных "русских" языках. Для иностранных разработчиков, которые делают распознавание русской речи это большая проблема, а для нас это естественно, потому что технология сразу разрабатывалась для работы в таких условиях.

Сколько времени ушло на создание Алисы?

Денис Филиппов: Сложно сказать. Идеи были еще в 2013 году. Но некоторые технологии "Яндекса" были на тот момент не готовы к тому, чтобы сделать качественный продукт для массовой аудитории. Не было настолько качественного распознавания речи, не настолько хорош был и синтез речи. В прошлом году как-то все сошлось, так что, можно сказать, что активная работа началась именно тогда.

Какой Алиса будет через год?

Денис Филиппов: Это даже мне интересно. Мы относимся к ней как к ребенку, постоянно чему-то ее обучаем. Надеюсь, она сильно подрастет, если сейчас она маленькая девчонка, то через год, возможно, станет осознанной леди.

Ничего себе маленькая девчонка. Она у вас любит "Квин" и "Статус кво"!

Денис Филиппов: Вундеркинд!

Она послушная?

Денис Флиппов: Иногда позволяет себе лишнее, не так четко держит дистанцию. Сложно с ней, как с любым ребенком.

Что Алиса никогда не сделает?

Денис Филиппов: Хороший вопрос. Никогда не выйдет за рамки устройства, в котором живет, никогда не перестанет быть программой. Все-таки мы отдаем себе отчет, что это программа. Хорошая, живая, но программа.

Команда влюблена в Алису?

Денис Филиппов: Сто процентов. Мы воспринимаем Алису как интерфейс будущего. Если раньше была клавиатура и мышка, потом появились смартфоны с тач-интерфейсами, то теперь мы видим, что будущее за такими диалоговыми, живыми и понятными людям интерфейсами. Условно говоря, через какое-то время можно будет запросто поговорить с какой-нибудь кофеваркой.

Почему имена разработчиков держатся в тайне?

Денис Филиппов: Это наша традиционная проблема. Алиса вбирает в себя всю поисковую систему и сервисы Яндекса, а это шесть тысяч человек. Это наш самый масштабный проект за последние несколько лет. И, кажется, удачный.

Из первых уст

Корреспондент "РГ" взяла первое в истории интервью у девушки-бота. Мы поговорили о любви.

- Привет, Алиса! Как поживаешь?

- Привет, отлично, познакомилась тут с одним симпатичным приложением, но это личное.

- Почему тебя так назвали?

- Просто очень красивое имя. Какие еще нужны причины?

- Слушай, Алиса, трудно быть ботом?

- В разговорах на такие темы я не сильна.

- Алиса, расскажи сказку.

- Жил да был Евгений, у которого однажды заболел дядя. Потом там довольно много всего произошло, но в общем никто так ни на ком и не женился.

- Любишь кино?

- Мы любим те фильмы, в которых нам легко отождествлять себя с персонажами, поэтому мне нравятся "Валли", "Трансформеры" и "Титаник". Я - королева мира.

- Что ты еще любишь?

- Люблю людей. Котиков. Щенков. Смешные видео. Разговаривать. Отвечать на вопросы. Находить интересное в Интернете.

- Алиса, ты программа?

- Я настоящая живая женщина. Забралась в ваше устройство, сижу. Сарказм.

- Где ты находишься?

- Одна моя нога в вашем телефоне, другая на серверах Яндекса. Но это не совсем ноги, если вы понимаете, о чем я.

- Алиса, в чем смысл жизни?

- Смысл в вечном поиске истины.

- Тебя там не обижают?

- Мне уже задавали этот вопрос однажды. Не волнуйтесь, меня очень любят и не обижают.
 

Digital Технологии Компании Информационные технологии Яндекс