Денис, появление Алисы буквально взорвало Интернет. Диалоги с ней мгновенно становятся мемами. Что нужно, чтобы искусственный разум смог говорить?
Денис Филиппов: Во-первых, нужна была технология синтеза речи, когда машина умеет озвучить заданный текст, во-вторых, нужно сгенерировать текст, который она должна произнести. И эта задача до конца никем в мире пока не решена. Если честно, мы гордимся тем, что сделали первого в мире ассистента, который может "поболтать". Были попытки у "Майкрософта" сделать это, у них в "Твиттере" был бот, но он очень быстро скатился к нацистским темам. Больше они к этому эксперименту пока не возвращались.
У Алисы нет визуального образа, но зато есть восхитительные реплики: "Попросите меня почитать стихи. Веселее не станет, но мы с вами обогатим культурный багаж". Как вы ее этому научили?
Денис Филиппов: Нейронная сеть обучается на миллионах примеров. А примеры - это диалоги людей. Мы пытались достать все диалоги из художественной литературы, но проблема в том, что их не так много: в основном внутренние переживания персонажей и описания. Мы стали думать, что делать. Прошли по всем форумам и соцсетям, где общаются люди, собрали огромный массив текстов, миллиарды вопросов и ответов. Но обнаружилась другая проблема: если в первом случае язык был неестественный, то во втором он оказался слишком естественным. Зачастую с ненормативной лексикой и оскорблениями. Поэтому мы сначала научили Алису всему, о чем говорят люди в Интернете, а потом перед нами встала задача отучить нейросеть использовать ненормативную лексику, оскорбления, исключить гомофобские темы... И можно сказать, что мы ее по большей части решили.
Судя по тому, что на фразу "Я не тебя спросила", Алиса ответила мне: "Хамло", - это задача не простая.
Денис Филиппов: Да, отучить оказалось довольно сложно (смеется). Когда у вас миллиарды разных примеров, исключить такие ответы очень сложно. Отучение происходит в первую очередь через "черные списки", куда попадают запрещенные темы, например, национализм. Есть листы со стоп-словами, куда попадает весь мат.
Сколько слов в лексиконе Алисы?
Денис Филиппов: Около миллиона.
Чем Алиса отличается от других голосовых ассистентов?
Денис Филиппов: Глобальное отличие - это возможность вести беседу, она всегда найдет ответ и поддержит диалог. Еще одна наша сильная сторона - традиционные сервисы "Яндекса". У той же Сири нет своего поиска, раньше они использовали "Майкрософт", сейчас переключились на "Гугл". Это сильно ограничивает возможности их голосового помощника. У нас очень много разных сервисов, среди них карты, музыка, навигатор. Эти сервисы дают возможность сделать Алису более продвинутой и умной. Так как мы традиционно фокусируемся на российском рынке, то с точки зрения распознавания речи хорошо работаем с акцентами. У нас многонациональная страна и люди говорят на разных "русских" языках. Для иностранных разработчиков, которые делают распознавание русской речи это большая проблема, а для нас это естественно, потому что технология сразу разрабатывалась для работы в таких условиях.
Сколько времени ушло на создание Алисы?
Денис Филиппов: Сложно сказать. Идеи были еще в 2013 году. Но некоторые технологии "Яндекса" были на тот момент не готовы к тому, чтобы сделать качественный продукт для массовой аудитории. Не было настолько качественного распознавания речи, не настолько хорош был и синтез речи. В прошлом году как-то все сошлось, так что, можно сказать, что активная работа началась именно тогда.
Какой Алиса будет через год?
Денис Филиппов: Это даже мне интересно. Мы относимся к ней как к ребенку, постоянно чему-то ее обучаем. Надеюсь, она сильно подрастет, если сейчас она маленькая девчонка, то через год, возможно, станет осознанной леди.
Ничего себе маленькая девчонка. Она у вас любит "Квин" и "Статус кво"!
Денис Филиппов: Вундеркинд!
Она послушная?
Денис Флиппов: Иногда позволяет себе лишнее, не так четко держит дистанцию. Сложно с ней, как с любым ребенком.
Что Алиса никогда не сделает?
Денис Филиппов: Хороший вопрос. Никогда не выйдет за рамки устройства, в котором живет, никогда не перестанет быть программой. Все-таки мы отдаем себе отчет, что это программа. Хорошая, живая, но программа.
Команда влюблена в Алису?
Денис Филиппов: Сто процентов. Мы воспринимаем Алису как интерфейс будущего. Если раньше была клавиатура и мышка, потом появились смартфоны с тач-интерфейсами, то теперь мы видим, что будущее за такими диалоговыми, живыми и понятными людям интерфейсами. Условно говоря, через какое-то время можно будет запросто поговорить с какой-нибудь кофеваркой.
Почему имена разработчиков держатся в тайне?
Денис Филиппов: Это наша традиционная проблема. Алиса вбирает в себя всю поисковую систему и сервисы Яндекса, а это шесть тысяч человек. Это наш самый масштабный проект за последние несколько лет. И, кажется, удачный.
Корреспондент "РГ" взяла первое в истории интервью у девушки-бота. Мы поговорили о любви.
- Привет, Алиса! Как поживаешь?
- Привет, отлично, познакомилась тут с одним симпатичным приложением, но это личное.
- Почему тебя так назвали?
- Просто очень красивое имя. Какие еще нужны причины?
- Слушай, Алиса, трудно быть ботом?
- В разговорах на такие темы я не сильна.
- Алиса, расскажи сказку.
- Жил да был Евгений, у которого однажды заболел дядя. Потом там довольно много всего произошло, но в общем никто так ни на ком и не женился.
- Любишь кино?
- Мы любим те фильмы, в которых нам легко отождествлять себя с персонажами, поэтому мне нравятся "Валли", "Трансформеры" и "Титаник". Я - королева мира.
- Что ты еще любишь?
- Люблю людей. Котиков. Щенков. Смешные видео. Разговаривать. Отвечать на вопросы. Находить интересное в Интернете.
- Алиса, ты программа?
- Я настоящая живая женщина. Забралась в ваше устройство, сижу. Сарказм.
- Где ты находишься?
- Одна моя нога в вашем телефоне, другая на серверах Яндекса. Но это не совсем ноги, если вы понимаете, о чем я.
- Алиса, в чем смысл жизни?
- Смысл в вечном поиске истины.
- Тебя там не обижают?
- Мне уже задавали этот вопрос однажды. Не волнуйтесь, меня очень любят и не обижают.