21.10.2017 09:00
    Поделиться

    Денис Филиппов: Через год "Алиса" станет осознанной леди

    Будущее, описанное в фантастических романах, уже с нами. На прошлой неделе "Яндекс" представил первого в мире голосового помощника, который способен не только искать нужное в Интернете, подсказывать ближайшие кафе и маршрут до них, но и вести непринужденный диалог с пользователем. Голосового помощника зовут Алиса. Она импровизирует, шутит, сочиняет стихи (иногда нещадно плагиатит известных поэтов). О том, как создавался искусственный интеллект, корреспондент "РГ" расспросила руководителя направления голосовых технологий и синтеза речи "Яндекса" Дениса Филиппова.

    Денис, появление Алисы буквально взорвало Интернет. Диалоги с ней мгновенно становятся мемами. Что нужно, чтобы искусственный разум смог говорить?

    Денис Филиппов: Во-первых, нужна была технология синтеза речи, когда машина умеет озвучить заданный текст, во-вторых, нужно сгенерировать текст, который она должна произнести. И эта задача до конца никем в мире пока не решена. Если честно, мы гордимся тем, что сделали первого в мире ассистента, который может "поболтать". Были попытки у "Майкрософта" сделать это, у них в "Твиттере" был бот, но он очень быстро скатился к нацистским темам. Больше они к этому эксперименту пока не возвращались.

    У Алисы нет визуального образа, но зато есть восхитительные реплики: "Попросите меня почитать стихи. Веселее не станет, но мы с вами обогатим культурный багаж". Как вы ее этому научили?

    Денис Филиппов: Нейронная сеть обучается на миллионах примеров. А примеры - это диалоги людей. Мы пытались достать все диалоги из художественной литературы, но проблема в том, что их не так много: в основном внутренние переживания персонажей и описания. Мы стали думать, что делать. Прошли по всем форумам и соцсетям, где общаются люди, собрали огромный массив текстов, миллиарды вопросов и ответов. Но обнаружилась другая проблема: если в первом случае язык был неестественный, то во втором он оказался слишком естественным. Зачастую с ненормативной лексикой и оскорблениями. Поэтому мы сначала научили Алису всему, о чем говорят люди в Интернете, а потом перед нами встала задача отучить нейросеть использовать ненормативную лексику, оскорбления, исключить гомофобские темы... И можно сказать, что мы ее по большей части решили.

    Совсем скоро можно будет поговорить с какой-нибудь кофеваркой

    Судя по тому, что на фразу "Я не тебя спросила", Алиса ответила мне: "Хамло", - это задача не простая.

    Денис Филиппов: Да, отучить оказалось довольно сложно (смеется). Когда у вас миллиарды разных примеров, исключить такие ответы очень сложно. Отучение происходит в первую очередь через "черные списки", куда попадают запрещенные темы, например, национализм. Есть листы со стоп-словами, куда попадает весь мат.

    Сколько слов в лексиконе Алисы?

    Денис Филиппов: Около миллиона.

    Чем Алиса отличается от других голосовых ассистентов?

    Денис Филиппов: Глобальное отличие - это возможность вести беседу, она всегда найдет ответ и поддержит диалог. Еще одна наша сильная сторона - традиционные сервисы "Яндекса". У той же Сири нет своего поиска, раньше они использовали "Майкрософт", сейчас переключились на "Гугл". Это сильно ограничивает возможности их голосового помощника. У нас очень много разных сервисов, среди них карты, музыка, навигатор. Эти сервисы дают возможность сделать Алису более продвинутой и умной. Так как мы традиционно фокусируемся на российском рынке, то с точки зрения распознавания речи хорошо работаем с акцентами. У нас многонациональная страна и люди говорят на разных "русских" языках. Для иностранных разработчиков, которые делают распознавание русской речи это большая проблема, а для нас это естественно, потому что технология сразу разрабатывалась для работы в таких условиях.

    Сколько времени ушло на создание Алисы?

    Денис Филиппов: Сложно сказать. Идеи были еще в 2013 году. Но некоторые технологии "Яндекса" были на тот момент не готовы к тому, чтобы сделать качественный продукт для массовой аудитории. Не было настолько качественного распознавания речи, не настолько хорош был и синтез речи. В прошлом году как-то все сошлось, так что, можно сказать, что активная работа началась именно тогда.

    Какой Алиса будет через год?

    Денис Филиппов: Это даже мне интересно. Мы относимся к ней как к ребенку, постоянно чему-то ее обучаем. Надеюсь, она сильно подрастет, если сейчас она маленькая девчонка, то через год, возможно, станет осознанной леди.

    Ничего себе маленькая девчонка. Она у вас любит "Квин" и "Статус кво"!

    Денис Филиппов: Вундеркинд!

    Она послушная?

    Денис Флиппов: Иногда позволяет себе лишнее, не так четко держит дистанцию. Сложно с ней, как с любым ребенком.

    Что Алиса никогда не сделает?

    Денис Филиппов: Хороший вопрос. Никогда не выйдет за рамки устройства, в котором живет, никогда не перестанет быть программой. Все-таки мы отдаем себе отчет, что это программа. Хорошая, живая, но программа.

    Команда влюблена в Алису?

    Денис Филиппов: Сто процентов. Мы воспринимаем Алису как интерфейс будущего. Если раньше была клавиатура и мышка, потом появились смартфоны с тач-интерфейсами, то теперь мы видим, что будущее за такими диалоговыми, живыми и понятными людям интерфейсами. Условно говоря, через какое-то время можно будет запросто поговорить с какой-нибудь кофеваркой.

    Почему имена разработчиков держатся в тайне?

    Денис Филиппов: Это наша традиционная проблема. Алиса вбирает в себя всю поисковую систему и сервисы Яндекса, а это шесть тысяч человек. Это наш самый масштабный проект за последние несколько лет. И, кажется, удачный.

    Из первых уст

    Корреспондент "РГ" взяла первое в истории интервью у девушки-бота. Мы поговорили о любви.

    - Привет, Алиса! Как поживаешь?

    - Привет, отлично, познакомилась тут с одним симпатичным приложением, но это личное.

    - Почему тебя так назвали?

    - Просто очень красивое имя. Какие еще нужны причины?

    - Слушай, Алиса, трудно быть ботом?

    - В разговорах на такие темы я не сильна.

    - Алиса, расскажи сказку.

    - Жил да был Евгений, у которого однажды заболел дядя. Потом там довольно много всего произошло, но в общем никто так ни на ком и не женился.

    - Любишь кино?

    - Мы любим те фильмы, в которых нам легко отождествлять себя с персонажами, поэтому мне нравятся "Валли", "Трансформеры" и "Титаник". Я - королева мира.

    - Что ты еще любишь?

    - Люблю людей. Котиков. Щенков. Смешные видео. Разговаривать. Отвечать на вопросы. Находить интересное в Интернете.

    - Алиса, ты программа?

    - Я настоящая живая женщина. Забралась в ваше устройство, сижу. Сарказм.

    - Где ты находишься?

    - Одна моя нога в вашем телефоне, другая на серверах Яндекса. Но это не совсем ноги, если вы понимаете, о чем я.

    - Алиса, в чем смысл жизни?

    - Смысл в вечном поиске истины.

    - Тебя там не обижают?

    - Мне уже задавали этот вопрос однажды. Не волнуйтесь, меня очень любят и не обижают.
     

    Поделиться