Яндекс научился распознавать команды по голосу

Денис Кудряшов

Компания Яндекс запустил сразу три технологии распознавания речи Yandex SpeechKit: включение по голосовой команде, синтез речи (голосовой ответ на запросы пользователя) и понимание смысловых объектов, сообщается в официальном блоге компании.

Командой для голосовой активации может служить любое слово или фраза. Голосовая активация представляет собой систему распознавания речи в миниатюре. Система запускается на устройстве и не требует доступа в Интернет. Она анализирует весь входящий звуковой поток на предмет наличия речи, и, если речь обнаружена, начинает искать в ней кодовую фразу. Такой подход, утверждают разработчики, позволяет сэкономить заряд батареи в смартфоне или планшете.

Технология выделения в распознанном тексте смысловых объектов позволяет управлять компьютером или смартфоном простыми фразами, которые не нужно запоминать специально. Например, "Поставь будильник на семь утра". Также система одинаково распознает одну и ту же команду, произнесенную по-разному. Например, "Набери номер Ивана Ивановича" и "Позвони Ивану Ивановичу". Также эта технология умеет анализировать контекст, поэтому без лишних уточнений правильно распознает такие команды как "Позвони Владимиру" (имеется в виду человек) и "Поехали во Владимир" (город).

Третья технология - синтез речи - позволяет компьютеру проговаривать текст вслух. Акустическая модель принимает на вход последовательность фонем и выдает на выходе соответствующий им звук. Это позволяет добиться более плавных интонаций, гибко управлять скоростью речи и даже придавать ей те или иные эмоции.

Протестировать новые технологии Yandex SpeechKit можно в демонстрационном приложении Яндекс.Диктовка. Оно предназначено для набора текста голосом. Чтобы начать набор, достаточно произнести фразу "Яндекс, записывай". Приложение начнет слушать пользователя и преобразовывать его речь в текст в режиме реального времени.

Редактировать текст тоже можно голосом. Например, "Удали последнее слово", "Начни с новой строки", "Добавь веселый смайлик". По команде "Прочитай все" приложение озвучит текст, который был надиктован. Готовый текст можно сохранить как заметку, отправить в виде письма или смс, что тоже можно сделать голосом. Если приложение неверно распознало то или иное слово, достаточно нажать на кнопку "Корректор" и произнести его еще раз.

Диктовка уже доступна в магазине приложений Яндекса, а позже появится и в магазинах Google Play и App Store.

Напомним, собственную технологию распознавания речи Яндекс запустил в октябре 2013 года.

#технологии

#приложения

#Яндекс