04.06.2014 23:28
    Поделиться

    Skype будет синхронно переводить речь с 40 языков

    Уже в конце года сервис интернет-телефонии Skype получит новую возможность, которую разработчики называют революционной. Пользователи как компьютерного, так и мобильного приложения смогут свободно общаться с людьми, говорящими на иностранных языках, благодаря функции перевода, недавно созданной в корпорации Microsoft.

    Skype перешел под крыло Microsoft в мае 2011 года. Сам сервис был запущен осенью 2003 года и изначально предлагал пользователям лишь текстовые чаты и голосовые звонки, позднее появилась возможность совершения видеозвонков. Теперь разработчики собираются расширить функционал сервиса при помощи переводчика, получившего нехитрое название Skype Translator ("Переводчик для Skype").

    Пока что Skype Translator представляет собой исследовательский проект, для реализации которого, как говорят в Microsoft, понадобилось 10 лет глубоких исследований и множество денежных вливаний. Результатом трудов разработчиков стала технология синхронного перевода.

    В ходе демонстрации работы переводчика, которая прошла в конце мая на конференции в США, два разноязычных собеседника смогли без особых проблем пообщаться между собой через Skype. Один из участников разговора, вице-президент Skype Гардип Пол, говорил по-английски, его собеседница, сотрудница Microsoft Диана Хайнрихс, отвечала ему по-немецки. Перевод сказанного на язык собеседника демонстрировался в виде текста прямо в окне видеочата, оба участника разговора отлично поняли и остались довольны результатом.

    Сейчас созданная сотрудниками Microsoft технология поддерживает 40 языков перевода. Интересно, что впервые система автоматического перевода речи в режиме реального времени была продемонстрирована корпорацией еще в 2012 году - тогда в ходе ее демонстрации предложения, произнесенные на английском языке, транслировались на китайский.

    Теперь разработчикам удалось существенно увеличить количество направлений перевода и внедрить саму технологию в популярный сервис. К слову, сегодня Skype ежемесячно пользуются 300 млн человек. Каждый день они проводят за разговорами 2 млрд минут.

    По словам многих интернет-пользователей, которые принялись живо обсуждать грядущее нововведение, переводчик в Skype может стать так называемой killer feature (то есть возможностью, которая гарантированно привлечет внимание и будет иметь успех), если научится понимать различные акценты и диалекты. Но находятся и скептики, которые отмечают, что большинство автоматизированных переводчиков не способны корректно перевести даже текст, не говоря уже о голосе.

    Если разложить автоматический перевод на этапы, то их получится два. На первом этапе технология распознает речь и переводит ее в текст, на втором - переводит этот самый текст. Подобной технологией владеет и один из конкурентов Microsoft - компания Google. Ее мобильное приложение Google Translate способно "слушать" речь владельца, а затем переводить ее, причем не отдельные слова, а целые предложения. Результат перевода можно не только отобразить в виде текста на экране смартфона или планшета, но и озвучить синтезированным голосом.

    В телефонных разговорах эта технология не применяется, зато ее можно встретить на сайте YouTube, где она занимается переводом голоса персонажей роликов и созданием текстовых субтитров на разных языках. Так что Microsoft можно считать в некотором роде пионером, первопроходцем и, возможно, основателем нового направления в компьютерном переводе.

    Кстати, в переводчике используются технологии, которые были применены при создании голосового помощника Cortana, появившегося в новых версиях Windows. Он, как и Apple Siri и Samsung S-Voice, распознает речь и позволяет управлять гаджетом при помощи голосовых команд.

    "К сожалению, на сегодня нет технологии, позволяющей с отличным качеством решить такой комплексный вопрос, как распознавание речи и перевод. Такие решения есть у ведущих игроков на рынке, но они требуют тщательной настройки, - говорит Айнур Абдулнасыров, основатель отечественного сервиса LinguaLeo, предназначенного для онлайн-изучения английского языка.

    По его словам, для обеспечения качественной работы необходимо учитывать такие факторы, как темп, манеру разговора, акцент, тематику и так далее. "Получается бета-решение, которое позволяет понимать общий смысл технологии. Оно развивает возможности общения представителей разных языков, в частности, через технологию распознавания-перевода. При наличии технологии генерации речи можно считать такое решение цифровой заменой живого последовательного, но не синхронного переводчика".

    "Конечно, разница между живым интеллектом и даже самой высокотехнологичной программой велика. Но развитие этой технологии очень интересно рынку и будет востребовано", - добавляет Айнур Абдулнасыров.

    Базовые возможности Skype доступны пользователям без какой-либо платы - платить нужно лишь за дополнительные сервисы, например, за звонки на городские и мобильные телефоны или групповые видеочаты.

    Поделиться