Вышел первый выпуск новостей с цифровой ведущей Еленой

www.ferra.ru

В то время, когда многие ведущие на ТВ ведут себя по одной и той же схеме - как роботы, специалисты по новым технологиям экспериментируют с настоящими роботами. Так, техническое медиа Ferra.ru, входящее в состав Rambler Group, интегрировало в свои новости диджитал-телеведущую Елену. Созданная с помощью нейросетей, она может вести новостные сюжеты, используя только текст для генерации полноценного видеоизображения и речи, а также имитирует мимику и эмоции человека. Первый выпуск с участием Елены уже доступен на сайте Ferra.ru. Каждый, кто его посмотрит, обратит внимание на стандарт женского образа, подобранный для роли телеведущей, и на слегка замедленную, но спокойную способность озвучивать текст новостей.

Нужно сказать, что интонация цифровой ведущей отличается в выгодную сторону от крикливой подачи ее коллег на некоторых телеканалах и даже тех блогеров, которые всеми силами пытаются привлечь к себе внимание.

Елена - цифровой двойник телеведущей, созданный в 2019 году в Лаборатории робототехники Сбербанка с привлечением группы компаний ЦРТ, технологии которой обеспечивают синтез речи аватара.

"Его особенность - в использовании сложных нейросетевых моделей для непрерывной генерации речевого аудиосигнала по тексту. Это позволяет добиться плавности и выразительности искусственной речи, а благодаря мощному лингвистическому процессору прочтение текста выполняется со всеми нормами языка даже в сложных случаях", - поясняется в релизе.

Изображение Елены - тоже результат работы нейросетевых моделей, обученных на видеозаписях реального человека.

"Очевидно, что это только начало пути: в исследовательской части еще очень много актуальных задач, связанных с генерацией фотореалистичных цифровых персонажей, моделированием качественной анимации тела (включая мимику лица и жесты) и различных стилей (одежда, прически, макияж). Отдельная большая задача - заставить такие технологии работать быстро, в идеале - в режиме реального времени", - говорит Николай Симон, руководитель управления разработки виртуальных персонажей SberDevices.

"...Применение нейронных сетей позволило нам вывести качество генерируемой речи на новый уровень. С помощью гибких настроек мы привнесли целый пласт новых возможностей по ее управлению: естественное изменение темпа, тона речи, а также стиля прочтения текста. В ближайшем будущем подобная технология сможет еще точнее моделировать человеческие эмоции и в полной мере будет конкурировать с профессиональными дикторами", - отмечает Дмитрий Дырмовский, генеральный директор группы компаний ЦРТ.