Зачем это нужно? Как рассказала заведующая кафедрой Валерия Демарева, такой "детектор лжи", точнее "детектор правды об эмоциях" пригодится и на работе, и в быту. "Автоматическое определение стресса по голосу дает инструмент для раннего выявления перегрузок - помогает своевременно обнаруживать уязвимые состояния у операторов, диспетчеров и медперсонала, снижая риск ошибок и выгорания. Это может быть полезно для выявления мошенничества, к примеру, в банке, когда клиент просит выполнить подозрительную операцию", - поясняет исследователь.
Сотрудники вуза провели необычный эксперимент. Десяти студентам, которые выступили в роли испытателей-добровольцев, предложили прочитать один и тот же научный доклад дважды: сначала перед строгой комиссией (чтобы создать эффект стресса), а потом в одиночестве, в тихой комнате. Записи сравнили.
Выяснилось, что взволнованную речь отличают жесткие нотки, дрожание голоса и сбивчивый ритм - это последствия работы вегетативной нервной системы. Но главное чудо совершила техника. Ученые "скормили" записи машинному алгоритму Gradient Boosting, и тот научился отличать "стресс" от "спокойствия" по особым акустическим меткам - мел-частотным коэффициентам (MFCC).
Результат превзошел ожидания: точность классификации составила 91,9%. Из более чем двухсот проанализированных фрагментов машина ошиблась лишь в 18 случаях.
"Точность в контролируемых условиях обнадеживает, но во многом связана с тщательной предобработкой и однородностью выборки", - осторожно комментирует успех руководитель проекта, добавляя, что в реальной жизни все сложнее. Поэтому сейчас ученые готовят новую фазу исследований. Выборку расширят, а алгоритм доработают, чтобы он мог безошибочно считывать эмоции человека даже по телефону или в шумном помещении. Работа поддержана грантом Российского научного фонда, а первые результаты уже опубликованы в международной базе Springer Nature Link.