Искусственный интеллект научили понимать лай собак

Систему искусственного интеллекта (ИИ), которая может интерпретировать издаваемые собаками звуки, разработала группа американских ученых. Такое исследование напрашивалось давно: ведь нейросети уже и речь распознают, и диагнозы ставят, и пишут музыку и картины, и даже предсказывают будущее.
Собаки давно ждут, когда умные нейросети обратят на них внимание.
Собаки давно ждут, когда умные нейросети обратят на них внимание. / Eva Blanco / iStock

Можно сказать, что собака давно ждет, когда умные нейросети обратят и на них внимание. Ведь порой этот друг человека смотрит на своего хозяина столь выразительно, что кажется - вот-вот, наконец, выскажется.

При этом обучить ИИ распознавать лай собак - не такая уж сложная наука. Кинологам хорошо известны варианты и интерпретации звуков из собачьего "словаря". Именно они и стали той "азбукой", на которой ученые обучали ИИ. Сам принцип такого "натаскивания" известен: так учат детей распознавать предметы и новые слова.

Например, чтобы маленький ребенок научился узнавать автомобили и отличать их от мотоциклов, нужно как минимум несколько раз обратить его внимание на различный транспорт, и каждый раз произносить соответствующее слово: это машина, а это мотоцикл. В какой-то момент ребенок обнаружит закономерности и научится безошибочно их отличать. Нейросеть обучить даже проще, поскольку ей предъявляют тысячи, а то и десятки тысяч примеров.

Чтобы научить ИИ различать "смысл" издаваемых собаками звуков, ученые записали лай, рычание, вой и скулеж 74 домашних животных, среди которых были чихуахуа, французские пудели и шнауцеры. Затем с помощью кинологов выделили 14 различных типов звуков, например, "позитивные визги" во время игры, "печальный/тревожный лай", "очень агрессивный лай на незнакомца" и т. д.

А дальше пошли на неожиданный эксперимент, применив два варианта обучения. В одном случае ИИ учился с нуля только собачьему лаю, а в другом был предварительно обучен восприятию человеческой речи, а уж затем перенастроен на собачий язык. И вторая модель неожиданно показала значительно лучшие результаты. Она определяла эмоции собак с точностью 62%, породу - 62%, пол - 69%, выделяла конкретную собаку из общей группы с результатом в 50%. Первая модель достигала успеха всего в 24% случаев.

Исследователи подчеркивают, что основой для понимания языка животных могут послужить отдельные звуки и интонации, выделенные ИИ в человеческой речи. Для этого нужно протестировать больше пород собак, и попробовать применить эту модель к другим видам животных.