Искусственный интеллект помогает ученым расшифровывать языки животных
Переводчика Google для грызунов и китов пока не существует, но исследователи работают над ним.
Шарлотта Ху | Опубликовано 1 сентября 2022 г., 19:00
Кен Чан / Unsplash
ПОДЕЛИТЬСЯ
В фильме Пиксар Вверх, мультяшная собака по кличке Даг носит своего рода волшебный ошейник, который может переводить его лай и скуление в беглую человеческую речь. В другом месте в реальном мире очень хорошо обученных собак можно научить нажимать кнопки, которые воспроизводят человеческую речь для простых команд, таких как «на улицу», «гуляй» и «играй». Люди всегда были очарованы возможностью общаться с животными, с которыми они делят мир, и в последнее время машинное обучение с его все более продвинутыми возможностями для анализа человеческой речи представило себя как обнадеживающий путь к переводу животных.
Статья в Газета "Нью-Йорк Таймс На этой неделе были задокументированы основные усилия пяти групп исследователей, которые изучали использование алгоритмов машинного обучения для анализа криков грызунов, лемуров, китов, кур, свиней, летучих мышей, кошек и многих других.
Как правило, системы искусственного интеллекта обучаются посредством обучения с помеченными данными (которые можно получить из Интернета или таких ресурсов, как электронные книги). Для моделей человеческого языка это обычно включает в себя выдачу компьютеру предложения, блокировку определенных слов и просьбу программы заполнить пробелы. Сейчас есть и более творческие стратегии, которые хотят сопоставить речь с активностью мозга.
Но анализ языка животных отличается от простого анализа человеческого языка. Ученые-компьютерщики должны проинструктировать программы о том, что искать и как организовывать данные. Этот процесс по большей части зависит не только от накопления достаточного количества голосовых записей, но и от сопоставления этих вокальных записей с визуальным социальным поведением животных. Например, группа, изучающая египетских фруктовых летучих мышей, также использовала видеокамеры для записи самих летучих мышей, чтобы обеспечить контекст для звонков. И группа, изучающая китов, планирует использовать видео, аудио, а также метки, которые могут записывать движения животных, чтобы расшифровать синтаксис, семантику и, в конечном итоге, смысл того, что киты общаются и почему. Конечно, несколько групп также предложили протестировать свои словари животных, проигрывая записи животным и наблюдая за их реакцией.
Создание Google Translate для животных было многообещающим проектом, над которым работали большую половину последнего десятилетия. Машинное обучение также далеко продвинулось в плане обнаружения присутствия животных и даже в некоторых случаях точной идентификации животных по зову.(Приложение Merlin от Cornell поразительно точно сопоставляет виды птиц с их криками). приписывая призывы отдельным людям, это все еще далеко от понимания всех запутанных нюансов того, что может заключать в себе язык животных.
Многие скептики этого подхода отмечают как недостатки современных языковых моделей ИИ в способности по-настоящему понять отношения между словами и объектами, к которым они могут относиться в реальном мире, так и недостатки в понимании учеными обществ животных в целом. Языковые модели искусственного интеллекта для людей полагаются на то, что компьютер отображает отношения между словами и контекстами, в которых они могут появляться (где они могут находиться в предложении и к чему они могут относиться). Но у этих моделей есть свои недостатки, и иногда они могут быть черным ящиком — исследователи знают, что входит и выходит, но не совсем понимают, как алгоритм приходит к выводу.
Другим фактором, который принимают во внимание исследователи, является тот факт, что общение животных может работать совсем не так, как человеческое общение, и тенденция к их антропоморфизации может искажать результаты. В языке животных могут быть уникальные элементы из-за физиологических и поведенческих различий.
С этой целью, чтобы не знать параметры данных заранее, есть предложения по использованию самоконтролируемых алгоритмов обучения для анализа аудиоданных, согласно отчету, опубликованному ранее в этом году в Уолл Стрит Джорнал, в котором компьютер сообщает исследователям, какие шаблоны он видит в данных — шаблоны, которые могут выявить связи, которые упускает человеческий глаз.В конечном счете, насколько далеко люди зайдут в кроличью нору, пытаясь понять общение животных, зависит от человеческих целей в этом типе исследований, и для этой цели может быть достаточно освоить основы. Например, переводчик, который может надежно интерпретировать, счастливы ли животные, с которыми мы часто находимся в тесном контакте, грустны или находятся в опасности, может быть и полезным, и более практичным в создании.
Шарлотта — помощник редактора по технологиям в Popular Science. Ей интересно понять, как меняются наши отношения с технологиями и как мы живем в сети. Свяжитесь с автором здесь.