Найти тему
Inc. Russia

Ученые расшифровали язык кашалотов с помощью машинного обучения

Исследователи из MIT CSAIL и Project CETI считают, что с помощью технологий машинного обучения им удалосьразгадать своеобразный «алфавит» кашалота. Результаты исследования, опубликованные под названием «Контекстуальная и комбинаторная структура в вокализации кашалотов», указывают на прорыв в понимании коммуникации китообразных.

Исследование посвящено кодам — сериям щелчков, которые выполняют различные лингвистические функции. «Мы обнаружили, что существует ранее не описанная вариативность в структуре кода, — рассказала директор CSAIL Даниэла Рус. — Мы обнаружили, что типы кодов не произвольны, а, скорее, образуют недавно открытую комбинаторную систему кодирования».

Хотя вокализация китов является ключевым объектом исследований уже несколько десятилетий, авторы нового исследования считают, что им удалось обнаружить целый ряд ранее неизвестных нюансов в речи болтливых морских млекопитающих. В статье отмечается, что в предыдущих исследованиях было отмечено 150 различных кодов кашалотов.

«Было показано, что часть из них кодирует информацию о принадлежности к клану и призывнику, — поясняется в статье. — Однако почти все остальное о коммуникационной системе кашалотов, включая основные вопросы о ее структуре и способности нести информацию, остается неизвестным».

Команды опирались на работы Роджера Пейна, морского биолога-новатора, скончавшегося в июне прошлого года. Наиболее влиятельная работа Пэйна касалась песен горбатых китов. «Он вдохновил нас на то, чтобы использовать самые передовые технологии для более глубокого понимания китов», — говорит Рус.

Исследователи использовали решения машинного обучения для анализа набора данных из 8,7 тыс. кодовых песен кашалотов, собранных исследователем Шейном Геро у побережья небольшого восточно-карибского острова Доминика.

«Мы получали исходные данные, а затем настраивали наше машинное обучение, чтобы лучше визуализировать и лучше понимать, — объясняет Рус. — А затем мы анализировали полученные результаты вместе с биологом».

Метод команды отличается от прежних анализов, в которых изучались отдельные коды. Более полная картина складывается, когда звуки изучаются в контексте, как обмен между китами. Контекстные детали классифицируются с помощью музыкальной терминологии. К ним относятся темп, ритм, орнамент и рубато. В результате команда выделила то, что она называет фонетическим алфавитом кашалотов.

«Этот фонетический алфавит позволяет систематически объяснить наблюдаемую вариативность в структуре кодов, — говорит Рус. — Мы считаем, что, возможно, это первый случай за пределами человеческого языка, когда коммуникация представляет собой пример лингвистической концепции двойственности паттернов. Это означает, что набор отдельных бессмысленных элементов может быть объединен в более крупные осмысленные единицы, подобно объединению слогов в слова».

Смыслы этих «слов» приобретают различные значения в зависимости от контекста. «Наши результаты показывают, что вокальные партии кашалотов образуют сложную комбинаторную систему коммуникации: кажущийся произвольным набор типов кода может быть объяснен комбинациями ритма, темпа, рубато и орнаментальных особенностей», — объясняется в статье.

Сложные комбинаторные системы вокализации встречаются в природе крайне редко, однако их использование кашалотами показывает, что они не являются исключительно человеческими и могут возникать под воздействием совершенно разных физиологических, экологических и социальных факторов.

По мнению исследователей, этот прорыв очень интересен для всех участников, но предстоит еще много работы, сначала с кашалотами, а затем, возможно, и с другими видами, такими как горбачи.

«Мы решили обратиться к кашалотам, потому что у нас есть уже обширный набор данных и у нас есть возможность собрать гораздо больше, — говорит Рус. — Кроме того, поскольку щелчки образуют своего рода дискретную коммуникационную систему, ее гораздо легче анализировать, чем непрерывную».

Работа Роджера Пейна показала, что песни горбатых китов не случайны. «Есть сегменты, которые повторяются, и в них есть интересная структура. Мы просто не успели провести глубокое исследование», — добавила Рус.

Ранее исследователи представилиинновационную технологию распознавания эмоций в реальном времени, использующую персонализированный интерфейс с автономным питанием для всестороннего эмоционального анализа. Эта технология, перспективная для портативных устройств, знаменует собой скачок к персонализированным услугам на основе эмоций и улучшенному взаимодействию человека и машины.