С помощью портативных датчиков и искусственному интеллекту исследователи смогли расшифровывать общение животных и учатся им отвечать.
В 1970-х годах молодая горилла Коко привлекла внимание всего мира способностью использовать человеческий язык жестов. Но есть мнение, что Коко и другие животные, которые «научились» говорить, на самом деле не понимают, что они «говорят». Научный сотрудник Гарвардского института перспективных исследований Рэдклиффа Карен Баккер считает, что людям нужно понять нечеловеческое общение на его собственных условиях.
Теперь ученые используют передовые датчики и технологию искусственного интеллекта, чтобы наблюдать и расшифровывать то, как многочисленные виды, включая растения, обмениваются информацией с помощью своих собственных методов коммуникации. Эта область «цифровой биоакустики» является предметом новой книги Баккер «Звуки жизни: как цифровые технологии приближают нас к мирам животных и растений» .
Как всё начиналось
В середине 20-го века предпринимались многочисленные попытки научить приматов человеческому. И результаты этих усилий были несколько спорными. Оглядываясь назад, можно сказать, что учёные были слишком антропоцентричны в своих подходах. Они хотели научить нелюдей говорить так, как мы, а на самом деле следует думать об их способности вступать в сложную коммуникацию на их собственных условиях, в их воплощении, в их мировоззрении. Есть такое понятие, как умвельта, или жизненный опыт организмов. Если быть внимательным к умвельту другого организма, станет очевидно, что пчела не будет говорить на человеческом языке. При этом язык пчел сам по себе удивительный, он является вибрационным и позиционным. Он чувствителен к таким нюансам, как поляризация солнечного света, которую мы даже не можем передать своим телом. Именно этим сейчас заинтересовалась наука.
Область цифровой биоакустики, которая развивается экспоненциально и делает захватывающие открытия о коммуникации видов, теперь не спрашивает: «Могут ли животные говорить, как люди?», а спрашивает: «Могут ли они передавать друг другу сложную информацию? Как они это делают? Что для них важно?» И это более биоцентрический подход, или, как минимум, менее антропоцентрический.
«Глубокое слушание - это древнее искусство, которое практикуется до сих пор. У коренных народов существуют давние традиции глубокого слушания, настроенные на нечеловеческие звуки. Если объединить цифровое прослушивание, которое открывает огромные новые миры нечеловеческого звука и расшифровывает этот звук с помощью искусственного интеллекта, с глубоким прослушиванием, можно сделать важные открытия. Во-первых, что у нелюдей свой обособленный язык нелюдей. Во-вторых, мы можем прийти к межвидовому общению.
Какие технологии этому способствуют
Цифровая биоакустика опирается на очень маленькие, лёгкие и портативные цифровые записывающие устройства, похожие на миниатюрные микрофоны, которые ученые устанавливают повсюду от Арктики до Амазонки. Вы можете повесить эти микрофоны на спины черепах или китов. Можно поместить их в глубины океана, установить на самом высоком пике горы, прикрепить их к птицам. Они могут записывать звук непрерывно, 24 часа в сутки, 7 дней в неделю, в отдаленных местах, куда ученым не добраться, даже в темноте. При этом техника работает без сбоев, которые возникают при введении людей-наблюдателей в экосистему.
Этот инструмент создает поток данных, а потом вступает в дело искусственный интеллект, потому что те же алгоритмы обработки естественного языка, которые с таким успехом используются в таких инструментах, как Google Translate, также могут использоваться для обнаружения шаблонов в нечеловеческом общении.
Примеры моделей общения
Есть исследование, посвящённое летучим мышам, в рамках которого велось наблюдение за дюжиной египетских фруктовых летучих мышей в течение двух с половиной месяцев и записывалась их вокализации. Затем команда адаптировала программу распознавания голоса для анализа 15 000 звуков, и алгоритм сопоставил определенные звуки с конкретными социальными взаимодействиями, снятыми с помощью видео, например, когда две летучие мыши дрались из-за еды. Используя это, исследователи смогли классифицировать большинство звуков летучих мышей. Оказалось, что у летучих мышей гораздо более сложный язык, чем учёные предполагали ранее. Летучие мыши спорят из-за еды; они действительно различают пол, когда общаются друг с другом; у них индивидуальные имена или «подписные вызовы». Летучие мыши-матери разговаривают со своими детенышами «материнским языком». Но если человеческие матери поднимают высоту голоса при разговоре с младенцами, матери-летучие мыши понижают тон, что вызывает у младенцев лепет, так дети учатся «произносить» определенные слова или референтные сигналы по мере взросления. Таким образом, летучие мыши занимаются вокальным обучением.
Это отличный пример того, как глубокое обучение может извлекать эти паттерны из инструментов ( датчиков и микрофонов) и раскрывать нам то, к чему мы не могли бы получить доступ невооруженным человеческим ухом. Поскольку большая часть общения летучих мышей осуществляется в ультразвуковом диапазоне, за пределами нашего слышимого диапазона, и поскольку летучие мыши говорят намного быстрее, чем мы, чтобы мы могли их услышать, приходится замедлять запись, а также уменьшать частоту. Итак, мы не можем слушать, как общаются летучие мыши, но наши компьютеры могут. Более того, они способны говорить с мышами. Программное обеспечение создает определенные шаблоны и использует их для обратной связи с колонией летучих мышей или ульем.
Как исследователи разговаривают с пчелами
Исследования медоносных пчел очень увлекательны. Исследователь по имени Тим Ландграф изучает общение пчел, которое является вибрационным и позиционным. Когда медоносные пчелы «разговаривают» друг с другом, важны не только звуки, но и движения их тела. Теперь компьютеры, и особенно алгоритмы глубокого обучения, могут помочь разобраться с этим. Для понимания языка пчёл можно использовать компьютерное зрение в сочетании с обработкой естественного языка. Теперь эти алгоритмы усовершенствованы до такой степени, что они действительно могут отслеживать отдельных пчел и определять, какое влияние речь одной особи способно оказать на другую. Отсюда возникает способность расшифровывать пчелиный язык. У них есть определенные сигналы. Исследователи дали этим сигналам забавные названия: «гудок», «кряканье», есть сигнал «тише» или «стоп», сигнал «опасности». У них есть сигналы, связанные с роением, сигналы попрошайничества и встряхивания, и все они формируют коллективное и индивидуальное поведение.
Следующим шагом Ландграфа было закодировать эту информацию в робота, которого он назвал RoboBee. В конце концов, после семи или восьми прототипов, Ландграф придумал «пчелу», которая могла проникать в улей и издавать команды, которым медоносные пчелы подчинялись. Таким образом, робот-медоносная пчела Ландграфа может приказать другим пчелам остановиться, и они это делают. Он также может делать что-то более сложное, например, очень известный виляющий танец — это схема общения, которую они используют, чтобы сообщить местонахождение источника нектара другим медоносным пчелам.
Эксперимент, доказывающий работоспособность RoboBee очень прост. Вы помещаете источник нектара в такое место, где не бывали пчелы из улья, затем даете роботу указание сообщить пчелам, где находится источник нектара, а потом проверяете, успешно ли туда летают пчелы. И это действительно сработало. Но положительный результат получился только один раз. Ученые не уверены, почему это сработало или как это воспроизвести. Но это все равно поразительно.
Вы можете представить себе такую систему для защиты медоносных пчел — вы приказываете пчелам летать к безопасным источникам нектара, а не к загрязненным (например, с высоким уровням пестицидов). Или это может быть прекрасный инструмент для одомашнивания ранее диких видов, которые на данный момент не слишком хорошо приручены.
Понимание степени сложности общения у нечеловеческих животных поднимает некоторые очень важные философские вопросы. Так ли уникален человек в своей способности к общению?
Технология и понимание мира природы
Изобретение цифровой биоакустики схоже с изобретением микроскопа. Когда учёные взглянули через его окуляр, они открыли огромный мир микробов. Это заложило основу для бесчисленных будущих прорывов. Цифровая биоакустика в сочетании с искусственным интеллектом подобна слуховому аппарату планетарного масштаба, который позволяет нам услышать мир заново. Это постепенно открывает наш разум не только к чудесным звукам, которые издают не-люди, но и к фундаментальному набору вопросов о так называемом разделении между людьми и не-людьми, нашем отношении к другим видам. Это может коренным образом изменить наши отношения с планетой.