Найти в Дзене
Интересный интернет

Как ученые используют ИИ для общения с животными

Портативные датчики и искусственный интеллект помогают исследователям расшифровать коммуникацию животных - и начать говорить с ними в ответ.

В 1970-х годах молодая горилла по кличке Коко привлекла внимание всего мира своей способностью использовать человеческий язык жестов. Но скептики утверждают, что Коко и другие животные, которые "научились" говорить (включая шимпанзе и дельфинов), не могли по-настоящему понимать, что они "говорят", и что попытки заставить другие виды использовать человеческий язык, в котором символы представляют вещи, которые могут физически не существовать, бесполезны.

"Есть одна группа исследователей, которая стремится выяснить, могут ли животные участвовать в символической коммуникации, и другая группа, которая говорит: "Это антропоморфизм. Нам нужно ... понять нечеловеческую коммуникацию на ее собственных условиях", - говорит Карен Баккер, профессор Университета Британской Колумбии и научный сотрудник Гарвардского института перспективных исследований имени Рэдклиффа. Сейчас ученые используют передовые датчики и технологии искусственного интеллекта для наблюдения и расшифровки того, как широкий спектр видов, включая растения, уже обмениваются информацией с помощью собственных методов коммуникации. Эта область "цифровой биоакустики" является темой новой книги Баккера "Звуки жизни: как цифровые технологии приближают нас к миру животных и растений".

Журнал Scientific American поговорил с Баккером о том, как технологии могут помочь людям общаться с такими существами, как летучие мыши и медоносные пчелы, и как эти разговоры заставляют нас переосмыслить наши отношения с другими видами.

- Не могли бы вы кратко описать историю попыток людей общаться с животными?

- В середине 20-го века предпринимались многочисленные попытки научить человеческому языку животных, приматов, таких как Коко. И эти попытки были несколько противоречивыми. Оглядываясь назад, можно сказать, что сейчас мы считаем (возможно, тогда это было не так распространено), что мы были слишком антропоцентричны в своих подходах. Тогда мы хотели оценить интеллект животных, научив их говорить, как мы, тогда как на самом деле нам следовало бы подумать об их способности участвовать в сложной коммуникации на их собственных условиях, их собственным воплощенным способом, в их собственном мировоззрении. Одним из терминов, используемых в книге, является понятие umwelt, то есть понятие живого опыта организмов. Если мы внимательны к умвельту другого организма, мы не ожидаем, что медоносная пчела будет говорить на человеческом языке, но мы очень заинтересуемся удивительным языком медоносных пчел, который является вибрационным и позиционным. Он чувствителен к таким нюансам, как поляризация солнечного света, которые мы даже не можем передать своим телом. И именно в этом направлении сегодня развивается наука. Область цифровой биоакустики, которая ускоряется экспоненциально и открывает захватывающие открытия о коммуникации по всему древу жизни, теперь подходит к этим животным и спрашивает не "Могут ли они говорить как люди?", а "Могут ли они передавать друг другу сложную информацию? Как они это делают? Что для них важно?" И я бы сказал, что это более биоцентричный подход или, по крайней мере, менее антропоцентричный.
Если взглянуть шире, я думаю, важно также признать, что слушание природы, "глубокое слушание", имеет давнюю и почтенную традицию. Это древнее искусство, которое до сих пор практикуется в неопосредованной форме. Существуют давние традиции глубокого слушания коренных народов, которые глубоко настроены на нечеловеческие звуки. Поэтому, если мы объединим цифровое прослушивание - которое открывает огромные новые миры нечеловеческих звуков и декодирование этих звуков с помощью искусственного интеллекта - с глубинным прослушиванием, я считаю, что мы стоим на пороге двух важных открытий. Первое - это язык у нелюдей. И это очень спорное утверждение, которое мы можем рассмотреть. И второе: я считаю, что мы стоим на пороге межвидовой коммуникации.

- Что за технология позволяет совершать такие прорывы?

- Цифровая биоакустика опирается на очень маленькие, портативные, легкие цифровые рекордеры, похожие на миниатюрные микрофоны, которые ученые устанавливают повсюду - от Арктики до Амазонки. Эти микрофоны можно разместить на спинах черепах или китов. Их можно установить глубоко в океане, на самой высокой горной вершине, прикрепить к птицам. И они могут записывать звук непрерывно, круглосуточно, в отдаленных местах, куда ученым нелегко добраться, даже в темноте и без помех, которые возникают при появлении в экосистеме людей-наблюдателей.

Эта аппаратура создает поток данных, и именно здесь на помощь приходит искусственный интеллект, потому что те же алгоритмы обработки естественного языка, которые мы с таким успехом используем в таких инструментах, как Google Translate, могут быть использованы для выявления закономерностей в нечеловеческой коммуникации.

- Каков пример этих моделей общения?

- В главе о летучих мышах, где я обсуждаю исследования Йосси Йовеля, есть конкретное исследование, в котором он наблюдал за [почти двумя] дюжинами египетских плодовых летучих мышей в течение двух с половиной месяцев и записывал ... [их] вокализации. Затем его команда адаптировала программу распознавания голоса для анализа [15 000] звуков, и алгоритм соотнес конкретные звуки с конкретными социальными взаимодействиями, запечатленными на видео - например, когда две летучие мыши дрались за еду. Используя это, исследователи смогли классифицировать большинство звуков, издаваемых летучими мышами. Таким образом, Йовель и другие исследователи, такие как Джерри Картер, смогли определить, что летучие мыши обладают гораздо более сложным языком, чем мы предполагали ранее. Летучие мыши спорят из-за пищи; они различают полы, когда общаются друг с другом; у них есть индивидуальные имена, или "фирменные звуки". Летучие мыши-матери разговаривают со своими детенышами на языке, эквивалентном "материнскому". Но в то время как человеческие матери повышают высоту голоса, разговаривая с младенцами, летучие мыши понижают высоту, что вызывает лепетную реакцию у малышей, которые по мере взросления учатся "говорить" конкретные слова или референтные сигналы. Таким образом, летучие мыши участвуют в вокальном обучении.
Это отличный пример того, как глубокое обучение способно вывести эти закономерности из [этих] приборов, всех этих датчиков и микрофонов, и открыть нам то, что мы не могли получить с помощью невооруженного человеческого уха. Поскольку большая часть коммуникации летучих мышей находится в ультразвуковом диапазоне, выше нашего слухового диапазона, и поскольку летучие мыши говорят намного быстрее нас, нам приходится замедлять звук, чтобы услышать его, а также снижать частоту. Поэтому мы не можем слушать, как летучая мышь, но наши компьютеры могут. И следующее открытие, конечно же, заключается в том, что наши компьютеры также могут говорить с летучей мышью. [Программное обеспечение создает] специфические паттерны и использует их для связи с колонией летучих мышей или ульем, и именно этим сейчас занимаются исследователи.

- Как исследователи разговаривают с пчелами?

Исследования медоносных пчел очень интересны. Исследователь по имени Тим Ландграф изучает общение пчел, которое, как я уже упоминал, является вибрационным и позиционным. Когда пчелы "говорят" друг с другом, важны как движения их тела, так и звуки. Теперь компьютеры, и особенно алгоритмы глубокого обучения, способны следить за этим, поскольку можно использовать компьютерное зрение в сочетании с обработкой естественного языка. Сейчас они усовершенствовали эти алгоритмы до такой степени, что могут отслеживать отдельных пчел и определять, какое влияние общение одной особи может оказать на другую пчелу. Из этого вытекает способность декодировать язык медоносных пчел. Мы обнаружили, что у них есть определенные сигналы. [Исследователи дали этим сигналам] забавные названия. [Пчелы] зубоскалят; они крякают. Есть сигнал "тишина" или "стоп", сигнал "опасность". У них есть пиликанье [сигналы, связанные с роением], просящие и дрожащие сигналы, и все они направляют коллективное и индивидуальное поведение".
Следующим шагом Ландграфа стало кодирование этой информации в робота, которого он назвал RoboBee. В конце концов, после семи или восьми прототипов, Ландграф придумал "пчелу", которая могла входить в улей и, по сути, отдавать команды, которым подчинялись пчелы. Так, робот-пчела Ландграфа может сказать другим пчелам остановиться, и они остановятся. Он также может делать что-то более сложное, например, очень известный танец виляния - это коммуникационная модель, которую они используют, чтобы сообщить другим пчелам о местонахождении источника нектара. В некотором смысле это очень простой эксперимент, поскольку вы помещаете источник нектара в место, куда не залетали пчелы из улья, даете роботу указание сообщить пчелам, где находится источник нектара, а затем проверяете, успешно ли пчелы туда летят. И действительно, они летят. Такой результат был получен только один раз, и ученые не уверены, почему он сработал и как его повторить. Но это все равно поразительный результат*.
Это поднимает множество философских и этических вопросов. Можно представить, что такая система используется для защиты медоносных пчел - вы можете сказать пчелам, чтобы они летели к безопасным источникам нектара, а не к загрязненным, скажем, с высоким содержанием пестицидов. Можно также представить, что это может быть инструментом для одомашнивания ранее диких видов, которые мы лишь несовершенно одомашнили, или для попытки контролировать поведение других диких видов. А понимание уровня сложности и степени комплексной коммуникации у нелюдей поднимает некоторые очень важные философские вопросы об уникальности языка как человеческой способности.

- Какое влияние оказывает эта технология на наше понимание мира природы?

- Изобретение цифровой биоакустики аналогично изобретению микроскопа. Когда [голландский ученый Антони] ван Левенгук начал смотреть в свои микроскопы, он открыл мир микробов..., и это заложило основу для бесчисленных будущих открытий. Таким образом, микроскоп позволил людям по-новому взглянуть на мир как глазами, так и воображением. Аналогия заключается в том, что цифровая биоакустика в сочетании с искусственным интеллектом - это как слуховой аппарат планетарного масштаба, который позволяет нам заново слушать как своими протезированными ушами, так и воображением. Это постепенно открывает нам не только чудесные звуки, которые издают нелюди, но и фундаментальные вопросы о так называемом разрыве между людьми и нелюдьми, о наших отношениях с другими видами. И [это] также открывает новые способы думать о сохранении природы и нашем отношении к планете. Это очень глубоко.