С помощью искусственного интеллекта и тщательного изучения кашалотов ученые надеются понять, о чем говорят эти пришельцы из глубин.
Кашалоты, в том числе взрослые особи и детеныши, плавающие недалеко от карибской страны Доминика, общаются щелчками. Ученые планируют использовать машинное обучение, чтобы попытаться расшифровать то, что эти животные говорят друг другу, что может стать крупнейшим в истории усилием в области межвидовой коммуникации.
В течение трех лет морской биолог использовал подводные самописцы для записи кодов сотен китов. Но он никогда не слышал ничего подобного. Киты щелкали взад и вперед в течение 40 минут, и редко замолкали надолго. Никогда еще биолог так отчаянно не хотел понять, о чем говорят киты. Ему казалось, что он подслушивает братьев, борющихся в своей комнате. «Они разговаривали, играли и были братьями и сестрами», - говорит он. «Было очевидно, что происходило так много всего».
В течение следующих 13 лет исследователь National Geographic Explorer, записал и познакомился с сотнями кашалотов. Но он продолжал возвращаться к открытию, которое поразило его, когда он слушал Drop and Doublebend: если бы люди когда-либо расшифровывали язык китов или даже определяли, обладают ли киты тем, что мы действительно могли бы назвать языком, нам нужно было бы соедините свои клики с контекстом. Ключом к разблокировке общения китов будет знание того, кто эти животные и что они делают, издавая звуки.
Одно из желаний человечества - это завораживающая идея, что однажды мы сможем общаться с другими видами. За годы, прошедшие после того, как биолог пришел к пониманию, и отчасти из-за этого, потенциал преодолеть этот коммуникационный разрыв стал менее фантастическим. В понедельник группа ученых объявила, что они отправились в пятилетнюю одиссею, чтобы развить работу биологом с передовым исследовательским проектом, чтобы попытаться расшифровать, что кашалоты говорят друг другу.
Такая попытка казалась бы безумием еще несколько лет назад. Но эти усилия не будут полагаться только на биолога. В команду входят специалисты в области лингвистики, робототехники, машинного обучения и фотоаппарата. Они будут во многом опираться на достижения в области искусственного интеллекта, который теперь может переводить один человеческий язык на другой без помощи Розеттского камня или ключа. Этот квест, получивший название Project CETI (Инициатива перевода китообразных), вероятно, является крупнейшей попыткой межвидового общения в истории.
Эти ученые уже работают над созданием специализированных видео- и аудиозаписывающих устройств. Они стремятся поймать миллионы китовых кодов и проанализировать их. Надежда состоит в том, чтобы раскрыть основную архитектуру китовой болтовни: какие единицы составляют китовое общение? Есть ли грамматика, синтаксис или что-то подобное словам и предложениям? Эти эксперты будут отслеживать, как киты ведут себя, когда щелкают или слышат щелчки. И используя прорыв в обработке естественного языка - ветвь искусственного интеллекта, которая помогает Alexa и Siri реагировать на голосовые команды, - исследователи попытаются интерпретировать эту информацию.
Вокализации кашалотов, одни из самых громких звуков животных на планете, имеют структуру, подобную азбуке Морзе, которая разделяет признаки высокоразвитого языка.
Ничего подобного никогда не предпринималось. Мы обучили собак реагировать на наши команды, а дельфины научились имитировать человеческий свист. Мы научили шимпанзе и горилл использовать язык жестов и бонобо, чтобы отвечать на вопросы, нажимая символы на клавиатуре. Слон в Сеуле по имени Кошик даже может сказать несколько слов по-корейски.
Но цель не в том, чтобы киты понимали людей. Это для того, чтобы понять, что кашалоты говорят друг другу, живя в дикой природе.
'Они похожи на азбуку Морзе'
Проект начался с другого морского биолога и с простого тщеславия: большие успехи часто достигаются, когда сотрудничают ведущие эксперты из разных быстро развивающихся дисциплин.
Дэвид Грубер также является исследователем National Geographic, но его интересы давно вышли за традиционные рамки. Профессор биологии и экологии из городского университета Нью-Йорка использовал подводные лодки для исследования коралловых рифов. Но он также обнаружил биофлуоресцентную морскую черепаху на Соломоновых островах, обнаружил, что стаи рыб-фонариков используют свой светящийся свет для координации движений, изучил молекулы, которые заставляют кошачьих акул и некоторых угрей светиться , и построил камеру, чтобы имитировать вид одной акулы. мир . Однажды он объединился с роботом, чтобы разработать изящное устройство с шестью щупальцами, которое позволяет исследователям собирать медуз, не причиняя им вреда.
Лингвисты утверждают, что даже у самых умных животных, кроме человека, отсутствует система общения, которую можно было бы назвать языком. Но могут ли киты стать исключением?
В 2017 году, будучи научным сотрудником Института Рэдклиффа Гарвардского университета, ныряльщик Грубер увлекся кашалотами , самыми большими зубастыми китами, после прочтения книги о фридайверах, изучающих их. Однажды, когда он слушал китовую кодировку на своем ноутбуке, мимо прошел еще один парень из Рэдклиффа, Шафи Голдвассер.
«Это действительно интересно - они звучат как азбука Морзе», - вспоминает Грубер высказывание Гольдвассера. Она вела лекции для группы стипендиатов Рэдклиффа по машинному обучению, подполе искусственного интеллекта, которая использует алгоритмы для поиска и прогнозирования закономерностей в данных. Сегодня машинное обучение управляет всем: от поисковых систем до домашних роботов-пылесосов, таких как Roomba, и автономных транспортных средств. Она призвала Грубера поделиться кликами со своей группой Рэдклиффа.
В эту группу входили необычайно острые компьютерные умы. Гольдвассер - ученый-компьютерщик и один из ведущих мировых экспертов в области криптографии. Майкл Бронштейн , заведующий кафедрой машинного обучения в Имперском колледже Лондона, создал компанию по машинному обучению, которую позже продал Twitter для обнаружения фейковых новостей. Группу заинтриговала презентация Грубера. Может ли машинное обучение помочь людям понять общение животных?
Грубер увидел возможность. Он провел эклектическую карьеру, пытаясь заставить людей принять магию океанов, сосредоточившись на вещах, которые он считал замечательными, таких как кораллы, биофлуоресценция и медузы. Возможно, это был проект, который мог зажечь воображение публики, вдохновив людей упиваться тайнами и чудесами моря. «У меня была идея, что если я смогу заставить людей полюбить медузу, они смогут полюбить что угодно», - говорит Грубер. «Но в китах есть что-то, что действительно пробуждает человеческое любопытство».
Груберу нужно было поговорить с кем-нибудь, кто разбирался в китах. Поэтому он нашел Геро, основателя проекта «Доминиканский кашалот», который отслеживает динамику китовых семей, и отправил ему электронное письмо. Геро согласился выслушать Грубера.
Лингвисты утверждают, что даже у самых умных животных, кроме человека, отсутствует система общения, которую можно было бы назвать языком. Но могут ли киты стать исключением? Человеческий язык развился, по крайней мере частично, чтобы опосредовать социальные отношения, и Геро показал, что кашалоты ведут сложную социальную жизнь.
У кашалотов самый большой мозг в животном мире, в шесть раз больше нашего. Они живут в социальных сетях, где доминируют женщины, и обмениваются кодами в виде дуэта стаккато, особенно когда они находятся на поверхности. Они разделяются на кланы, состоящие из сотен или тысяч человек, которые идентифицируют себя с помощью различных кодов кликов. В некотором смысле кланы говорят на разных диалектах. Киты также идентифицируют друг друга по определенным шаблонам щелчков, которые они, кажется, используют как имена. И они изучают свои коды так же, как люди изучают язык, бормоча щелчки в подростковом возрасте, пока не усвоят репертуар своей семьи.
На протяжении многих лет Геро идентифицировал сотни людей из двух больших кланов у Доминики. Он может узнать многих с первого взгляда по уникальным отметкам на их лабиринтах. Анализируя ДНК из китовых фекалий и образцов кожи, он идентифицировал бабушек, тетушек, братьев и сестер.
И он вел подробные записи, включая тысячи исчерпывающе аннотированных записей кликов, в которых описывалось, кто говорил, к какому клану они принадлежали, с кем были и чем занимались в то время.
В 1970 году революционный альбом представил миру «песни» горбатых китов. Спустя десятилетия ученые работают над расшифровкой их и других звуков китов. National Geographic Explorers Натали Синклер, исследователь горбатых китов, и ...
Этого было более чем достаточно для теста. Применяя методы искусственного интеллекта к некоторым звукам Геро, коллеги Грубера по машинному обучению обучили компьютер распознавать отдельных кашалотов по их звукам. Компьютер был прав более 94 процентов времени.
Взволнованный, Грубер собрал рабочую группу, чтобы развить этот многообещающий результат. Помимо компьютерных коллег Геро и Грубера по Рэдклиффу, есть китовый биолог Роджер Пейн, лауреат премии Макартура, который популяризировал завораживающие песни горбачей в 1960-х и 1970-х годах, помогая разжечь движение «Спасите китов». Роберт Вуд, робототехник из Гарварда, который вместе с Грубером сконструировал манипулятор с медузами, и чья лаборатория построила самосгибающийся оригами и летающий дрон размером с насекомое. И есть Даниэла Рус, еще одна получательница Макартура и директор по информатике и искусственному интеллекту Массачусетского технологического института.
Они согласились с тем, что впервые у людей могут появиться инструменты, чтобы начать более тщательно понимать, что говорят животные - даже существа, которые живут в основном в темноте и охотятся на кальмаров на глубине тысячи футов ниже поверхности моря.
Тот факт, что эти животные полагаются почти исключительно на акустическую информацию, может даже упростить задачу. В ресторане в нескольких кварталах от Гарвард-Ярда команда набросала планы новой программы Apollo, одна из которых была сосредоточена на переводе речи пришельцев из глубин. В какой-то момент кто-то даже предположил, что их работа, в случае успеха, может обеспечить основу для разговора с внеземной жизнью. «Я все смотрел вокруг, ожидая, пока кто-нибудь рассмеется, и не видел ничего, кроме множества кивков», - говорит Грубер.
Машинное обучение может стимулировать прорывы
Это не значит, что шансы в пользу ученых.
За последние несколько десятилетий мы многое узнали об уникальных способах общения животных. Луговые собачки меняют свои крики в зависимости от того, подходят ли к ним ястребы, койоты или люди. Они даже будут издавать разные звуки, если человек, которого они видят, высокий или низкий, одет в белое или красное . Некоторые виды обезьян издают отчетливые звуковые сигналы об опасности. При приближении леопарда они визжат иначе, чем при виде орла.
Открытиям в области коммуникации между животными все чаще помогает ИИ. С помощью машинного обучения исследователи в 2016 году расшифровали различия в звонках между египетскими летучими мышами, ссорящимися из-за еды, и теми, которые дерутся за места для отдыха. Крысы и мыши общаются намного дальше человеческого слуха. Преобразуя эти звуки в сонограммы и пропуская изображения через искусственные нейронные сети, в значительной степени вдохновленные схемами человеческого мозга, ученые в 2019 году связали разные звуки с различным поведением, таким как бегство от опасности или попытка привлечь помощника. Исследователи окрестили свой алгоритм DeepSqueak .
Кашалоты проводят у поверхности всего около 10 минут каждый час, поэтому исследователи создают множество аудио- и видеомагнитофонов, чтобы фиксировать то, что они говорят друг другу, глубоко под поверхностью. Затем искусственный интеллект будет искать закономерности в болтовне.
Эти идеи теперь возможны, потому что прорывы в машинном обучении произошли молниеносно в последнее десятилетие, поскольку алгоритмы становятся более сложными, а вычислительная мощность компьютеров резко возрастает.
Некоторое компьютерное обучение является «контролируемым», то есть ученые дают примеры алгоритмов, аннотированные людьми, для их обучения. Например, анализируя тысячи изображений с пометкой «кошки», алгоритмы могут научиться распознавать кошек на других фотографиях.
Но нейронные сети могут находить закономерности в таких вещах, как язык, без первоначальной помощи со стороны человека. Заполнив сеть миллионами историй из Новостей Google вместе с фразами с недостающими элементами - «To _ or not to be» - эта сеть смогла построить математическую модель языка. Затем эта модель усвоила ассоциации между словами, например, что «Париж» для «Франции», как «Рим» для «Италии». Такие модели теперь являются краеугольным камнем обработки естественного языка и используются, например, для прогнозирования того, будет ли отзыв о ресторане на Yelp отрицательным, или для обнаружения спама в электронной почте.
Но проблем много. Машинный перевод возможен для людей отчасти потому, что словесные ассоциации в разных языках обычно схожи; «Луна» и «небо»
относятся друг к другу так же, как французские слова «lune» и «ciel». «Что касается китов, большой вопрос заключается в том, присутствует ли вообще что-нибудь из этого», - говорит Джейкоб Андреас , эксперт по обработке естественного языка в Массачусетском технологическом институте и член команды Project CETI. «Есть ли в этой коммуникационной системе минимальные единицы, которые ведут себя как язык, и существуют ли правила для их соединения?»
Чтобы выяснить это, команда планирует использовать множество методов. Например, один из подходов к глубокой сети требует случайных попыток обрисовать в общих чертах систему правил для языка. Затем он проверяет, соответствуют ли «единицы» разговора этим правилам. Если они этого не делают, он вносит изменения и пытается снова. Компьютеры выполняют «этот процесс настройки и проверки правил очень быстро, повторяя его тысячи или миллионы раз, чтобы создать набор правил, которые хорошо справляются с объяснением данных», - говорит Андреас.
Конечно, прогресс зависит от того, соберут ли исследователи достаточно данных. Машинное обучение требует огромного количества информации, но записей Геро исчисляются только тысячами. Для поиска закономерностей в речи китов, вероятно, потребуются десятки миллионов кодов, а может, и больше.
К тому же, как подозревал Геро с помощью Drop и Doublebend, ученые полагают, что им нужно будет сопоставить общение с поведением. Есть ли какая-то конкретная кодировка, которая появляется перед охотой, или последовательность, которая возникает, когда киты решают спариться?
«Это проблема коктейльной вечеринки», - говорит Грубер. Разложите несколько микрофонов по вечеринке, и они уловят обрывки разговора. Но наблюдайте за людьми - отслеживая, кто дотрагивается до чьей-то руки, кто просматривает комнату в поисках лучшей компании - «и вся сцена начинает обретать больше смысла», - говорит Грубер.