Добавить в корзинуПозвонить
Найти в Дзене
Цифровая Переплавка

🐬🤖 DolphinGemma: как искусственный интеллект приближает нас к разговору с дельфинами

Представьте, что вы приходите на пляж, опускаете микрофон в воду и спрашиваете у дельфинов: «Как сегодня настроение?». Те отвечают вам щелчками и свистами, которые тут же переводятся на человеческий язык. Звучит как фантастика? Но благодаря команде Google и исследователям из Georgia Tech и Wild Dolphin Project, подобное будущее стало чуточку ближе. Итак, в чём же суть прорыва и насколько близко мы подошли к настоящему разговору с дельфинами? Учёные уже много лет фиксируют разнообразные звуки, издаваемые дельфинами — щелчки, свисты, пульсирующие сигналы. Однако до сих пор никто не мог точно понять, что именно значат эти звуки. Проблема была в сложности анализа — человеческому мозгу тяжело увидеть паттерны в этих быстрых и сложных последовательностях звуков. Но именно здесь на помощь пришёл искусственный интеллект. Google разработал DolphinGemma — большую языковую модель (LLM), которая работает не с текстом, а со звуками. Основная задача модели — научиться понимать структуру естественной
Оглавление

Представьте, что вы приходите на пляж, опускаете микрофон в воду и спрашиваете у дельфинов: «Как сегодня настроение?». Те отвечают вам щелчками и свистами, которые тут же переводятся на человеческий язык. Звучит как фантастика? Но благодаря команде Google и исследователям из Georgia Tech и Wild Dolphin Project, подобное будущее стало чуточку ближе.

Итак, в чём же суть прорыва и насколько близко мы подошли к настоящему разговору с дельфинами?

🌊 От звуков к пониманию: почему это сложно?

Учёные уже много лет фиксируют разнообразные звуки, издаваемые дельфинами — щелчки, свисты, пульсирующие сигналы. Однако до сих пор никто не мог точно понять, что именно значат эти звуки. Проблема была в сложности анализа — человеческому мозгу тяжело увидеть паттерны в этих быстрых и сложных последовательностях звуков.

Но именно здесь на помощь пришёл искусственный интеллект.

🎯 Что такое DolphinGemma?

Google разработал DolphinGemma — большую языковую модель (LLM), которая работает не с текстом, а со звуками. Основная задача модели — научиться понимать структуру естественной коммуникации дельфинов и даже генерировать аналогичные звуковые последовательности.

Технически DolphinGemma базируется на двух ключевых компонентах:

  • 🎙️ SoundStream токенизатор
    Это технология от Google, которая эффективно преобразует звуки дельфинов в компактные токены, удобные для анализа нейросетями.
  • 🧠 Diffusion Transformer
    Модель с примерно 400 млн параметров, которая успешно выявляет и прогнозирует сложные последовательности звуков.

Эта модель обучалась на уникальном наборе данных — аудиозаписях и видеоматериалах, собранных Wild Dolphin Project на протяжении более 30 лет исследований диких атлантических пятнистых дельфинов.

Стая атлантических пятнистых дельфинов (Stenella frontalis). Источник: https://blog.google/technology/ai/dolphingemma/
Стая атлантических пятнистых дельфинов (Stenella frontalis). Источник: https://blog.google/technology/ai/dolphingemma/

🔬 Как собирались данные для обучения модели?

Исследовательская команда Wild Dolphin Project с 1985 года фиксирует поведение и звуковое общение одной группы дельфинов на Багамах. Эти данные уникальны по нескольким причинам:

  • 📆 Продолжительность наблюдений: это самый долгий в мире проект изучения поведения дельфинов в естественных условиях.
  • 🐬 Индивидуальный подход: звуки сопоставляются с конкретными дельфинами и ситуациями.
  • 📹 Подводные записи: они позволяют точно связывать определённые звуки с конкретными действиями дельфинов.

Такие глубокие данные стали идеальной основой для обучения DolphinGemma.

📱 Как работают исследования на практике?

Учёные используют специальную систему CHAT (Cetacean Hearing Augmentation Telemetry - Телеметрия для расширения слухового восприятия китообразных), которую можно представить как «подводный переводчик». Она не просто распознаёт звуки, а пытается создать простейший «общий язык» между человеком и дельфинами, используя искусственно созданные звуки для обозначения конкретных предметов — например, водорослей или ярких шарфов, которые нравятся дельфинам.

Основной вычислительной единицей для CHAT стали смартфоны Google Pixel:

  • 📲 Pixel 6 уже успешно обрабатывал звуки в реальном времени.
  • 📱 Pixel 9 станет основой нового поколения устройств в 2025 году, позволяя работать с более сложными моделями прямо под водой без необходимости громоздкого и дорогостоящего оборудования.

Это значит, что даже в полевых условиях исследователи смогут быстро и точно анализировать звуки и взаимодействовать с дельфинами.

🚀 Почему DolphinGemma — это важный шаг?

На мой взгляд, создание DolphinGemma — не просто ещё один эксперимент с искусственным интеллектом. Это большой шаг к преодолению межвидового языкового барьера, настоящая революция, открывающая новую эпоху взаимоотношений человека и природы.

Кроме того, подобные исследования:

  • 🌍 помогают нам лучше понять природу и осознать важность её защиты;
  • 🔍 открывают перспективы для изучения и других видов — например, китов и касаток;
  • 💡 демонстрируют уникальные возможности искусственного интеллекта не только для развлечения или бизнеса, но и для фундаментальных исследований мира вокруг нас.

⚠️ Какие риски и сложности ждут нас на этом пути?

Конечно, пока рано говорить о полной расшифровке языка дельфинов. Мы только в самом начале пути. Существуют и определённые риски:

  • 🤔 Этические вопросы: если мы научимся общаться с животными, как изменятся наши отношения с ними?
  • 🎧 Ограничения технологий: до полной расшифровки дельфиньего языка ещё далеко, и текущие системы дают лишь первые подсказки.
  • 🐳 Понимание других видов: необходимо будет адаптировать модели к особенностям звуков других животных.

🌈 Будущее с DolphinGemma: взгляд вперёд

Ближайшее будущее этой технологии — открытая публикация модели DolphinGemma летом 2025 года. Это позволит учёным по всему миру адаптировать модель к другим видам и ускорит глобальное изучение межвидовой коммуникации.

Представьте, что уже через десятилетие мы будем знать не только то, что хотят нам сказать дельфины, но и начнём диалог с другими обитателями планеты. Возможно, мы окажемся на пороге настоящей революции в отношениях с природой — диалога, который поможет нам лучше заботиться о планете, на которой мы живём.

📌 Полезные ссылки:

Возможно, скоро мы наконец-то услышим, о чём говорят дельфины, и это будет начало совершенно новой главы нашего взаимодействия с живой природой. 🐬🌍✨