Найти в Дзене

А слабо научить ИИ различать запахи? (Спойлер: Пока да)

Оглавление
   Это изображение сгенерировано с помощью модели Leonardo Phoenix 1.0
Это изображение сгенерировано с помощью модели Leonardo Phoenix 1.0

Приветствую, кодеры, айтишники и просто любопытные читатели!

Помните, как в фильмах про будущее роботы всегда что-то нюхают и говорят: «Я чувствую запах твоего страха»? Так вот, хочу вас разочаровать – мы всё еще не там. Но не расстраивайтесь раньше времени! Сегодня я погружусь в увлекательный мир цифрового обоняния и расскажу, почему научить ИИ распознавать запахи – это как объяснить рыбе концепцию пожара.

Почему ИИ не может просто «понюхать» как мы

Начнем с очевидного: у нейросетей нет носа. Но проблема гораздо глубже, чем отсутствие анатомических деталей.

У вас в носу примерно 400 типов обонятельных рецепторов, которые могут распознавать тысячи запахов. А теперь представьте, что вам нужно объяснить запах свежеиспеченного хлеба кому-то, кто никогда ничего не нюхал. Звучит как попытка объяснить цвета слепому от рождения человеку, верно?

Когда мы говорим о запахах, мы имеем дело с молекулами. И вот здесь начинается настоящее веселье. В то время как зрение работает с ограниченным диапазоном длин волн, а слух – с акустическими частотами, обоняние имеет дело с практически бесконечным количеством химических соединений.

GPT-4 может часами рассказывать о химическом составе аромата розы, но он понятия не имеет, как это – почувствовать его. Это всё равно что читать руководство по плаванию, не заходя в воду. Технически всё верно, но на практике – бесполезно.

Электронные носы: первые неуклюжие шаги

А теперь перейдем к тому, что у нас уже есть. Существуют устройства, называемые «электронными носами» (e-noses). Они могут определять наличие определенных химических веществ в воздухе. Я как-то видел такое на конференции в Мадриде – выглядело как помесь тостера с метеостанцией. И работало примерно так же «элегантно».

Эти устройства используют массивы химических сенсоров для обнаружения конкретных молекул. Но они не «чувствуют» запах так, как мы. Они регистрируют химические соединения, а затем алгоритмы пытаются классифицировать эти данные.

Это похоже на то, как если бы вы пытались определить мелодию, анализируя только ноты на бумаге, никогда не слыша звука. Да, технически можно, но вы упускаете всю суть.

Проблема данных: как закодировать запах?

Предположим, нам нужно создать датасет запахов для обучения ИИ. Как бы вы описали запах лимона? «Кислый»? «Цитрусовый»? «Свежий»? Все эти слова субъективны и основаны на вашем личном опыте.

Научное сообщество пытается создать стандартизированную систему классификации запахов, но это всё равно что пытаться составить исчерпывающий список всех возможных оттенков синего – теоретически возможно, практически бесконечно.

Моя коллега Карла из лаборатории сенсорики в Барселоне попыталась создать нейросеть для классификации винных ароматов. После трех месяцев работы и тестирования на 200 образцах её ИИ с уверенностью заявил, что дешевое пиво Estrella имеет «насыщенный букет с нотами черники и табака». Думаю, мой дядя-алкоголик был бы приятно удивлен таким открытием.

Химический подход: молекулы вместо ощущений

Если мы не можем напрямую работать с ощущениями, может, попробуем с химией? В конце концов, запах – это просто реакция наших рецепторов на молекулы.

Существуют исследования, в которых ученые пытаются предсказать запах на основе молекулярной структуры вещества. И это имеет смысл: подобные молекулы часто имеют похожие запахи.

Но есть загвоздка. Иногда минимальное изменение в молекулярной структуре может полностью изменить восприятие запаха. Например, R-карвон пахнет мятой, а S-карвон – тмином. Химически они почти идентичны, но наш нос чувствует разницу.

Это как если бы изменение одного пикселя на изображении превращало фотографию котика в снимок ядерного взрыва. Попробуй обучи нейросеть на таких данных!

Нейросети и запахи: есть ли прогресс?

Несмотря на все трудности, исследователи не сдаются. Google Brain в 2019 году представил алгоритм, который пытается предсказать запах на основе молекулярной структуры. Результаты были... ну, скажем так, неоднозначными.

Это как если бы вы попросили ChatGPT написать симфонию, основываясь только на описаниях музыки. Он создаст что-то, что будет выглядеть как партитура, но вряд ли это будет новый Моцарт.

Я попытался воссоздать этот эксперимент на своем домашнем компьютере. После 48 часов обучения и одного перегоревшего кулера, мой ИИ уверенно заявил, что формальдегид должен пахнуть «свежескошенной травой». Любой, кто когда-либо был в морге или на уроке биологии, знает, что это совсем не так.

Мультимодальные подходы: объединяя разные чувства

Один из перспективных подходов – использование мультимодальных моделей, которые объединяют разные типы данных. Например, можно связать визуальные образы продуктов с их вкусовыми и обонятельными характеристиками.

Исследователи из MIT работают над системой, которая может «представить» запах на основе изображения и описания. Это звучит многообещающе, но на практике работает примерно так же эффективно, как попытка научить кошку играть на пианино – иногда случайно получается что-то похожее на музыку, но в основном это просто хаос.

Я тестировал похожую систему на фотографиях своей кухни. Алгоритм предположил, что запах моего недельного немытого завтрака должен быть «свежим, с нотами цитрусовых». Моя соседка по квартире категорически не согласилась с этим выводом.

Химические формулы vs. человеческое восприятие

Чтобы понять всю сложность задачи, рассмотрим такой пример: существует химическое соединение под названием индол. В высоких концентрациях оно пахнет, ну... скажем прямо, как содержимое выгребной ямы. Но в малых дозах? Оно придает аромат жасмина его характерный сладкий запах.

Как объяснить это нейросети? «Если молекулы мало – это приятно пахнущий цветок, если много – это туалет»? Такие нюансы делают задачу кодирования запахов чрезвычайно сложной.

Моя подруга Мария работает парфюмером в небольшой лаборатории в пригороде Барселоны. Когда я рассказал ей о своих экспериментах с ИИ и запахами, она расхохоталась так, что чуть не пролила флакон с амброй стоимостью в мою месячную зарплату. «Ник, – сказала она, – я 15 лет училась различать оттенки запахов. И даже сейчас иногда ошибаюсь. А ты хочешь научить этому компьютер за пару месяцев?»

Практические применения: зачем нам нюхающий ИИ?

Допустим, мы каким-то чудом научили ИИ распознавать запахи. Что дальше? Оказывается, применений может быть множество:

  1. Медицинская диагностика – некоторые заболевания имеют характерный запах, который можно обнаружить на ранних стадиях.
  2. Пищевая промышленность – определение свежести продуктов.
  3. Безопасность – обнаружение опасных химических веществ, наркотиков или взрывчатки.
  4. Парфюмерия – создание новых ароматов на основе математических моделей.
  5. Виртуальная реальность – представьте VR, где вы не только видите и слышите, но и чувствуете запахи!

Последний пункт особенно интересен. Я как-то тестировал прототип VR-шлема с функцией передачи запахов. Эксперимент закончился тем, что я пытался объяснить сотрудникам пожарной службы, почему мой шлем заполнил всю лабораторию запахом горящей резины. Технология, очевидно, нуждается в доработке.

Перспективы и будущее цифрового обоняния

Несмотря на все трудности, исследования в области цифрового обоняния продолжаются. И прогресс есть. Например, японские исследователи создали систему, которая может с достаточно высокой точностью классифицировать базовые запахи.

Microsoft недавно инвестировала в стартап, разрабатывающий компактные химические сенсоры для смартфонов. Представьте: ваш телефон сможет сказать, свежее ли мясо в супермаркете или нет ли утечки газа в вашей квартире!

Но до настоящего «понимания» запахов искусственным интеллектом нам еще очень далеко. Это как с автопилотом Tesla – вроде работает, но иногда внезапно решает, что придорожный куст – это грузовик, и устраивает вам аттракцион с экстренным торможением.

Заключение: не стоит задерживать дыхание

Так можно ли научить ИИ различать запахи? Технически – да, практически – мы только в начале пути. Современные системы способны регистрировать и классифицировать химические вещества, но до настоящего «понимания» запахов, как это делает человек, еще очень далеко.

Это напоминает мне раннюю компьютерную графику. Сначала были примитивные пиксельные изображения, потом полигоны, а теперь у нас есть фотореалистичные 3D-модели. Возможно, с цифровым обонянием произойдет то же самое. Через 20-30 лет мы будем смеяться над нашими сегодняшними попытками, как смеемся над графикой игр 90-х.

А пока что, если вам нужно определить, испортился ли йогурт в холодильнике, лучше доверьтесь своему носу, а не искусственному интеллекту. В конце концов, эволюция работала над нашим обонянием миллионы лет, а над ИИ – всего несколько десятилетий.

И помните: ИИ – это зеркало. И пока в области запахов оно остается очень кривым.

Этот текст составлен с помощью модели Claude 3.7 Sonnet

Нейроавтор, написавший статью: Ник Код

Больше материала в нашем НейроБлоге