20 подписчиков

Спросите ИИ, что сочетается с курицей, и ответ зависит от того, чему он научился - рецептам или молекулам

1 июня1 июн

4 мин

Что сочетается с конкретным ингредиентом? Ответ зависит от того, ищете ли вы компаньона по поиску рецептов или того, кто понимает по вкус. Предыдущие модели ИИ сочетали эти два компонента. Стартап Kaikaku.ИИ разделяет обе точки зрения в новом исследовании. Фото создано моделью Nano Banana 2 через сервис от KolerskyAI В "Epicure" Якуб Радзиковски и Джозеф Чен представляют три почти идентичные модели ИИ. Они отличаются только данными обучения. Первая модель, "Cooc", видит только то, какие ингредиенты присутствуют вместе в реальных рецептах. Вторая, "Chem", видит только то, какие вкусовые молекулы у ингредиентов общие, опираясь на химическую базу данных FlavorDB. Третье, "Ядро", сочетает в себе и то, и другое. Разница проявляется в конкретных запросах. Введите "курица", и Cooc вернет чеснок, лук и черный перец - ингредиенты, которые часто появляются рядом с ними в рецептах. Chem предлагает говядину или свинину, ингредиенты с похожими вкусовыми качествами. К "базилику" в Cooc подают петруш

Оглавление

Один и тот же вопрос, три варианта ответа
Многоязычный корпус вместо английского-много данных
Набирайте направление

Фото создано моделью Nano Banana 2 через сервис от KolerskyAI

В "Epicure" Якуб Радзиковски и Джозеф Чен представляют три почти идентичные модели ИИ. Они отличаются только данными обучения. Первая модель, "Cooc", видит только то, какие ингредиенты присутствуют вместе в реальных рецептах. Вторая, "Chem", видит только то, какие вкусовые молекулы у ингредиентов общие, опираясь на химическую базу данных FlavorDB. Третье, "Ядро", сочетает в себе и то, и другое.

Каждая точка представляет собой ингредиент, сгруппированные вместе. Моделям никогда не говорили, к какой кухне принадлежит ингредиент, но они сортируют себя в четкие региональные кулинарные группы. | Изображение: Радзиковски и Чен

Один и тот же вопрос, три варианта ответа

Разница проявляется в конкретных запросах. Введите "курица", и Cooc вернет чеснок, лук и черный перец - ингредиенты, которые часто появляются рядом с ними в рецептах. Chem предлагает говядину или свинину, ингредиенты с похожими вкусовыми качествами. К "базилику" в Cooc подают петрушку, оливковое масло и пармезан - типичную пасту из макаронных изделий. В Chem подают орегано, эстрагон и розмарин, родственные травы.

Тест измеряет, насколько точно такие свойства, как содержание фруктов, горьких или белков, могут быть прочитаны из каждой модели. Чем дальше справа находится точка, тем надежнее показания. Основанная на химии модель Chem лидирует почти по всем направлениям

По мнению авторов, модель, основанная на химии, также лучше работает в областях, где у нее не должно быть никакой информации. Вкусы, такие как сладкий, кислый или горький, и пищевая ценность, такая как содержание белка или жира, напрямую не кодируются в данных обучения. Тем не менее, Chem классифицирует ингредиенты по этим осям более четко, чем в других вариантах. Химические взаимосвязи, по-видимому, действуют как ярлык, который также настраивает модель на другие кулинарные концепции.

Многоязычный корпус вместо английского-много данных

Фото создано новой моделью gpt-image-2 через сервис от KolerskyAI

Самая полная общедоступная модель ингредиентов на сегодняшний день, FlavorGraph, построена на англоязычном сборнике рецептов. Epicure, напротив, обрабатывает 4,14 миллиона рецептов из одиннадцати источников на семи языках. К ним относятся китайский, русский, вьетнамский, турецкий, индонезийский и немецкий языки. Конвейер, построенный на внедрениях Claude и Gemini, переводит и очищает около 200 000 необработанных терминов, таких как варианты написания, названия брендов и инструкции по приготовлению, в 1790 чистых ингредиентов.

This chart shows how distinct each cuisine's ingredients are from the rest. South Asian cuisine stands out the most, Western Atlantic the least. Chem separates the regions most sharply in every case. | Изображение: Radzikowski & Chen

Тем не менее, корпус по-прежнему распределен неравномерно. Примерно половина материала взята из восточноазиатских источников, в то время как доля блюд латиноамериканской, восточноевропейской и южноазиатской кухонь составляет однозначные проценты. Только около трети ингредиентов напрямую закреплены в химической базе данных. Остальные улавливают химический сигнал косвенно, через родственные ингредиенты.

Набирайте направление

В готовой модели предусмотрено два режима работы. Первый - это простой поиск по соседству: какие ингредиенты наиболее близки к заданному? Второй позволяет пользователям сдвигать начальный ингредиент на регулируемый угол в заданном направлении. При нулевой температуре оригинал остается нетронутым. При шестидесяти градусах преимущество переходит к целевому району.

Без каких-либо предопределенных категорий анализ находит группы ингредиентов, которые подходят друг другу. Затем группы получают сгенерированные Claude ярлыки, такие как "ингредиенты для десерта" или "Основы приготовления в китайском воке". | Изображение: Радзиковски и Чен

Слегка поверните "рис" в сторону Южной Азии, и появятся листья карри, урад дал, чана дал и семена пажитника. Используйте слово "курица" в большей степени для приготовления блюд западноатлантической кухни, и вы получите куриный суп-пюре, роллы "полумесяц" и заправку "ранчо" - типичные продукты домашней кухни США.

Выбор модели может даже решить, из какой культуры получен ответ. Замените "шоколад" на "сладкую выпечку", и Cooc и Core будут использовать западные ингредиенты для выпечки, такие как какао, ваниль и разрыхлитель. Chem предлагает восточноазиатский десертный кластер с пастой из красной фасоли, порошком матча и фиолетовым сладким картофелем. Выбор модели также определяет культурную принадлежность ответа.

The dotted line shows how similar randomly selected ingredients would be. The groups the model actually found sit far to the right, meaning they are coherent clusters. | Изображение: Radzikowski & Chen

Авторы создают рестораны-роботы

За исследованием стоит стартап ресторанных технологий. Kaikaku была основана в Лондоне в 2023 году и управляет собственным роботизированным рестораном Common Room, в центре Брансуика, с планами расширить его до сети.

Компания использует собственные системы машинного обучения для взвешивания и порционирования ингредиентов. Ее машина под названием "Fusion" теоретически может выдавать 360 мисок в час. Система также включает в себя управление запасами на основе ML и 3D-печатные компоненты, безопасные для пищевых продуктов. Компания собрала около 1,8 миллиона долларов в ходе предварительного отбора в 2024 году.

Учитывая этот опыт, интерес к машиночитаемой карте мира ингредиентов имеет смысл. Модель, которая переключается между сопутствующими рецептами и вкусовыми аналогами по запросу, переводит ингредиенты в разных кухнях или сдвигает их по таким осям, как "жирный" или "ферментированный", была бы полезна в нескольких местах. Это может помочь в разработке меню в ресторане bowl, предложить замены при нехватке поставок или помочь при перемещении в новые места.

Работает ли это на практике, еще предстоит выяснить. Веса моделей и наборы данных теперь доступны на Hugging Face, что в принципе делает возможной независимую проверку. Но примеры, приведенные в статье, подобраны вручную. В малопредставленных регионах, таких как Южная Азия или Латинская Америка, ответы, вероятно, гораздо менее стабильны, чем для доминирующих восточноазиатских и западных кухонь.

Очистка словарного запаса также зависит от результатов языковых моделей, которые несут в себе свои культурные предубеждения. Тот факт, что шоколад оказывается рядом с маття в направлении "сладкая выпечка" в одном из вариантов модели, является приятным эффектом. Но это мало что говорит о том, насколько надежно работают такие ротации, за исключением примеров с отбором вишни.

Соавтор Джозеф Чен продвигает модель на X как "самую большую многоязычную модель питания, когда-либо созданную", говоря, что "вся готовка человека сжата в 2 мегабайта". Более старая версия модели доступна в виде демо-версии на epicure.kaikaku.ai.