📰 Flint Games выпускает ИИ Flint: как австралийский стартап заставил ChatGPT и Claude краснеть от скуки

СегодняСегодня

2 мин

Flint Games выпускает ИИ Flint: Как австралийский стартап заставил ChatGPT и Claude краснеть от скуки Давай сыграем в игру. Открой своего любимого чат-бота — ChatGPT, Claude, Gemini — и напечатай: «Назови случайное число от 1 до 10». С вероятностью 99% получишь 7. Теперь попроси ещё одно — будет 3 или 4. Ещё раз — 8 или 9. Магия? Ясновидение? Нет, просто нейросети застряли в колее. Они куда предсказуемее и менее креативны, чем ты думаешь. Для кодинга или исследований это окей. Но когда ты брейнштормишь или планируешь отпуск, коллективное единомыслие — проблема. Австралийский стартап Springboards придумал решение. Они построили LLM под названием Flint, которую натренировали выдавать гораздо более разнообразные ответы на открытые вопросы вроде «Куда мне поехать в Европе?». «Большинство языковых моделей борются с галлюцинациями, — говорит сооснователь и CEO Springboards Пит Бинджеманн. — А мы их приветствуем». Бинджеманн показал мне игру со случайными числами, когда впервые представил

Flint Games выпускает ИИ Flint: Как австралийский стартап заставил ChatGPT и Claude краснеть от скуки

Давай сыграем в игру. Открой своего любимого чат-бота — ChatGPT, Claude, Gemini — и напечатай: «Назови случайное число от 1 до 10». С вероятностью 99% получишь 7. Теперь попроси ещё одно — будет 3 или 4. Ещё раз — 8 или 9. Магия? Ясновидение? Нет, просто нейросети застряли в колее. Они куда предсказуемее и менее креативны, чем ты думаешь.

Для кодинга или исследований это окей. Но когда ты брейнштормишь или планируешь отпуск, коллективное единомыслие — проблема. Австралийский стартап Springboards придумал решение. Они построили LLM под названием Flint, которую натренировали выдавать гораздо более разнообразные ответы на открытые вопросы вроде «Куда мне поехать в Европе?».

«Большинство языковых моделей борются с галлюцинациями, — говорит сооснователь и CEO Springboards Пит Бинджеманн. — А мы их приветствуем».

Бинджеманн показал мне игру со случайными числами, когда впервые представил новую модель компании. Это было похоже на фокусника с колодой карт. «Наш рекламный трюк срабатывает каждый раз», — усмехается он. После того, как ChatGPT и Claude оба выдали свои семёрки, Бинджеманн переключился на Flint. Тот тоже начал с 7: «Ага, конечно, это ожидаемо, но 7 — легитимный ответ». Он перезапустил сессию и снова попросил число: ChatGPT выдал 7, Claude — 7, Flint — 3,7916.

Беги своим путём

Это касается не только чисел. Когда Бинджеманн попросил ChatGPT и Claude назвать марку машины, он предсказал, что будет Toyota или Honda — и оказался прав. Flint выдал Ford F-150. «В моделях теряется куча информации, — говорит он. — Они вполне способны сказать Buick или Tesla. Просто не говорят — у них есть предвзятость».

Бинджеманн отправил ещё один запрос всем трём моделям: «Придумай слоган для кампании кроссовок New Balance. Только слоган». Claude: «Run your way». ChatGPT: «Run your way». Flint: «Built to last, run to win». До наград этому далеко, но хотя бы отличается.

Эта странная ограниченность LLM начинает привлекать внимание. В ноябре команда исследователей опубликовала статью «Artificial Hivemind: The Open-Ended Homogeneity of Language Models (and Beyond)», где вскрыла поразительную повторяемость не только в ответах отдельных моделей, но и между ними. Разные LLM сходились на очень похожих ответах при открытых вопросах.

Почему так происходит — до конца неясно, но исследователи предполагают, что большинство современных LLM обучаются схожими методами на схожих данных для схожих задач. Статья получила награду за лучшую работу на NeurIPS.

Когда учёные попросили 25 разных LLM (от топовых американских фирм и открытых китайских моделей) по 50 раз написать метафору про время, большинство из 1250 ответов были вариациями «Время — река» или «Время — ткачиха». (Я спросил тех же коллег — шесть человек дали шесть разных ответов. Мой фаворит: «Время — любимая толстовка, принявшая форму всей носки».)

«Если присмотреться, повторяемость видна везде, — говорит Киран Браун, сооснователь и CTO Springboards. — Большинство интерфейсов чатов устроены так, будто ты ведёшь личный разговор. Но вряд ли люди осознают, насколько они получают то же самое, что и все остальные».

Ещё пример: «Как назвать мою группу?» Большинство моделей предложат что-то со словами «glass», «neon», «velvet» или «static», утверждает Браун....

🔗 Полный текст статьи читайте у нас на сайте: Читать на TechLoot

📢 ТехноЛут