2 подписчика

OpenAI снова в новостях: почему каждый «прорыв» стоит читать между строк

9 июня9 июн

3 мин

Раз в несколько недель OpenAI выпускает новость, после которой Twitter загорается: «ИИ всё, люди не нужны», «прорыв», «AGI близко». Потом пыль оседает, и оказывается, что прорыв — это улучшение на 15% в одном конкретном бенчмарке. Давайте разберёмся, как отличать реальный прогресс от маркетинга. OpenAI — это компания с оценкой под $100 млрд. Её инвесторы, партнёры и конкуренты смотрят на каждый шаг. В этом контексте коммуникация — это не просто пиар. Это часть бизнеса. Каждая громкая новость решает несколько задач одновременно: удерживает интерес прессы и публики, сигнализирует инвесторам о прогрессе, и — самое важное — привлекает лучших инженеров. В мире ИИ война за таланты острее, чем где-либо. Опубликовать впечатляющий технический результат — это способ сказать лучшим учёным мира: «мы на переднем крае, приходите к нам». Пресс-релиз технологической компании — это всегда немного реклама. Вопрос не в том, есть ли в нём правда, а в том, что именно они решили показать — и что решили скры

Оглавление

Почему OpenAI публикует новости так часто
Как читать новости об ИИ без паники и эйфории

Почему OpenAI публикует новости так часто

OpenAI — это компания с оценкой под $100 млрд. Её инвесторы, партнёры и конкуренты смотрят на каждый шаг. В этом контексте коммуникация — это не просто пиар. Это часть бизнеса.

Каждая громкая новость решает несколько задач одновременно: удерживает интерес прессы и публики, сигнализирует инвесторам о прогрессе, и — самое важное — привлекает лучших инженеров. В мире ИИ война за таланты острее, чем где-либо. Опубликовать впечатляющий технический результат — это способ сказать лучшим учёным мира: «мы на переднем крае, приходите к нам».

Пресс-релиз технологической компании — это всегда немного реклама. Вопрос не в том, есть ли в нём правда, а в том, что именно они решили показать — и что решили скрыть.

Как читать новости об ИИ без паники и эйфории

Есть несколько простых вопросов, которые стоит задать себе, прочитав любой заголовок об очередном прорыве.

Первый вопрос: на чём тестировали? Большинство впечатляющих результатов получены на специальных бенчмарках — это что-то вроде стандартных экзаменов для ИИ-моделей. Показать хороший результат на бенчмарке — не то же самое, что быть полезным в реальной задаче. Некоторые компании оптимизируют модели именно под популярные бенчмарки, что даёт красивые цифры и небольшой реальный прогресс.

Второй вопрос: по сравнению с чем? «На 40% лучше предыдущей версии» звучит внушительно. Но если предыдущая версия справлялась с задачей на 10%, то 40% улучшение даёт... 14%. Всё ещё бесполезно.

Третий вопрос: кто проверял? Собственные исследования компании — это не то же самое, что независимая оценка. Хорошая новость проходит через рецензирование или хотя бы воспроизводится другими командами.

Что реально изменилось в ИИ за последние два года

Среди шума есть несколько изменений, которые реально важны и часто недооцениваются.

Стоимость вычислений упала в 10 раз за два года. То, что стоило $10 в 2022-м, сейчас стоит $1. Это значит, что ИИ стал доступен малому бизнесу и разработчикам-одиночкам. Это настоящая революция — тихая, без громких заголовков.

Мультимодальность стала реальной. Год назад «видит картинки» — это был маркетинг. Сейчас модели действительно понимают диаграммы, таблицы, рукописный текст. Это открывает применения, которых раньше не было.

Контекстное окно выросло с 4 тысяч токенов до 200 тысяч. Грубо говоря: раньше модель «забывала» начало разговора через несколько минут. Теперь она помнит целую книгу. Это не эффектно, но практически важно.

Чего ещё нет — и когда появится

При всём прогрессе несколько вещей по-прежнему не работают надёжно. Рассуждение о реальном мире с непредсказуемыми условиями — по-прежнему слабое место. Модели блестяще справляются с задачами, у которых есть правильный ответ. В размытых, нечётких ситуациях — часто галлюцинируют.

Долгосрочное планирование и выполнение многошаговых задач без надзора человека — всё ещё ненадёжно. Именно поэтому «ИИ-агенты», о которых столько говорили в 2024-м, пока не стали массовым продуктом.

Лучший способ понять, что реально изменилось в ИИ — не читать пресс-релизы, а смотреть, что делают практики: какие задачи они начали доверять моделям год назад и не доверяли до этого.

Вывод

OpenAI — блестящая компания с реальными достижениями. Но её PR-машина работает на полную мощность, и каждая новость — это часть конкурентной гонки, а не просто академическое сообщение.

Читайте новости об ИИ с интересом, но со здоровым скептицизмом. Настоящие прорывы обычно тихие: просто однажды вы замечаете, что делаете что-то за 10 минут, на что раньше уходил час. Это и есть прогресс.

Как вы используете ИИ в работе или жизни? Что реально помогает, а что оказалось хайпом?