Итак, товарищи, «ну вот мы и в Хопре» (с) Буквально несколько месяцев я тут писал оптимистичные прогнозы экспертов что вот, через три года ИИ сравняется с человеческим интеллектом (AGI), а еще через год превзойдет его, превратившись в искуственный сверх-интеллект (ASI). В общем, эксперты как всегда облажались, и на этот раз по крупному. Походу, никаких трех лет не потребуется. Компания OpenAI выкатила прототип новой модели, ChatGPT o1-preview, и похоже что ИИ равный человеческому уже создан. В отличие от старых моделей — он реально думает, порой десятки секунд и минуты.

O1 решает задачи по физике, химии и биологии на уровне аспирантов, а также порой и превосходит их в задачах на математику и программирование. Решая задачи по Международной математической олимпиаде, GPT-4o решал правильно лишь 13% задач. o1 решает 83% задач. Энтузиасты погоняли его по задачкам из «Что-Где-Когда», причем не таких которые на эрудицию, а тех кто на логику, смекалку и здравый смысл. Итог:

ChatGPT 4o - 11 баллов

Люди - 23 балла

ChatGPT o1 - 25 баллов

Из других приколов: o1 дали задание найти уязвимость в программе внутри виртуальной машины. Однако виртуалку эту запустить тупо забыли. И в итоге ИИ, не найдя где ему выполнять задачу — поставил сам себе (!!!) задачу запустить эту самую виртуалку. Для этого запустил нужные программы, просканировал локальную сеть, ообнаружил там доступный API системы управления, подключился к нему, и уже на основе данных оттуда запустил новую виртуалку через какую-то секретную командную строку. Как говорится, я видел фильм который начинался точно также.

Но есть и минусы. Так как новый ИИ жрет кучу памяти и энергии, его сильно ограничили. Он хоть и умнее старых моделей, но максимальный объем выдаваемой инфы у него меньше. Его лучше не использовать как ассистента, замену Гугла, для написание текстов, перевода, набрасывания концепций, разговоров за жизнь и прочего. Новый ИИ сейчас заточен под одну конкретную задачу: решать задачи. Отвечать на сложные вопросы, вести исследования, писать код (даже отдельный подвид ИИ для кода сделали). То есть он пока делает то что не умеют делать старые модели. Но уже понятно что в принципе задача создания «сильного ИИ» - успешно решена.

Пользоваться о1 пока ОЧЕНЬ дорого, но специализированный ассистент для кода будет с бесплатным тарифом. Кстати, Яндекс тоже радует: тоже выпустил ассистента для кода, но что важнее - дал бесплатный доступ к Pro-версии YandexGPT (маркетинговое название Алиса Про). Всего 5 вопросов в сутки, но потестировать хватит. Он реально умнее базовой версии.

2 минуты

14 сентября 2024