558 подписчиков

GPT-5.5: новая ступень автономности и экономии токенов

2 дня назад2 дня назад

1 мин

🔧 OpenAI провели масштабную работу над GPT-5.5, сделав её первой полностью переобученной версией после почти годового периода доработок GPT-4.5. Главным отличием стала автономность: модель самостоятельно планирует действия, выбирает нужные инструменты и качественно решает сложные задачи, не требуя постоянного контроля. На бенчмарке Terminal-Bench 2.0 GPT-5.5 показала лучший результат — 82.7%, что обеспечило ей первое место в Intelligence Index по версии Artificial Analysis. Это свидетельствует о заметном прогрессе в способности моделей решать комплексные задачи. Цена токенов выросла вдвое — от $5 до $30 за миллион, что заметно дороже, чем у GPT-5.4. Однако экономия токенов в рамках Codex позволяет достигать тех же результатов меньшим числом итераций, что компенсирует стоимость и повышает общую эффективность. Главный недостаток — высокая степень генерации ложной информации без поиска и внешних инструментов: hallucination rate достигает 86% при тестах AA-Omniscience. Для сравнения, моде

Оглавление

Рекордные показатели и рейтинг
Стоимость и эффективность
Минусы и риски

Рекордные показатели и рейтинг

На бенчмарке Terminal-Bench 2.0 GPT-5.5 показала лучший результат — 82.7%, что обеспечило ей первое место в Intelligence Index по версии Artificial Analysis. Это свидетельствует о заметном прогрессе в способности моделей решать комплексные задачи.

Стоимость и эффективность

Цена токенов выросла вдвое — от $5 до $30 за миллион, что заметно дороже, чем у GPT-5.4. Однако экономия токенов в рамках Codex позволяет достигать тех же результатов меньшим числом итераций, что компенсирует стоимость и повышает общую эффективность.

Минусы и риски

Главный недостаток — высокая степень генерации ложной информации без поиска и внешних инструментов: hallucination rate достигает 86% при тестах AA-Omniscience. Для сравнения, модель Claude Opus 4.7 имеет показатель 36%. Это подчеркивает необходимость внимательной проверки и использования дополнительных источников.

Доступность и интеграция

GPT-5.5 доступна сейчас платным подписчикам ChatGPT и Codex, API будет запущено позднее.

Для компаний, создающих и публикующих экспертный контент, важна стабильность и автоматизация процесса размещения материалов на разных площадках. Сервис Kineiro.ru через API интегрируется с Telegram, ВКонтакте, Одноклассниками, Яндекс Дзен и позволяет организовать удобный и надёжный выход публикаций.

Итоги

GPT-5.5 устанавливает новый стандарт автономного ИИ с заметным прогрессом в эффективности и самостоятельности. Однако высокая склонность к генерации недостоверной информации требует комплексного подхода к проверке данных. В современных условиях цифровой грамотности и технологий ключевую роль играет умение сочетать мощь искусственного интеллекта с человеческой внимательностью и контролем.