Найти в Дзене
Yousoro

GPT-5 уже на пороге: пять функций, о которых шепчутся инсайдеры

Cудя по утечкам, следующая версия ChatGPT-5 выйдет уже в июле 2025 года и принесёт не просто «больше параметров», а новую парадигму общения с ИИ. Ниже разбираю пять самых обсуждаемых фич — от настоящей мультимодальности до запуска «урезанной» GPT-5 прямо на ноутбуках Copilot + PC. Инсайдеры пишут, что GPT-5 научится принимать и генерировать все типы данных в одном окне чата: печатаешь текстом вопрос, прикладываешь фото, шепчешь комментарий голосом — и получаешь ответ сразу в нескольких форматах. Разработчики обещают встроенную видео-аннотацию (подал видеоролик — модель тут же делает раскадровку и таймкоды) и онлайн-перевод аудио в тексте прямо в потоке. Зачем это? Можно, не выходя из IDE, показать модели кусок кода на экране, продиктовать голосом, что именно ломается, и получить видео-демо исправления. А автомеханик скинет клиенту короткий ролик поломки, GPT-5 подпишет детали и посоветует бюджетные запчасти. OpenAI уже тестирует «постоянную память» в ChatGPT-4: бот вспоминает старые д
Оглавление

Cудя по утечкам, следующая версия ChatGPT-5 выйдет уже в июле 2025 года и принесёт не просто «больше параметров», а новую парадигму общения с ИИ.

Ниже разбираю пять самых обсуждаемых фич — от настоящей мультимодальности до запуска «урезанной» GPT-5 прямо на ноутбуках Copilot + PC.

1. Полная мультимодальность: текст + картинка + аудио + видео одновременно

Инсайдеры пишут, что GPT-5 научится принимать и генерировать все типы данных в одном окне чата: печатаешь текстом вопрос, прикладываешь фото, шепчешь комментарий голосом — и получаешь ответ сразу в нескольких форматах. Разработчики обещают встроенную видео-аннотацию (подал видеоролик — модель тут же делает раскадровку и таймкоды) и онлайн-перевод аудио в тексте прямо в потоке.

Зачем это? Можно, не выходя из IDE, показать модели кусок кода на экране, продиктовать голосом, что именно ломается, и получить видео-демо исправления. А автомеханик скинет клиенту короткий ролик поломки, GPT-5 подпишет детали и посоветует бюджетные запчасти.

2. Долговременная персональная память — привет, настоящий цифровой ассистент

OpenAI уже тестирует «постоянную память» в ChatGPT-4: бот вспоминает старые диалоги и учитывает твои личные предпочтения. В GPT-5 механизм планируют сделать дефолтным и многоуровневым: ИИ будет помнить твой стэк, любимый язык программирования, марку машины и даже то, что ты ненавидишь тёмную тему UI.

Чем полезно? Пишу «сгенерируй справочную информацию по чату», и бот автоматически отфильтровывает всё, что уже показывал мне раньше, плюс помнит нюансы поведения пользователя (например: я учу джунов, а не мидлов, что важно учитывать). Минус — надо внимательно чистить приватные данные: воспоминания, конечно, стираются, но паранойя ― наше всё.

3. Встроенные «агенты» и родная поддержка API-вызовов

С версии GPT-4 появились плагины, но они кривоваты: приходится вручную давать доступ и объяснять, что куда передавать. GPT-5, по слухам, получит нативную «агентную» прослойку: модель сама детектирует задачу «закажи пиццу» и тайно дёргает необходимый API, не заставляя тебя копировать токены. OpenAI якобы готовит маркетплейс готовых «skills» по аналогии с алексой, но с более строгой модерацией.

Зачем это мне как разработчику? Пишу в чате: «разверни staging-сборку на Vercel», и бот через готовый агент подгружает переменные окружения и выполняет деплой. Для конечного юзера ― заказ авиабилетов или доставка еды одной фразой. Главное, чтобы не доставил вместо капрезе тестовую ядерную боеголовку — посмотрим, как OpenAI решит вопрос безопасности.

4. On-device GPT-5-t: урезанная версия прямо в Copilot + PC

Microsoft активно встраивает модели в Snapdragon X-ноутбуки с ARM-чипами и NPU на 45 TOPS. По утечкам, именно там впервые появится локальная GPT-5-t — «тонкая» модель, работающая без облака для офлайн-задач: быстрый код-комплит, транскрипция митинга, приватные заметки.

Плюсы: автономность, мгновенный отклик, нулевые запросы к интернету (полезно в секретных проектах). Минусы: будет «забывать» половину параметров старшей модели, да и заряд батареи теоретически съедать сильнее, чем обычный VS Code.

5. Контекст «тысячи страниц» и качалка логики

Последний инсайд — window контекста в GPT-5 расширят до >512 000 токенов (примерно 350-400 страниц текста), плюс добавят усиленные цепочки рассуждений. Разработчики внутри OpenAI прозвали её «gradient gym» — модель сама «подтягивается» на тестах логики и планирования, как ты в тренажёрке.

Что это даёт? Можно скормить ИИ полный проект-документацию, а он отдаст готовый roadmap миграции; журналист накинет десятки страниц интервью — получит связанный материал с цитатами, а выпускнику хорошо поможет с дипломом (главное пройти антиплагиат, конечно же). Плюс, по слухам, model-to-model self-play уменьшит галлюцинации, а значит меньше хохмы: «Газель признали лучшим электрокаром столетия».

Когда ждать релиз?

Большинство источников сходятся: июль 2025 — публичный релиз в ChatGPT Plus, а в сентябре платформа «откроется» для API-клиентов. Месяц-два на откатку багов, и ты уже деплоишь side-project на базе GPT-5.

Если материал оказался полезен — ставь лайк, подписывайся и пиши в комментах, какая из пяти фич впечатлила тебя сильнее всего. А в следующей публикации разберу, как подготовить свой код под “агентов” GPT-5 — не пропусти!