Найти в Дзене
Что такое GPT-5.2? Обзор пяти ключевых обновлений в GPT-5.2!
GPT-5.2 — это декабрьский релиз 2025 года в линейке GPT-5: мультимодальная модель флагманского уровня (текст + изображение + инструменты), оптимизированная для профессиональной аналитики, работы с длинным контекстом, агентного использования инструментов и программной инженерии. OpenAI называет GPT-5.2 самым мощным представителем серии, созданным с акцентом на надёжное многошаговое рассуждение, обработку огромных документов и повышенную безопасность. Доступны три варианта: Instant, Thinking и Pro, которые сначала получают платные пользователи ChatGPT и API-клиенты. Что такое GPT-5.2 и почему это важно? GPT-5...
1 неделю назад
Как редактировать видео через Veo 3.1
Veo 3.1 — улучшенная модель текст→видео, создающая более качественные короткие клипы с нативным звуком, лучшим соответствием промпту и новыми возможностями редактирования: расширение сцены/клипа, интерполяция между кадрами и генерация с опорой на изображение (до трёх референсных изображений). Veo 3.1 доступна через API, интегрирована в приложение Gemini и творческий инструмент Flow, а также предоставляется корпоративным разработчикам через Vertex AI и Google AI Studio (доступность зависит от платформы и тарифа). Интеграция в Flow добавляет больше UI-контролей для редактирования (освещение/тени;...
1 неделю назад
Как использовать Claude Opus 4.5 с курсором и Claude Code — подробное руководство
Claude Opus 4.5 от Anthropic — это самый новый флагманский модельный релиз компании, ориентированный на кодирование, агентные рабочие процессы и продвинутые задачи «использования компьютера». В этой статье объясняются, что такое Opus 4.5, как он показывает себя на публичных бенчмарках и — пошагово — как использовать его в двух средах, ориентированных на разработчиков: Cursor (IDE с поддержкой ИИ) и Claude Code (командно-строчный агентный инструмент для кодирования от Anthropic). Вы получите практические примеры, сниппеты для копирования/вставки (Python, JS, CLI) и лучшие практики для эффективного, безопасного и экономного использования...
1 неделю назад
Вышел Gemini 3 Pro: сможет ли Gemini 3 Pro сокрушить конкурентов в области искусственного интеллекта?
Google официально открыл эпоху Gemini 3, выпустив Gemini 3 Pro в версии Preview. Первые оценки однозначны: это значительный шаг вперёд в области мультимодального анализа, код-агентов и понимания сверхдлинного контекста. Модель позиционируется как самая мощная модель Google для рассуждений и мультимодальности, оптимизированная для агентных рабочих процессов, программирования, задач с большим контекстом и комплексного понимания разных типов данных. В комплект включён режим «Deep Think», производительность на агентных и кодовых тестах заметно выросла (Terminal-Bench 2.0 — 54.2%), и модель уже доступна...
3 недели назад
How to Use the Nano Banana Pro(Gemini 3 Pro Image) API ?
Nano Banana Pro — официально Gemini 3 Pro Image — новая студийная модель генерации и редактирования изображений от Google/DeepMind, которая сочетает продвинутое мультимодальное рассуждение, высокоточное отображение текста внутри изображения, композицию из нескольких изображений и студийные инструменты управления творчеством. Nano Banana Pro — это новейшая модель Google для генерации и редактирования изображений (релиз “Gemini 3 Pro Image”), предназначенная для создания высококачественных, контекстно корректных изображений и встраиваемого текста в изображениях с качеством студии до 4K. Модель является преемником ранних Nano Banana (Gemini 2...
3 недели назад
Gemini 3 Pro vs GPT 5.1: что лучше? Полное сравнение
Как OpenAI GPT-5.1, так и Google Gemini 3 Pro представляют собой инкрементальные, но значимые шаги в беспрерывной гонке за общими мультимодальными ИИ. GPT-5.1 является совершенствованием линейки GPT-5 — с акцентом на адаптивное рассуждение, более низкую задержку для простых задач и управление стилем/личностью для более естественного разговорного тона. Gemini 3 Pro от Google продвигает границы в области мультимодальности, глубоких режимов рассуждения и тесных инструментов для агентных рабочих процессов. GPT-5.1 (OpenAI) и Gemini 3 Pro Preview (Google/DeepMind) нацелены на перекрывающиеся, но разные компромиссы: GPT-5...
1 месяц назад
GPT-5.1 vs Claude Sonnet 4.5 — Кто лидирует на передовой в 2025 году?
GPT-5.1 vs Claude Sonnet 4.5 GPT-5.1 от OpenAI — это инкрементальное, но ориентированное на продукт обновление, вводящее два варианта использования (Instant и Thinking), расширенное кэширование подсказок и новые инструменты для разработчиков. Claude Sonnet 4.5 от Anthropic — целевое обновление, ориентированное на кодирование, агентные рабочие процессы и длительные задачи с интенсивным использованием инструментов. Оба шага продвигают агентные возможности и улучшенную безопасность, но они делают разные компромиссы в ценообразовании, эргономике и в том, как предлагают «мышление» (thinking) по сравнению с «действием» (doing)...
1 месяц назад
GPT-5.1 замечен: каким он будет и когда выйдет
К концу 2025 года конкуренция между моделями искусственного интеллекта значительно усилится. Предстоящие релизы GPT-5.1 и Gemini 3.0 Pro несомненно находятся в центре внимания. Эти готовящиеся релизы служат не только сигналом конкуренции, но и маркетинговым ходом компаний, стремящихся заранее захватить долю рынка. Gemini 3.0 уже опубликовал кодовые сигналы на Vertex — gemini-3-pro-preview-11-2025, что указывает на частичную доступность модели (см. Как начать работу с Gemini 3 Pro Preview). Теперь посмотрим, что принесёт разработчикам GPT-5.1. В последние дни появилось множество мелких, но устойчивых...
1 месяц назад
Nano Banana vs Midjourney — на какой ИИ для генерации изображений стоит сделать ставку в 2025 году?
ИИ-генерация изображений всего за три года прошла путь от любопытного развлечения до основного инструмента для креативных индустрий. Сегодня два имени встречаются повсюду — Nano Banana (так в сообществе называют семейство моделей Gemini 2.5 Flash Image от Google) и Midjourney. Обе платформы нацелены на схожую аудиторию — дизайнеров, маркетологов, агентства, разработчиков, — но строятся на разных технических и бизнес-подходах. Ниже приведено практическое техническое сравнение, которое поможет выбрать правильный инструмент под ваш проект. Nano Banana — это популярное неофициальное название модели Gemini 2...
1 месяц назад
Как использовать Sora 2 без водяных знаков — Полное руководство
OpenAI’s Sora 2 — its latest video-and-audio generative model — arrived this fall as a major step forward in photorealistic video generation and synchronized audio. From day one the product architecture has included visible watermarks plus embedded provenance metadata intended to signal “this was AI-generated.” After many attempts, I finally found a reliable method to create watermark-free videos without affecting video quality or violating any regulations. The simplest way to avoid watermarks is to generate videos on a third-party platform that integrates the Sora 2 API, such as CometAPI. Videos...
1 месяц назад
Может ли GPT-5 теперь справляться с проблемами психического здоровья? Последние новости!
В октябрьском обновлении OpenAI сообщила, что примерно 0,15% еженедельных активных пользователей ведут беседы, содержащие явные признаки возможного планирования самоубийства или намерений. При огромной пользовательской базе ChatGPT это означает, что более миллиона человек в неделю обсуждают темы, связанные с суицидом. Этот факт вновь поднимает острый вопрос: может ли крупная языковая модель безопасно и эффективно реагировать, когда пользователи обращаются к ней с серьёзными психическими проблемами — психозом, манией, суицидальными мыслями или глубокой эмоциональной зависимостью от ИИ? Обновление...
1 месяц назад