Найти в Дзене
Релиз Gemini 3.1 Pro - новый уровень интеллекта моделей
Google официально представила Gemini 3.1 Pro, и результаты выглядят серьёзно: модель показала 77,1% в одном из самых сложных тестов на абстрактное мышление — ARC-AGI-2. - Резкий скачок качества Результат почти в 2 раза выше, чем у предыдущей версии - Обгоняет конкурентов Gemini 3.1 Pro опережает Opus 4.6 и GPT-5.2 в задачах на обобщение и логическое мышление - Сильнее...
7 часов назад
Клонируем любой голос за секунды — вышел Voicebox, локальная нейросеть для копирования голоса и бесплатная замена ElevenLabs
По сути это голосовой редактор без подписок: загружаете короткий отрывок — получаете полноценный клон. Возможности: — Создание копии голоса по короткому аудио; — Озвучка текста любым созданным голосом; — Сборка диалогов и подкастов из нескольких...
23 часа назад
Grok 4.20 уже доступен для всех юзеров
xAI выкатили обнову, главная её фишка — система из 4 ИИ-агентов. Все они параллельно думают, спорят друг с другом и выдают общий ответ (идея → дебаты → консенсус). Также из интересного: 🟡Контекст до 256K (обещают 2M); 🟡Может работать с текстом, изображениями и видео; 🟡Обучена на ~200K GPU...
1 день назад
Вышла опенсорс модель Qwen 3.5 от Alibaba
По бенчмаркам она показывает уровень Gemini 3 Pro, обходя GPT-5.2 и Claude Opus 4.5. И вот, что она умеет: • Автономно работать — понимает интерфейсы телефона и компьютера, сама выполняет задачи по промпту; • Обрабатывать большой объем данных — контекстное окно до 1 млн токенов; • Понимает русский язык; • Хорошо справляется с написанием кода, поиском багов...
1 день назад
Китайцы выпустили свой аналог OpenClaw, которому нужно всего 10 МБ ОЗУ! PicoClaw — это легковесный аналог самого хайпового ИИ-ассистента
последних месяцев. Он буквально умеет нажимать на кнопки за вас: • Полный контроль мессенджеров: ваш личный секретарь в Telegram и Discord, который реально разгребает завалы. • Deep Web Search: cёрфит по коду сайтов и выжимает только нужные данные без лишнего мусора. • Поддерживает любые нейронки: GPT, Gemini, Claude. • Манипуляция файлами: пишет, читает и правит конфиги на вашем диске прямо через консоль...
2 дня назад
Питер Штайнбергер (создатель OpenClaw) присоединяется к OpenAI
! Сам Альтман объявил, что Питер, которого он называет "гением с кучей крутых идей о будущем умных агентов", будет вести разработку следующего поколения персональных агентов. Это станет ключевой частью продуктов OpenAI...
3 дня назад
Вышла полноценная ИИ-студия для работы с голосом, которая работает локально на компе и БЕСПЛАТНО
MimikaStudio умеет всё: 🔅 Клонирует голос по трём секундам речи. 🔅 Генерирует речь с НУЛЯ. 🔅 Превращает PDF в аудиокниги и озвучивает любой текст. 🔅 Поддерживает 23 языка, включая русский. 🔅 30 голосов на выбор...
3 дня назад
Seedance 2.0 задает новую планку ИИ-видео
Формально это ролики с закрытого теста, но уже сейчас видно: нас ждёт прорыв. Особенно безумно выглядят боевые сцены: удары, блоки, уклонения еще и эпичные ракурсы, которые усиливают эффект. Нейронка выдает видео со звуком длительностью до 15 секунд в 2К и поддерживает русский. При этом модель принимает сразу несколько референсов...
4 дня назад
Agentic Vision в Gemini 3 Flash
Обычные модели анализируют изображения одним статичным взглядом. Если ропустили деталь - приходится гадать. А вот в Gemini появилась фича Agentic Vision, которая превращает работу с картинками в активный процесс. Модель теперь сама решает, как исследовать изображение – приближает, вращает, размечает. Как это работает? Цикл из трех шагов: • Think: анализирует запрос и картинку, строит план действий • Act: генерит и выполняет код (масштабирование, аннотации, расчеты)...
5 дней назад
MiniMax тоже сделали десктопного агента
В последнем апдейте они докрутили именно управление компом: появился Desktop App для macOS и Windows, который может фоном выполнять задачи. Также он работает с браузером. Работает с локальными файлами и приложениями, умеет сохранять результаты на диск и строить сценарии поверх почты, календарей и рабочих сервисов...
6 дней назад