Ринат Шакиров / Нейросети / ChatGPT / Midjourney

xAI представила Grok Voice Think Fast 1.0, голосовую модель, заточенную под сложные многоэтапные сценарии, где важны одновременно и быстрый ответ, и точность. Модель заняла первое место в Tau Voice Bench, одном из ключевых бенчмарков для голосовых систем. По словам разработчиков, она лучше любой другой модели на рынке справляется с реальными условиями разговора, фоновым шумом, акцентами и перебиваниями собеседника...

29 минут назад

Вышел DeepSeek-V4

DeepSeek представили новую версию своей модели V4 в двух вариантах: Pro и Flash. Обе модели теперь открыты и доступны через API с поддержкой контекстного окна в 1 миллион токенов. — DeepSeek-V4-Pro: 1.6 триллиона параметров всего, 49 миллиардов активных. По заявлениям разработчиков конкурирует с топовыми закрытыми моделями, в знаниях о мире уступает только Gemini-3.1-Pro, а в математике, STEM и коде обходит все открытые модели. — DeepSeek-V4-Flash: 284 миллиарда параметров всего, 13 миллиардов активных...

2 часа назад

OpenAI выпустили GPT-5.5: фокус на системное планирование и агентную работу

OpenAI анонсировала GPT-5.5. Модель перешла от простого предсказания текста к архитектуре глубоких рассуждений, что позволяет ей решать задачи как автономный агент. Во всех тестах обошла Claude Opus 4.7. Детали: — Окно в 256 тысяч токенов позволяет анализировать длинные видео и тяжелые репозитории кода. — На SWE-bench Verified модель решает 48.7% задач с GitHub, обходя предыдущие версии...

13 часов назад

Kling запустил генерацию видео в 4K

Вот это прям хорошо. Конечно мы понимаем, что это сделано не для динамичных сцен, а статичных и красивых кадров, но сама возможность уже крутая. 4К режим теперь доступен в серии Video 3.0, Разработан для больших экранов и высококачественного производства, с сильной визуальной согласованностью по предметам, текстам, стилю и освещению. Элементы, первый и последний кадр, многократные подсказки, поддержка нативного аудио, все поддерживает. В честь этого запускают конкурс на лучший короткометражный фильм...

15 часов назад

Xiaomi MiMo-V2.5: новая серия опенсорс агентов от Xiaomi на уровне Claude Opus и GPT-5

Xiaomi представила MiMo-V2.5, серию открытых моделей с акцентом на автономную работу агентов и решение сложных инженерных задач. Старшая версия MiMo-V2.5-Pro в тестах SWE-bench Pro и Claw-Eval показывает результаты на уровне топовых моделей вроде Claude Opus 4.6. Модели: — MiMo-V2.5-Pro: модель для длинных цепочек действий. Она способна автономно выполнять задачи, требующие более 1000 последовательных вызовов различных инструментов. В тестах на разработку ПО (SWE-bench Pro) модель набрала 57.2 балла...

17 часов назад

Создаем карточки товара в GPT Image 2

Примеры промптов: Создай с этой компьютерной мышью рекламный постер мыши (карточка товара для Wildberries или Ozon). Сверху должен быть большой заголовок с надписью "КОМПЬЮТЕРНАЯ МЫШЬ", шрифт должен быть жёстким, с острыми немного отрезанными углами. Под заголовком на плашке должен быть подзаголовок: "ИДЕАЛЬНЫЙ КОНТРОЛЬ НА РАБОЧЕМ МЕСТЕ". Рядом с мышью должна быть наклейка с надписью "ERGONOMIC DESIGN", а на плашке логотипы совместимых систем: Windows, MacOS, Linux, ChromeOS. Сам товар менять нельзя,...

20 часов назад

150 нейросетей с оплатой от 1 рубля без подписок

Если вы ищете удобный и недорогой сервис для работы с нейросетями, Братуха.ру станет отличным помощников в вашей работе. Внутри доступно более 150 нейросетей, включая актуальные модели для генерации текста, кода и изображений. Счет пополняется в рублях на любую сумму от 1 рубля, и этот баланс остается на аккаунте навсегда. Ценовая политика на текущий момент является одной из самых низких на рынке...

23 часа назад

Kimi K2.6 Agent Swarm: новый стандарт автономных ИИ-систем

Kimi K2.6 Agent Swarm — это система, которая управляет целым отрядом под-агентов для решения задач, недоступных обычным чат-ботам. Детали: — Количество параллельных под-агентов увеличено со 100 до 300. Лимит шагов в рамках одного запуска вырос с 1500 до 4000. Это позволяет системе дольше и глубже работать над сложными процессами без вмешательства человека. — Результатом работы Kimi K2.6 теперь являются готовые файлы, а не просто сообщения в чате. За один цикл система способна выдать более 100 файлов, включая литературные обзоры объемом в 100 000 слов или базы данных на 20 000 строк. — Разные агенты внутри одной группы могут выполнять задачи разного типа одновременно...

1 день назад

Xiaomi научила ИИ копировать ваш голос по трёхсекундной записи

Xiaomi выпустила OmniVoice, открытую модель, которая клонирует голос по 3 секундам записи. OmniVoice поддерживает 600 языков (русский есть в списке). Голос переносится на любой из них с сохранением тембра и интонации оригинала. Скорость генерации в 40 раз выше реального времени, это достигается за счет объединения нескольких этапов обработки в один...

1 день назад

Новый уровень автоматизации: OpenAI запускает рабочих агентов в ChatGPT

OpenAI представила рабочих агентов (workspace agents). Это новый формат использования ChatGPT для командной работы. Если раньше нейросеть была просто продвинутым собеседником, то теперь она превращается в полноценного виртуального сотрудника, который может выполнять длительные и сложные задачи автономно. Вы ставите задачу, закрываете ноутбук, а агент продолжает работать в облаке. Ключевые возможности: — Автономность: агент сам разбивает сложную цель на шаги, ищет информацию, пишет код и проверяет результат. — Интеграция с инструментами: ИИ может взаимодействовать с внешними сервисами, такими...

1 день назад

Luma представила функцию Luma Agents

Luma Agents автоматизирует создание видеороликов и презентаций из исходных файлов. Закидываешь клипы, фото, PDF, аудио или логотипы, пишешь одно предложение с описанием, дальше агент работает сам: монтирует нарезку, добавляет звук, накладывает оверлеи, встраивает брендинг, собирает слайды и запечатывает PDF. Работа строится через текстовые запросы: достаточно написать одно предложение с описанием задачи. Агенты самостоятельно монтируют...

1 день назад

Google открывает новые возможности для разработчиков: AI Studio теперь мощнее и доступнее

Google обновил AI Studio, которая позволяет быстро создавать и тестировать приложения на базе ИИ из семейства Gemini. Теперь подписчики Google AI Pro и Ultra получают расширенные лимиты и доступ к мощным моделям прямо в AI Studio. Это позволяет быстро переходить от идеи к работающему прототипу без сложной настройки оплаты за API. В студии доступны модели Nano Banana Pro и Gemini Pro, которые показывают высокую производительность при генерации текста, кода, изображений и других типов контента. Для тех, кто уже исчерпал бесплатные лимиты, подписка становится удобным мостом к платёжной инфраструктуре, с которой можно продолжить работу напрямую через API при переходе к продакшн‑проектам...

1 день назад

12:25