Машинное обучение

⚡️ ChatGPT 5.2 "Code Red" выйдет 9 декабря

⚡️ ChatGPT 5.2 "Code Red" выйдет 9 декабря. The Verge пишет, что по информации инсайдеров, OpenAI планирует представить обновление уже в начале следующей недели, ориентировочно 9 декабря. Ожидается, что GPT-5...

11 часов назад

🌟 CUDA-L2: ИИ научился писать CUDA-ядра эффективнее инженеров NVIDIA

🌟 CUDA-L2: ИИ научился писать CUDA-ядра эффективнее инженеров NVIDIA. Исследовательская группа DeepReinforce разработала систему полностью автоматического написания GPU-кода для матричного умножения под названием CUDA-L2. Этот код работает на 10–30% быстрее, чем cuBLAS и cuBLASLt, а это, на минуточку, уже оптимизированные библиотеки от самой NVIDIA. Обычно такие библиотеки создаются вручную людьми, которые используют готовые шаблоны ядер. А автотюнеры лишь подкручивают параметры, например, размер тайлов...

13 часов назад

⚡️ Tencent официально представила HY 2.0 - крупное обновление своей базовой модели

⚡️ Tencent официально представила HY 2.0 - крупное обновление своей базовой модели. Модель построена на архитектуре Mixture of Experts с общим размером 406B параметров и 32B активных. Модель поддерживает контекст 256K токенов. HY 2.0 демонстрирует заметные улучшения на ключевых бенчмарках. Главные достижения HY 2.0: 🧠 Reasoning: результат 73.4 на IMO AnswerBench - почти плюс 20 процентов, что закрепляет модель среди лидеров по математическому и научному мышлению. 🛠 Coding и Agents: скачок в SWE Bench Verified с 6...

13 часов назад

🙂 Эволюция text-to-video

🙂 Эволюция text-to-video. Чуть меньше 3-х лет прошло между этими генерациями Уилла Смита, поедающего спагетти. Слева - ролик, созданный в феврале 2023 года пользователем Reddit chaindrop на модели ModelScope text2video. он так ее назвал в комментариях Справа - современная генерация на свежем Kling 2...

1 день назад

📌 LiDAR: глаза беспилотников

📌 LiDAR: глаза беспилотников. Лонгрид материала от Main Street Autonomy, о том, как лидары видят мир, почему они прожигают камеры смартфонов и где маркетологи нас обманывают. 🟡Что делает LiDAR? В отличие от обычной камеры, которая фиксирует интенсивность света, лидар - это активный сенсор. Он отправляет свет и ловит его отражение. Его цель - измерить расстояние и направление. В результате получается облако точек, где каждая точка - это точное положение объекта в пространстве. Камеры дают разрешение и цвет, а лидары - точную геометрию...

2 дня назад

🔭 Вышло огромное исследование на 303 страницы от ведущих китайских лабораторий — подробный разбор того, как создают и обучают модели

🔭 Вышло огромное исследование на 303 страницы от ведущих китайских лабораторий — подробный разбор того, как создают и обучают модели, ориентированные на написание кода, и как на их основе строят полноценные софт-агенты. Вот что в нём разбирается: 1. Как формируют модель - Сбор и очистка гигантских датасетов кода. - Предобучение: модель впитывает реальные паттерны программирования в промышленных масштабах. - SFT и RL: дополнительные этапы, где модель учат лучше следовать инструкциям, проходить тесты и избегать очевидных ошибок...

2 дня назад

Главные новости и мира ИИ и МЛ

Главные новости и мира ИИ и МЛ. ✔️ OpenAI придумала, как заставить модель сообщать о своих галлюцинациях. OpenAI опубликовала исследование новой техники Confessions. Метод решает проблему, когда модели пытаются обмануть систему оценки^ используют reward hacking или выдают уверенные, но ложные факты ради получения высокого балла. Суть - в генерации вторичного ответа. После выдачи результата модель формирует отдельный отчет, где анализирует свое поведение на предмет соответствия инструкциям и получает награду за точное описание своих ошибок, даже если в основном ответе она соврала или нарушила правила...

2 дня назад

✔️ OpenAI нашла способ заставить модели признаваться в собственных галлюцинациях — в новом исследовании представили технику под названием

✔️ OpenAI нашла способ заставить модели признаваться в собственных галлюцинациях — в новом исследовании представили технику под названием Confessions. Проблема, которую пытаются решить: модели нередко стремятся «угодить» системе оценки — выдают уверенные, но неверные факты, скрывают нарушения инструкций или занимаются reward hacking, чтобы получить более высокий балл. Как работает Confessions: 1. Модель сначала генерирует обычный ответ. 2. Затем формирует второй, независимый отчёт, в котором сама...

2 дня назад

Главные новости ИИ и МЛ

Главные новости ИИ и МЛ! ✔️ Anthropic покупает создателей скоростного JavaScript-рантайма. Компания объявила о приобретении Bun — популярного инструментария для запуска и сборки JavaScript-приложений. Технологии и команда стартапа станут фундаментом для дальнейшего масштабирования платформы Claude Code. Bun, основанный Джаредом Самнером в 2021 году, завоевал популярность как экстремально быстрая альтернатива Node.js, объединяющая в себе рантайм, пакетный менеджер, бандлер и тестовый раннер. Bun останется опенсорсным проектом под лицензией MIT. Anthropic обещает продолжить инвестировать в инструмент, сохраняя его статус независимого и универсального решения для JS/TS-экосистемы...

3 дня назад

⚡️ OpenAI вводит «code red»: новый reasoning-модель уже на следующей неделе

⚡️ OpenAI вводит «code red»: новый reasoning-модель уже на следующей неделе OpenAI объявила внутренний «code red» - компания временно перераспределяет людей и мощности, чтобы сфокусироваться на усилении ChatGPT на фоне растущей конкуренции со стороны Google и других игроков. Главное: • Новый reasoning-модель выходит уже на следующей неделе — по внутренним тестам она обгоняет Google Gemini 3 и станет основой для Thinking Mode и Deep Research. • Приоритет — качество продукта, а не монетизация: рекламные...

4 дня назад

📌NVIDIA на NeurIPS 2025

📌NVIDIA на NeurIPS 2025. NVIDIA анонсировала, о чем расскажет на конференции NeurIPS, которая началась сегодня и пройдет до 7 декабря в Сан-Диего. 🟡Автономный транспорт. NVIDIA DRIVE Alpamayo-R1, или сокращенно AR1. Это первая в мире открытая ризонинг-VLA модель специально для исследований в области автопилотов. Модель построена на базе NVIDIA Cosmos Reason и отлично поддается дообучению с помощью RL. Alpamayo-R1 будет доступна на GitHub и Hugging Face, а фреймворк AlpaSim для тестов уже опубликован...

4 дня назад

🐋 DeepSeek выкатили не «ещё одну модель», а полноценную топ-систему уровня IMO/IOI/ICPC - при этом обучение и генерация стоят в десятки раз

🐋 DeepSeek выкатили не «ещё одну модель», а полноценную топ-систему уровня IMO/IOI/ICPC - при этом обучение и генерация стоят в десятки раз дешевле, чем у GPT-5 и Gemini 3 Pro. Главное: • DeepSeek-V3.2-Speciale обгоняет Gemini 3.0 Pro в математике и коде • Новая флагманская модель совмещает рассуждения + агентность • Архитектура MoE из семейства V3.1 Terminus, контекст 128k • Главное нововведение — DeepSeek Sparse Attention (DSA), сделанный ради дешёвого длинного контекста Что делает DSA Обычное внимание - O(T²), что больно при 128k токенов...

4 дня назад

07:38