Найти в Дзене
🤝 OpenAI покупает стартап Statsig за $1.1 млрд
🤝 OpenAI покупает стартап Statsig за $1.1 млрд 📌 Что делает Statsig: Инструменты для A/B-тестов и аналитики → можно сравнивать версии продукта, смотреть поведение пользователей и быстро выкатывать/откатывать изменения. ⚡ Зачем OpenAI: Теперь они смогут тестировать LLM-фичи (промпты, фильтры, задержки, цену) на реальных данных и управлять обновлениями автоматически. 👥 Основатель Виджай Раджи станет CTO приложений в OpenAI...
45 минут назад
🧠 Новый шаг к мозгу на чипе
🧠 Новый шаг к мозгу на чипе Учёные из Stanford, Sandia National Labs и Purdue создали искусственные нейроны, которые могут передавать и электрические, и световые сигналы одновременно — так же, как это делают настоящие клетки мозга. ⚡ В мозге нейроны общаются короткими электрическими импульсами. Большинство нейроморфных чипов копируют только это. 💡 Но на дальние расстояния куда эффективнее работает свет. 🔬 Новые электро-оптические нейроны из диоксида ниобия решают этот разрыв:...
9 часов назад
🆕 Исследование: LLM могут находить правильный ответ ещё до конца генерации
🆕 Исследование: LLM могут находить правильный ответ ещё до конца генерации. На GSM8K — до 97% задач, на MMLU — до 99% ответов верны уже на середине шагов. Метод Prophet позволяет остановить генерацию раньше и ускорить модель в 3.4 раза без потери качества. 💡 Как работает Prophet: 1...
11 часов назад
⚡️ Tencent дропнули Hunyuan-MT — мощные open-source модели для перевода
⚡️ Tencent дропнули Hunyuan-MT — мощные open-source модели для перевода Что внутри: - Доступны модели Hunyuan-MT-7B и Hunyuan-MT-Chimera-7B - Поддержка 33 языков - Chimera-7B — это первая d индустрии откртытая ансамблевая модель 🏆 Результаты: - 1-е место в 30 из 31 категорий на международном конкурсе WMT25 (Workshop on Machine Translation 2025, крупнейшая в мире конференция-соревнование...
1 день назад
🌟 Google Labs запустила инструмент для структурированной оценки языковых моделей
🌟 Google Labs запустила инструмент для структурированной оценки языковых моделей. Stax - экспериментальный инструмент для разработчиков, который предлагает замену неформальному «вайб-тестингу» больших языковых моделей на структурированный, основанный на данных подход. Stax оценивает модели на кастомных или готовых автоматизированных оценщиках, фокусируясь на метриках: беглость ответа, безопасность, задержка и процент успешного прохождения ручной проверки...
2 дня назад
Главное новости ИИ
Главное новости ИИ ✔ Следующая модель семейства LLama выйдет к концу этого года. Разработкой занимается новое подразделение компании Марка Цукерберга Superintelligence Labs. Модель, которую некоторые внутри компании называют Llama 4.5, должна исправить недостатки предыдущих версий: слабую производительность в кодинге и логических рассуждениях. Параллельно команда работает над исправлением ошибок в уже выпущенных версиях Llama 4 и фоном допиливает флагманскую модель "Behemoth". businessinsider.com (https://www.businessinsider.com/meta-superintelligence-lab-llama-4-new-model-launch-year-end-2025-8) ✔ Apple опубликовала семейство моделей FastVLM...
3 дня назад
🚀 Grok Code Fast 1 — новая модель от xAI, быстрый и недорогой кодер-агент
🚀 Grok Code Fast 1 — новая модель от xAI, быстрый и недорогой кодер-агент. Новая модель для повседневных задач программирования с упором на agentic-coding (циклы рассуждений + вызовы инструментов: grep, терминал, редактирование файлов). Обучена на огромном кодовом корпусе и дообучена на реальных PR/задачах. 🙌 Модель уже доступна бесплатно на популярных платформах: GitHub Copilot, Cursor, Cline, Kilo Code, Roo Code, opencode и Windsurf. Контекст 256k токенов, лимиты: до 2M токенов в минуту и 480 запросов в минуту...
5 дней назад
📌 Andreessen Horowitz выпустили пятый рейтинг TOP 100 ИИ-приложений
📌 Andreessen Horowitz выпустили пятый рейтинг TOP 100 ИИ-приложений. Главный вывод из пятого ежегодного списка Top 100 AI Apps — экосистема ИИ начинает приходить в равновесие. В веб-рейтинге появилось всего 11 новых имен, что заметно меньше, чем было мартовском отчете. В мобильном сегменте, напротив, новичков больше — целых 14, но это связано с тем, что App Store активно вычищают "клонов ChatGPT", освобождая место для оригинальных приложений. 🟡Главным событием стало укрепление позиций Google...
5 дней назад
🌟 MiniCPM-V 4.5: компактная модель, которая бьет гигантов в мультимодальном ИИ
🌟 MiniCPM-V 4.5: компактная модель, которая бьет гигантов в мультимодальном ИИ. Проект OpenBMB выпустил MiniCPM-V 4.5, мультимодальную модель на основе Qwen3-8B и SigLIP2-400M для распознавания изображений, серий изображений и видео, которая может работать на мобильных устройствах на более чем 30 языках. OpenBMB - некоммерческое подразделение китайской технологической компании ModelBest, под патронажем Университета Цинхуа. Среди инвесторов материнской ModelBest - Habo (Huawei), Primavera Capital Group и государственный Shenzhen Guozhong Venture Capital Management...
6 дней назад
Google все таки стояли за Nano Banana и намается она теперь Gemini Native Image
Google все таки стояли за Nano Banana и намается она теперь Gemini Native Image. Эта модель для редактирования изображений- мощный коктейль из Photoshop, Figma и MidJourney! Gemini Native Image — качество редактирования Которое не имеет аналогов. Что он умеет? Попробуйте, она стоит вашего времени: • Заменяет объекты на фото, сохраняя остальное — без артефактов и искажений...
1 неделю назад
🚀 NVIDIA ускорила LLM в 53 раза
🚀 NVIDIA ускорила LLM в 53 раза 🤯 Представь: твой бюджет на инференс снижается на 98%, а точность остаётся на уровне лучших моделей. 📌 Как это работает: Метод называется Post Neural Architecture Search (PostNAS) — революционный подход к «апгрейду» уже обученных моделей. Freeze the Knowledge — берём мощную модель (например, Qwen2.5) и «замораживаем» её MLP-слои, сохраняя интеллект. Surgical Replacement — заменяем большую часть медленных O(n²) attention-слоёв на новый супер-эффективный дизайн JetBlock с линейным вниманием...
1 неделю назад
🚀 Новый метод для LLM показал невероятный результат — 99.9% на AIME 2025 с открытыми моделями
🚀 Новый метод для LLM показал невероятный результат — 99.9% на AIME 2025 с открытыми моделями! Метод называется DeepConf. Его суть — модель сама оценивает, насколько уверена в каждом токене, и отбрасывает слабые рассуждения ещё во время генерации. 📌 В чём отличие от классики Обычно точность повышают через «параллельное мышление»: генерируют сотни версий ответа и берут то, за что проголосовало большинство. Это работает, но тратит кучу токенов и даёт всё меньший прирост. DeepConf вместо этого:...
1 неделю назад