Найти в Дзене
🔓⚡⚡ Trinity-Mini: 26B MoE-модель от Arcee AI с 128k контекстом и FP8-оптимизацией
Arcee AI представили Trinity-Mini — компактную MoE (Mixture of Experts — модель активирует только часть параметров для каждого токена) архитектуру на 26B параметров, из которых активны всего 3B. Модель обучена на колоссальном датасете в 10 триллионов токенов и оптимизирована под сложные рассуждения и кодинг. Главная фишка этого релиза — официальный FP8-квант с поблочным скалированием. Это позволяет запускать модель практически без потери качества, но с ДЕСЯТИКРАТНЫМ преимуществом в пропускной способности на картах NVIDIA Hopper (H100/H200)...
25 минут назад
📝 Мультимодальные агенты проваливают сложные цепочки действий — новый VTC-Bench вскрыл слабые места MLLM
Современные MLLM (мультимодальные большие языковые модели) отлично справляются с простым описанием картинок, но пасуют, когда нужно использовать внешние инструменты в несколько шагов. Исследователи представили VTC-Bench — бенчмарк, который заставляет модели не просто «смотреть», а буквально собирать конвейер из 32 различных визуальных операций на базе OpenCV. В отличие от старых тестов с короткими траекториями, здесь от агентов требуют реального планирования: например, найти объект, применить к нему фильтр, вырезать фрагмент и передать результат следующему инструменту. Это имитирует работу реальных пайплайнов компьютерного зрения, где один неверный шаг рушит всю цепочку...
1 час назад
🛠💰 Внутри лаборатории Amazon Trainium: чипы, на которых работают Anthropic, Apple и теперь OpenAI
Пока весь мир стоит в очереди за чипами NVIDIA, Amazon тихой сапой выстроила вторую по силе инфраструктуру для ИИ. Сейчас развернуто уже 1.4 миллиона чипов Trainium трех поколений, и спрос на них растет быстрее, чем производство. Главный показатель успеха — тотальный переход Anthropic на это железо: модели Claude крутятся на кластере из более чем 1 миллиона чипов Trainium2. Даже OpenAI, несмотря на тесную связь с Microsoft, заключила с Amazon сделку на $50 миллиардов, чтобы получить доступ к 2 гигаваттам вычислительной мощности на базе Trainium для своего нового строителя агентов Frontier...
1 час назад
🔬 Андрей Карпати: люди стали главным тормозом в развитии ИИ и пора уходить с пути агентов
Человеческая интуиция проигрывает системному поиску: Андрей Карпати (экс-директор по ИИ в Tesla и сооснователь OpenAI) пришел к выводу, что исследователи стали «бутылочным горлышком» в областях с измеримым результатом. Карпати месяцами вручную тюнил конфиги для обучения GPT-2, но решив провести эксперимент, доверил это автономному агенту на одну ночь. Результат: агент нашел тонкие взаимозависимости параметров, которые человек просто не в состоянии отследить. Проект autoresearch показал впечатляющую...
2 часа назад
🛠🚀 M-Courtyard — локальный файн-тюнинг LLM на Mac без кода через MLX
Теперь можно дообучить нейросеть на своих данных прямо на MacBook, не касаясь Python-скриптов и терминала. M-Courtyard — это десктопное приложение на базе Tauri и React, которое превращает сложный процесс файн-тюнинга (дообучения модели на специфических данных) в понятный GUI-интерфейс. Главная фишка — полная интеграция с MLX (фреймворк от Apple для эффективных вычислений на Apple Silicon). Это позволяет использовать объединенную память (Unified Memory) чипов M1-M4 на максимум. Весь процесс разбит на 4 шага: импорт документов (PDF, DOCX, TXT), автоматическая очистка, генерация датасета через локальную Ollama и запуск обучения...
3 часа назад
Если нравится — подпишитесь
Так вы не пропустите новые публикации этого канала