Найти в Дзене
🔬 Теренс Тао: ИИ обнуляет стоимость генерации идей, превращая верификацию в главное «бутылочное горлышко
» Стоимость генерации гипотез стремится к нулю, но теперь мы тонем в океане непроверенных теорий. Легендарный математик Теренс Тао сравнивает влияние ИИ на науку с появлением автомобилей: технология есть, но старые «дороги» не справляются с трафиком. Главная проблема сегодня — верификация. ИИ может выдать тысячи вариантов решения задачи, но проверка каждого из них вручную занимает столько же времени, сколько и раньше. По мнению Тао, это полностью меняет роль ученого и инженера: теперь критически важным навыком становится не поиск идеи, а проектирование ворклоу для её автоматической проверки...
3 часа назад
⚡⚡ Xiaomi MiMo: ИИ-агенты с 1T параметров и демпинг цен в 5 раз дешевле Claude
Xiaomi представила линейку моделей MiMo, нацеленную на создание автономных агентов и управление роботами. Флагманская MiMo-V2-Pro построена на архитектуре MoE (Mixture of Experts — модель активирует только нужные нейроны для экономии ресурсов) с общим весом более 1 триллиона параметров, из которых 42B активны при каждом запросе. Благодаря гибридному механизму внимания модель поддерживает контекст до 1 миллиона токенов и генерирует несколько токенов одновременно, что значительно ускоряет инференс...
5 часов назад
🚀 SuperML — плагин, превращающий Claude Code и Cursor в полноценных ML-инженеров
Теперь можно делегировать сложные задачи машинного обучения обычному кодинг-агенту. Проект SuperML расширяет возможности таких инструментов, как Claude Code и Cursor, добавляя им специфические навыки ML-инжиниринга через протокол MCP (Model Context Protocol — открытый стандарт для подключения инструментов к LLM). Главная фишка — доступ к Leeroopedia, курируемой базе знаний по AI/ML. Вместо того чтобы галлюцинировать или использовать устаревшие методы из обучающей выборки, агент обращается к актуальной документации и лучшим практикам...
9 часов назад
🚀 AstrBot — мощный open-source фреймворк для создания AI-агентов в Telegram, Discord и Slack
Превратить любую LLM в автономного агента для мессенджеров теперь можно через единую инфраструктуру. AstrBot — это open-source альтернатива OpenClaw, которая объединяет десятки платформ (Telegram, Discord, WeChat, QQ) и провайдеров моделей в одном месте. Главная фишка — Agentic infrastructure. Это не просто чат-бот, а полноценный каркас с поддержкой плагинов и MCP (Model Context Protocol — открытый стандарт для подключения инструментов к LLM). Вы можете дать боту доступ к своим API, базе знаний...
10 часов назад
🛠🚀 Prompt Master — скилл для Claude, который пишет идеальные промпты с первого раза
Больше никаких пустых трат токенов на уточняющие запросы. Prompt Master — это специализированный навык для Claude, который превращает ваши размытые идеи в структурированные инструкции для любых LLM. Вместо того чтобы пробовать 4-5 раз, пока модель не «поймет», вы получаете рабочий промпт сразу. Инструмент использует глубокий фреймворк из 8 техник промпт-инжиниринга. Каждый сгенерированный запрос включает в себя Capacity (роль), Insight (контекст), Statement (задачу) и даже Personality (тон ответа)...
11 часов назад
🔬 Разделяй и властвуй: новый Трансформер дает математике «время на раздумья», а фактам — память
Исследователи из Боннского университета и института Lamarr представили архитектуру, которая решает главную проблему современных LLM: попытку решать сложные логические задачи и вспоминать факты одними и теми же механизмами. Теперь модель сама решает, сколько «времени на раздумья» ей нужно потратить на каждый слой, используя адаптивные циклы (adaptive looping). В обычном трансформере данные проходят через слои один раз. В новой архитектуре каждый блок может прокручивать вычисления внутри себя до 7 раз...
12 часов назад
🔓🚀 PuLID Flux2: Идеальная консистентность лиц для FLUX.2 Klein и Dev без дообучения
Теперь можно переносить лицо конкретного человека на генерации FLUX.2 с высокой точностью, не создавая отдельные LoRA-модели. PuLID-Flux2 — это нативные веса для метода PuLID (Pure and Lightning Identity Preservation), который внедряет признаки лица через блоки трансформера, сохраняя при этом гибкость текстового промпта. В отличие от классических методов, PuLID использует EVA-CLIP для извлечения визуальных фич и InsightFace для эмбеддингов лиц. Это позволяет избежать «замыливания» текстур и артефактов, характерных для ранних адаптеров...
16 часов назад
🔬⚡ Mamba3 + Gated Attention: экспериментальный гибрид на 190M параметров бросает вызов трансформерам
Пока индустрия масштабирует гигантов, энтузиасты проверяют эффективность Mamba3 — третьего поколения архитектуры SSM (State Space Models — модели, где вычислительная сложность растет линейно, а не квадратично от длины контекста). Модель Mamba3-Gated-Attention-190m объединяет сильные стороны селективного сканирования и механизмов внимания, пытаясь выжать максимум из крошечного веса. Главная фишка этого гибрида — использование Gated Attention вместе с обновленным блоком Mamba3. Это позволяет модели...
17 часов назад
🤖 Wolfcha — опенсорсная «Мафия», где DeepSeek, Qwen и Gemini блефуют друг против друга
Теперь можно устроить цифровую психологическую битву, столкнув лбами топовые LLM в классической игре «Оборотень» (Werewolf/Мафия). Проект Wolfcha — это полноценный симулятор социальной дедукции, где каждый игрок управляется отдельным AI-агентом. Суть в том, что модели не просто выдают текст, а полноценно отыгрывают роли: DeepSeek может пытаться вычислить предателя по логам, а Gemini — убедительно врать, будучи «волком». Это отличный полигон для тестирования multi-agent систем: как модели кооперируются, распознают ложь и меняют стратегию в зависимости от поведения других...
18 часов назад
🔬 Генеративные видеомодели «понимают» 3D-пространство лучше, чем специализированные нейронки
Видеодиффузионные модели скрыто обучаются законам физики и геометрии, чтобы генерировать связные ролики. Исследователи представили фреймворк VEGA-3D, который доказывает: замороженная видеомодель может служить идеальным «симулятором мира» для обучения MLLM (мультимодальных больших языковых моделей) без использования реальных 3D-данных. Проблема современных ИИ-помощников в «пространственной слепоте» — они отлично описывают картинку словами, но путаются в глубине объектов и их расположении. Вместо того чтобы скармливать модели дефицитные 3D-сканы, авторы просто вытащили пространственно-временные признаки из промежуточных слоев диффузии...
19 часов назад
🛠 LLM с детектором лжи: как внедрить оценку уверенности и авто-поиск в вебе
Главная проблема современных LLM — галлюцинации, подаваемые с максимально уверенным видом. Решить это можно через создание Uncertainty-Aware систем, которые умеют оценивать собственную неуверенность и вовремя уходить в поиск. Суть метода в трехступенчатом цикле. Сначала модель генерирует ответ и проводит Confidence Estimation (оценку уверенности). Если показатель ниже порога, включается Self-Evaluation: модель критикует собственный вывод, ища логические нестыковки. Если сомнения остаются, система...
19 часов назад
⚡⚡ Leanstral — первый open-source агент от Mistral для Lean 4: математические доказательства и верификация кода
Leanstral — это специализированный AI-агент, созданный для работы с Lean 4 (язык программирования и интерактивный доказыватель теорем). Если раньше формальная верификация сложных математических объектов или свойств Rust-кода требовала участия экспертов и дорогих проприетарных моделей, то теперь это доступно в open-source под лицензией Apache 2.0. В основе лежит архитектура MoE (Mixture of Experts) на 119B параметров, где на каждый токен активируются всего 6.5B параметров (4 эксперта из 128). Это...
19 часов назад