Найти в Дзене
Полный стек ИИ: объяснение от эксперта Google
⚡ DeepDigest.ru Google AI Blog · 29 Jun 2026 29 июня 2026 г. Эксперт Google Ричард Серотер, который руководит разработчиками в Google Cloud, рассказал, что значит использовать комплексный подход к ИИ и почему он долгое время был основой работы компании в этой сфере. Подход к ИИ с использованием «полного стека» объединяет все уровни технологий — от аппаратного обеспечения и моделей до пользовательских интерфейсов — в единую систему...
9 часов назад
TruEye: новый способ выявить поддельные изображения с людьми
⚡ DeepDigest.ru arXiv cs.CV · 29 Jun 2026 Джей Барот и Дэн Лин представили модель TruEye — она умеет детально обнаруживать и определять местоположение людей и сцен на изображениях, созданных с помощью ИИ. В отличие от существующих детекторов, TruEye разделяет контент на пять категорий, в том числе выявляет сложные случаи, когда реального человека помещают в сцену, где он никогда не был...
9 часов назад
Динамические субагенты в Deep Agents: новая схема работы
⚡ DeepDigest.ru LangChain Blog · 29 Jun 2026 Архитектура глубинных агентов с открытым исходным кодом (Deep Agents) включает механизм динамических субагентов — он помогает справляться с масштабными задачами и управлением контекстом. Вместо того чтобы напрямую вызывать субагентов через универсальные инструменты, агент составляет короткий скрипт, который организует их работу и запускает в упрощённом интерпретаторе...
9 часов назад
Новый метод сделает планирование в LLM надёжнее
⚡ DeepDigest.ru arXiv cs.AI · 29 Jun 2026 Исследователи предложили систему, которая поможет большим языковым моделям (LLM) эффективнее планировать действия в долгосрочной перспективе. Система включает механизм подсказок на естественном языке — он помогает LLM лучше понимать ограничения и суть задачи. Также в системе есть символьный верификатор: он находит ошибки и превращает их в инструкции для исправления...
9 часов назад
ToE: новая система борьбы с фейковыми новостями
⚡ DeepDigest.ru arXiv cs.AI · 29 Jun 2026 Авторы предложили систему ToE («Дерево доказательств») для автоматической проверки фактов. Она моделирует каждое утверждение в виде динамически расширяющегося дерева аргументов. В системе есть агент поиска данных из нескольких источников (управляемый обучением с подкреплением), агент оценки доказательств и алгоритм агрегации дерева аргументов...
12 часов назад
MER-R1: новая система распознаёт эмоции с помощью «медленного» и «быстрого» мышления
⚡ DeepDigest.ru arXiv cs.AI · 29 Jun 2026 Исследователи разработали систему MER-R1, которая объединяет два типа мышления — «быстрое» (даёт прямые ответы) и «медленное» (обеспечивает точность за счёт тщательного анализа) — для распознавания мультимодальных эмоций. «Быстрое» мышление помогает лучше запоминать информацию, а «медленное» — точнее отсеивать неверные варианты...
12 часов назад
Prism Transformer: новый подход к обработке внимания в ИИ
⚡ DeepDigest.ru arXiv cs.LG · 29 Jun 2026 Исследователь Шубхам Аггарвал представил новую архитектуру — Prism Transformer. В отличие от традиционных систем Multi-head attention, где ресурсы распределяются равномерно между всеми «головками» на каждом уровне модели, Prism Transformer использует прогрессивное распределение: на ранних слоях применяется меньше широких «головок» для выявления локальных паттернов, а на глубоких — множество узких «головок» для анализа специализированных лингвистических элементов...
13 часов назад
Новый тест DMV-Bench: как проверить зрительную память ИИ-агентов
⚡ DeepDigest.ru arXiv cs.CV · 29 Jun 2026 Исследователи разработали DMV-Bench — первый интерактивный тест для оценки зрительной памяти мультимодальных агентов. Тест работает на основе каталога из 1000 товаров для дома: агент посещает изображения товаров, запоминает уникальную информацию и позже должен вспомнить конкретный товар и перейти по его URL...
13 часов назад
ReWorld: новый подход к обучению моделей автономного вождения
⚡ DeepDigest.ru arXiv cs.CV · 29 Jun 2026 Исследователи представили платформу ReWorld для обучения представлений в моделях действий в мире (WAMs), которые используются в автономном вождении. Особенность ReWorld в том, что она напрямую оптимизирует промежуточные представления — те, что содержат знания о мире, — а не только выходные данные моделей. Платформа работает в двух направлениях:...
13 часов назад
Новый трансформатор: быстрее и эффективнее стандартных моделей
⚡ DeepDigest.ru arXiv cs.CL · 29 Jun 2026 Махеш Годаварти представил новую архитектуру нейронной сети — context-ready transformer. В отличие от стандартных трансформаторов, эта модель предварительно контекстуализирует каждый элемент текста (токен) перед его обработкой. Во время генерации текста сеть объединяет данные о прошлом контексте с текущим токеном — благодаря этому токен попадает в блок уже «подготовленным»...
13 часов назад
EntMTP: новый способ ускорить работу больших языковых моделей
⚡ DeepDigest.ru arXiv cs.CL · 29 Jun 2026 Кэрри Чен предложила метод EntMTP для ускорения логического вывода в больших языковых моделях (LLM). Суть метода — в использовании многотокенного прогнозирования с учётом энтропии: планировщик автоматически переключается между разными схемами работы (топологиями внимания) в зависимости от того, насколько предсказуем текущий фрагмент текста...
13 часов назад
NVIDIA ENPIRE и ARGUS от Tencent: самосовершенствование роботов и обучение ИИ
⚡ DeepDigest.ru Import AI · 29 Jun 2026 Исследователи из NVIDIA разработали программное обеспечение ENPIRE — комплексную платформу для кодирования агентов, которая позволяет физической робототехнике проводить автономные эксперименты и проходить цикл выполнения, аналогичный тому, что используют ИИ-агенты. ENPIRE включает четыре основных модуля: модуль среды (EN) для автоматического сброса и проверки,...
13 часов назад