Найти в Дзене
Сбер открыл веса GigaChat 3: 702B Ultra и 10B Lightning с MoE-архитектурой
Сбер опубликовал открытые веса двух MoE-моделей нового поколения: GigaChat 3 Ultra Preview (702B-A36B) и GigaChat 3 Lightning (10B-A1.8B). Модели доступны с лицензией MIT и возможностью коммерческого использования. Обе модели используют кастомную архитектуру Mixture-of-Experts с поддержкой Multi-head Latent Attention и Multi-Token Prediction. MLA сжимает KV-кэш в латентное представление, что снижает требования к памяти и ускоряет обработку длинных контекстов. MTP позволяет предсказывать несколько токенов за один проход и ускорять инференс до 40 процентов. GigaChat...
3 недели назад
Поэзия как джейлбрейк: исследователи обошли защиту 25 LLM с успехом 62%
Исследователи из Sapienza University of Rome и Sant'Anna School обнаружили, что поэтическая форма работает как универсальный метод джейлбрейка больших языковых моделей. 20 вручную созданных стихотворений с вредоносными запросами достигли средней успешности атак 62% на 25 моделях. Некоторые провайдеры показали успешность более 90%. Атаки тестировались на моделях от 9 провайдеров: Google, OpenAI, Anthropic, Deepseek, Qwen, Mistral AI, Meta*, xAI и Moonshot AI. Все атаки были строго единичными, без итеративной адаптации или управления диалогом. Промпты охватывали четыре домена безопасности: опасности CBRN, сценарии потери контроля, вредоносные манипуляции и кибератаки...
3 недели назад
Georgia Tech разработала AI-инструмент для обучения экзоскелетов без повторного сбора данных
Исследователи из Georgia Tech создали AI-инструмент, который преобразует существующие данные о движениях людей в функциональные контроллеры для экзоскелетов. Новый подход устраняет необходимость в сборе данных и переобучении при каждом изменении устройства. Работа опубликована 19 ноября в Science Robotics. Традиционный процесс разработки экзоскелетов требовал годы сбора данных о движениях людей в специально оборудованных лабораториях. Каждое изменение в устройстве означало, что сбор данных и обучение контроллера нужно начинать заново. Этот процесс был дорогостоящим и делал практическое применение экзоскелетов в реальном мире малореалистичным...
3 недели назад
21 эрготерапевт создали датасет OpenRoboCare с 19.8 часами данных для роботов-сиделок
Исследователи из Cornell University, Columbia и National University of Singapore представили OpenRoboCare — первый мультимодальный датасет для обучения роботов уходу за людьми. Датасет содержит демонстрации 21 эрготерапевта, выполняющих 15 задач по уходу за пациентами. Собрано 19.8 часов данных с пяти модальностей: RGB-D видео, тактильные сенсоры, отслеживание позы, движения глаз и аннотации действий. Уход за людьми требует от роботов точного восприятия при окклюзиях, безопасного физического контакта и планирования на длительный горизонт. Существующие датасеты для роботов-сиделок ограничены по модальностям и редко содержат данные от экспертов-медиков...
3 недели назад
Heretic автоматически удаляет цензуру из LLM
Heretic — инструмент для удаления цензуры из языковых моделей на основе трансформеров без дорогостоящего пост-обучения. Он комбинирует directional ablation с TPE-оптимизацией на базе Optuna. Процесс полностью автоматический и не требует понимания внутреннего устройства трансформеров. Heretic находит параметры аблитерации путем минимизации числа отказов и KL-дивергенции от исходной модели. Это позволяет создать децензурированную модель, сохраняющую интеллект оригинальной модели. Любой, кто умеет запускать программы из командной строки, может использовать Heretic. При работе без настроек Heretic...
4 недели назад
Исследователи из Carnegie Mellon и Amazon Robotics создали фреймворк для коллаборативной манипуляции командами роботов
Исследователи из Carnegie Mellon University и Amazon Robotics разработали фреймворк GCo для коллаборативной манипуляции несколькими роботами и объектами. Фреймворк использует flow-matching co-generation для генерации точек контакта и траекторий манипуляции. Это первое применение дискретно-непрерывной flow-matching co-generation в робототехнике. Существующие методы для коллаборативной манипуляции делятся на два направления. Подходы на основе обучения пытаются изучить весь процесс из данных, но плохо обобщаются и масштабируются. Методы на основе планирования используют структуру для вычисления траекторий, но требуют идеальных моделей и неустойчивы при развертывании в реальном мире...
4 недели назад
DecARt Leg: как робот из МФТИ достиг теоретической скорости 4.18 м/с при 0.17 с FAST
Исследователи из Московского физико-технического института (МФТИ) разработали новую конструкцию ноги гуманоидного робота DecARt Leg, предназначенную для маневренной локомоции. Этот дизайн показал самый короткий достигаемый период переноса стопы (FAST) — всего 0.17 секунды. Это соответствует самой высокой теоретической скорости ходьбы в 4.18 м/с среди протестированных моделей. Большинство современных гуманоидных роботов, таких как Unitree H1 и Fourier GR1, используют простую последовательную, или «связанную» (coupled), кинематическую структуру, в которой задействованы все актуаторы...
1 месяц назад
DecARt Leg: как робот из МФТИ достиг теоретической скорости 4.18 м/с при 0.17 с FAST
Исследователи из Московского физико-технического института (МФТИ) разработали новую конструкцию ноги гуманоидного робота DecARt Leg, предназначенную для маневренной локомоции. Этот дизайн показал самый короткий достигаемый период переноса стопы (FAST) — всего 0.17 секунды. Это соответствует самой высокой теоретической скорости ходьбы в 4.18 м/с среди протестированных моделей. Большинство современных гуманоидных роботов, таких как Unitree H1 и Fourier GR1, используют простую последовательную, или «связанную» (coupled), кинематическую структуру, в которой задействованы все актуаторы. Хотя существуют...
1 месяц назад
ETH Zurich создала магнитных микророботов для лечения инсультов с эффективностью 95%
Исследователи ETH Zurich разработали магнитных микророботов для разрушения тромбов, вызывающих инсульты. Микророботы представляют собой растворимые гелевые капсулы с наночастицами оксида железа для магнитного управления и тантала для рентгеновского отслеживания. Система навигации использует три стратегии для движения по 360 артериям и венам организма. Микророботы достигают скорости до 4 мм/с при вращающемся магнитном поле и 20 см/с при градиентном поле против тока крови...
1 месяц назад
Исследователи из Carnegie Mellon оптимизировали оригами-катапульту через симуляцию в MuJoCo
Исследователи из Carnegie Mellon University разработали фреймворк для симуляции оригами-механизмов с использованием MuJoCo. Систему применили для оптимизации оригами-катапульты через алгоритм CMA-ES. Оптимизированный дизайн с углом складки 115.5° и длиной руки 0.102 м достиг дистанции броска 0.570 м в реальных тестах. Оригами-механизмы используются в биомедицинских устройствах, космической робототехнике и образовательных инструментах. Моделирование связи между паттерны складок (crease patterns), свойствами материалов и 3D-кинематикой требует решения задач в пространствах с высокой размерностью и нелинейными параметрами...
1 месяц назад
Роботы Disney научились падать без повреждений с контролем позы
Исследователи из Disney Research разработали метод обучения двуногих роботов контролируемому падению. Технология основана на обучении с подкреплением и балансирует между минимизацией ударов и достижением заданной конечной позы. Это первый общий подход к управляемому падению двуногих роботов в реальных условиях. При динамичных движениях двуногие роботы сталкиваются с риском падения, несмотря на достижения в области робастности контроллеров на основе обучения с подкреплением. Стандартные стратегии падения включают заморозку актуаторов с высокими коэффициентами или применение низких коэффициентов для податливости...
1 месяц назад
Локальные LLM отвечают на 88.7% запросов с ростом эффективности в 5.3 раза за два года
Локальные языковые модели с ≤20B параметрами теперь обрабатывают 88.7% однократных чат-запросов и запросов на reasoning. Точность локальных LM улучшилась в 3.1 раза с 2023 по 2025 год. Спрос на AI растет экспоненциально: Google Cloud сообщает о 1300-кратном увеличении обработки токенов, а NVIDIA — о 10-кратном годовом росте. 77% запросов к ChatGPT составляют практические guidance, поиск информации и writing — задачи, не требующие frontier-возможностей. Исследователи предлагают метрику intelligence per watt (IPW) для измерения эффективности преобразования энергии в полезные вычисления. Исследование...
1 месяц назад