HmHm... WTF?
24
подписчика
Роботы, Python, ИИ.
Сбер открыл веса GigaChat 3: 702B Ultra и 10B Lightning с MoE-архитектурой
Сбер опубликовал открытые веса двух MoE-моделей нового поколения: GigaChat 3 Ultra Preview (702B-A36B) и GigaChat 3 Lightning (10B-A1.8B). Модели доступны с лицензией MIT и возможностью коммерческого использования. Обе модели используют кастомную архитектуру Mixture-of-Experts с поддержкой Multi-head Latent Attention и Multi-Token Prediction. MLA сжимает KV-кэш в латентное представление, что снижает требования к памяти и ускоряет обработку длинных контекстов. MTP позволяет предсказывать несколько токенов за один проход и ускорять инференс до 40 процентов. GigaChat...
Поэзия как джейлбрейк: исследователи обошли защиту 25 LLM с успехом 62%
Исследователи из Sapienza University of Rome и Sant'Anna School обнаружили, что поэтическая форма работает как универсальный метод джейлбрейка больших языковых моделей. 20 вручную созданных стихотворений с вредоносными запросами достигли средней успешности атак 62% на 25 моделях. Некоторые провайдеры показали успешность более 90%. Атаки тестировались на моделях от 9 провайдеров: Google, OpenAI, Anthropic, Deepseek, Qwen, Mistral AI, Meta*, xAI и Moonshot AI. Все атаки были строго единичными, без итеративной адаптации или управления диалогом. Промпты охватывали четыре домена безопасности: опасности CBRN, сценарии потери контроля, вредоносные манипуляции и кибератаки...
Georgia Tech разработала AI-инструмент для обучения экзоскелетов без повторного сбора данных
Исследователи из Georgia Tech создали AI-инструмент, который преобразует существующие данные о движениях людей в функциональные контроллеры для экзоскелетов. Новый подход устраняет необходимость в сборе данных и переобучении при каждом изменении устройства. Работа опубликована 19 ноября в Science Robotics. Традиционный процесс разработки экзоскелетов требовал годы сбора данных о движениях людей в специально оборудованных лабораториях. Каждое изменение в устройстве означало, что сбор данных и обучение контроллера нужно начинать заново. Этот процесс был дорогостоящим и делал практическое применение экзоскелетов в реальном мире малореалистичным...
21 эрготерапевт создали датасет OpenRoboCare с 19.8 часами данных для роботов-сиделок
Исследователи из Cornell University, Columbia и National University of Singapore представили OpenRoboCare — первый мультимодальный датасет для обучения роботов уходу за людьми. Датасет содержит демонстрации 21 эрготерапевта, выполняющих 15 задач по уходу за пациентами. Собрано 19.8 часов данных с пяти модальностей: RGB-D видео, тактильные сенсоры, отслеживание позы, движения глаз и аннотации действий. Уход за людьми требует от роботов точного восприятия при окклюзиях, безопасного физического контакта и планирования на длительный горизонт. Существующие датасеты для роботов-сиделок ограничены по модальностям и редко содержат данные от экспертов-медиков...
Heretic автоматически удаляет цензуру из LLM
Heretic — инструмент для удаления цензуры из языковых моделей на основе трансформеров без дорогостоящего пост-обучения. Он комбинирует directional ablation с TPE-оптимизацией на базе Optuna. Процесс полностью автоматический и не требует понимания внутреннего устройства трансформеров. Heretic находит параметры аблитерации путем минимизации числа отказов и KL-дивергенции от исходной модели. Это позволяет создать децензурированную модель, сохраняющую интеллект оригинальной модели. Любой, кто умеет запускать программы из командной строки, может использовать Heretic. При работе без настроек Heretic...
Исследователи из Carnegie Mellon и Amazon Robotics создали фреймворк для коллаборативной манипуляции командами роботов
Исследователи из Carnegie Mellon University и Amazon Robotics разработали фреймворк GCo для коллаборативной манипуляции несколькими роботами и объектами. Фреймворк использует flow-matching co-generation для генерации точек контакта и траекторий манипуляции. Это первое применение дискретно-непрерывной flow-matching co-generation в робототехнике. Существующие методы для коллаборативной манипуляции делятся на два направления. Подходы на основе обучения пытаются изучить весь процесс из данных, но плохо обобщаются и масштабируются. Методы на основе планирования используют структуру для вычисления траекторий, но требуют идеальных моделей и неустойчивы при развертывании в реальном мире...
DecARt Leg: как робот из МФТИ достиг теоретической скорости 4.18 м/с при 0.17 с FAST
Исследователи из Московского физико-технического института (МФТИ) разработали новую конструкцию ноги гуманоидного робота DecARt Leg, предназначенную для маневренной локомоции. Этот дизайн показал самый короткий достигаемый период переноса стопы (FAST) — всего 0.17 секунды. Это соответствует самой высокой теоретической скорости ходьбы в 4.18 м/с среди протестированных моделей. Большинство современных гуманоидных роботов, таких как Unitree H1 и Fourier GR1, используют простую последовательную, или «связанную» (coupled), кинематическую структуру, в которой задействованы все актуаторы...
DecARt Leg: как робот из МФТИ достиг теоретической скорости 4.18 м/с при 0.17 с FAST
Исследователи из Московского физико-технического института (МФТИ) разработали новую конструкцию ноги гуманоидного робота DecARt Leg, предназначенную для маневренной локомоции. Этот дизайн показал самый короткий достигаемый период переноса стопы (FAST) — всего 0.17 секунды. Это соответствует самой высокой теоретической скорости ходьбы в 4.18 м/с среди протестированных моделей. Большинство современных гуманоидных роботов, таких как Unitree H1 и Fourier GR1, используют простую последовательную, или «связанную» (coupled), кинематическую структуру, в которой задействованы все актуаторы. Хотя существуют...
ETH Zurich создала магнитных микророботов для лечения инсультов с эффективностью 95%
Исследователи ETH Zurich разработали магнитных микророботов для разрушения тромбов, вызывающих инсульты. Микророботы представляют собой растворимые гелевые капсулы с наночастицами оксида железа для магнитного управления и тантала для рентгеновского отслеживания. Система навигации использует три стратегии для движения по 360 артериям и венам организма. Микророботы достигают скорости до 4 мм/с при вращающемся магнитном поле и 20 см/с при градиентном поле против тока крови...
Исследователи из Carnegie Mellon оптимизировали оригами-катапульту через симуляцию в MuJoCo
Исследователи из Carnegie Mellon University разработали фреймворк для симуляции оригами-механизмов с использованием MuJoCo. Систему применили для оптимизации оригами-катапульты через алгоритм CMA-ES. Оптимизированный дизайн с углом складки 115.5° и длиной руки 0.102 м достиг дистанции броска 0.570 м в реальных тестах. Оригами-механизмы используются в биомедицинских устройствах, космической робототехнике и образовательных инструментах. Моделирование связи между паттерны складок (crease patterns), свойствами материалов и 3D-кинематикой требует решения задач в пространствах с высокой размерностью и нелинейными параметрами...
Роботы Disney научились падать без повреждений с контролем позы
Исследователи из Disney Research разработали метод обучения двуногих роботов контролируемому падению. Технология основана на обучении с подкреплением и балансирует между минимизацией ударов и достижением заданной конечной позы. Это первый общий подход к управляемому падению двуногих роботов в реальных условиях. При динамичных движениях двуногие роботы сталкиваются с риском падения, несмотря на достижения в области робастности контроллеров на основе обучения с подкреплением. Стандартные стратегии падения включают заморозку актуаторов с высокими коэффициентами или применение низких коэффициентов для податливости...
Локальные LLM отвечают на 88.7% запросов с ростом эффективности в 5.3 раза за два года
Локальные языковые модели с ≤20B параметрами теперь обрабатывают 88.7% однократных чат-запросов и запросов на reasoning. Точность локальных LM улучшилась в 3.1 раза с 2023 по 2025 год. Спрос на AI растет экспоненциально: Google Cloud сообщает о 1300-кратном увеличении обработки токенов, а NVIDIA — о 10-кратном годовом росте. 77% запросов к ChatGPT составляют практические guidance, поиск информации и writing — задачи, не требующие frontier-возможностей. Исследователи предлагают метрику intelligence per watt (IPW) для измерения эффективности преобразования энергии в полезные вычисления. Исследование...