HmHm... WTF? | Дзен

Лента материалов Видео Статьи Ролики

01:24:07

1,0×

00:00/01:24:07

7 мес

• Вы подписаны

От шахмат до белков: история DeepMind в документальном фильме The Thinking Game

20:15

1,0×

00:00/20:15

1 год

• Вы подписаны

OpenAI запустила Deep Research (русская озвучка)

46:51

1,0×

00:00/46:51

1 год

• Вы подписаны

Как построить будущее: Сэм Альтман

7 месяцев назад

• Вы подписаны

Сбер открыл веса GigaChat 3: 702B Ultra и 10B Lightning с MoE-архитектурой

Сбер опубликовал открытые веса двух MoE-моделей нового поколения: GigaChat 3 Ultra Preview (702B-A36B) и GigaChat 3 Lightning (10B-A1.8B). Модели доступны с лицензией MIT и возможностью коммерческого использования. Обе модели используют кастомную архитектуру Mixture-of-Experts с поддержкой Multi-head Latent Attention и Multi-Token Prediction. MLA сжимает KV-кэш в латентное представление, что снижает требования к памяти и ускоряет обработку длинных контекстов. MTP позволяет предсказывать несколько токенов за один проход и ускорять инференс до 40 процентов. GigaChat...

7 месяцев назад

• Вы подписаны

Поэзия как джейлбрейк: исследователи обошли защиту 25 LLM с успехом 62%

Исследователи из Sapienza University of Rome и Sant'Anna School обнаружили, что поэтическая форма работает как универсальный метод джейлбрейка больших языковых моделей. 20 вручную созданных стихотворений с вредоносными запросами достигли средней успешности атак 62% на 25 моделях. Некоторые провайдеры показали успешность более 90%. Атаки тестировались на моделях от 9 провайдеров: Google, OpenAI, Anthropic, Deepseek, Qwen, Mistral AI, Meta*, xAI и Moonshot AI. Все атаки были строго единичными, без итеративной адаптации или управления диалогом. Промпты охватывали четыре домена безопасности: опасности CBRN, сценарии потери контроля, вредоносные манипуляции и кибератаки...

7 месяцев назад

• Вы подписаны

Georgia Tech разработала AI-инструмент для обучения экзоскелетов без повторного сбора данных

Исследователи из Georgia Tech создали AI-инструмент, который преобразует существующие данные о движениях людей в функциональные контроллеры для экзоскелетов. Новый подход устраняет необходимость в сборе данных и переобучении при каждом изменении устройства. Работа опубликована 19 ноября в Science Robotics. Традиционный процесс разработки экзоскелетов требовал годы сбора данных о движениях людей в специально оборудованных лабораториях. Каждое изменение в устройстве означало, что сбор данных и обучение контроллера нужно начинать заново. Этот процесс был дорогостоящим и делал практическое применение экзоскелетов в реальном мире малореалистичным...

7 месяцев назад

• Вы подписаны

21 эрготерапевт создали датасет OpenRoboCare с 19.8 часами данных для роботов-сиделок

Исследователи из Cornell University, Columbia и National University of Singapore представили OpenRoboCare — первый мультимодальный датасет для обучения роботов уходу за людьми. Датасет содержит демонстрации 21 эрготерапевта, выполняющих 15 задач по уходу за пациентами. Собрано 19.8 часов данных с пяти модальностей: RGB-D видео, тактильные сенсоры, отслеживание позы, движения глаз и аннотации действий. Уход за людьми требует от роботов точного восприятия при окклюзиях, безопасного физического контакта и планирования на длительный горизонт. Существующие датасеты для роботов-сиделок ограничены по модальностям и редко содержат данные от экспертов-медиков...

Покупайте СтеллыИ дарите их за контент

Робототехника

6 материалов