Найти в Дзене
Physical AI and Robotics

Kosmos: ИИ-учёный для автономных научных открытий

Перевод статьи - https://edisonscientific.com/articles/announcing-kosmos
Попробовать можно тут - https://platform.edisonscientific.com/login
Сегодня мы представляем Kosmos — нашего AI-учёного нового поколения. Kosmos — это крупное обновление по сравнению с Robin, предыдущим AI-учёным от FutureHouse. Подробности доступны в нашем техническом отчёте. Kosmos доступен для использования на платформе с
Оглавление

Перевод статьи - https://edisonscientific.com/articles/announcing-kosmos

Попробовать можно тут - https://platform.edisonscientific.com/login

Сегодня мы представляем Kosmos — нашего AI-учёного нового поколения. Kosmos — это крупное обновление по сравнению с Robin, предыдущим AI-учёным от FutureHouse. Подробности доступны в нашем техническом отчёте. Kosmos доступен для использования на платформе с первого дня.

Одновременно управление платформой FutureHouse переходит к Edison Scientific — новому коммерческому спин-оффу FutureHouse. Edison Scientific сохраняет щедрый бесплатный тариф, продолжая миссию FutureHouse по ускорению научного прогресса, и при этом предлагает платные возможности для продвинутых пользователей, которым требуются более высокие лимиты или дополнительные функции.

Kosmos world model
Kosmos world model

Почему Kosmos — это прорыв?

Предыдущие поколения AI-учёных, включая Robin, были ограничены прежде всего способностью синтезировать большие объёмы информации. Конечная длина контекста языковых моделей означает, что AI-система может сделать лишь ограниченное число шагов или логических выводов, прежде чем «упрётся в стену», что сдерживает сложность возможных открытий.

Ключевая инновация Kosmos — использование структурированных моделей мира, которые позволяют эффективно агрегировать информацию, извлечённую из сотен траекторий агентов, и сохранять связность рассуждений вокруг конкретной исследовательской цели на протяжении десятков миллионов токенов. Один запуск Kosmos включает чтение примерно 1500 научных статей и выполнение 42 000 строк аналитического кода — значительно больше, чем у любых других известных нам агентов.

-2

Результаты и точность

Благодаря этому Kosmos выполняет существенно более сложный анализ, чем предыдущие инструменты. По оценкам наших бета-пользователей, Kosmos за один день способен сделать работу, на которую у человека ушло бы около шести месяцев. Мы также обнаружили, что 79,4% выводов Kosmos оказываются корректными.

Мы также объявляем о семи научных открытиях, сделанных Kosmos в сотрудничестве с академическими бета-тестерами, в областях от нейронаук до материаловедения и статистической генетики. Эпоха науки, ускоренной ИИ, уже наступила.

Прозрачность и воспроизводимость

Как и все наши системы, Kosmos создавался с приоритетом прозрачности и трассируемости. Каждый вывод в отчёте Kosmos можно отследить до конкретных строк кода или фрагментов научной литературы, на которых он основан. Все результаты полностью аудируемы. Мы валидировали Kosmos как через воспроизведение неопубликованных ранее результатов, так и через получение новых вкладов в научную литературу.

Открытия Kosmos

В отчёте описаны семь открытий.

Воспроизведение ранее известных результатов (3 случая)

  1. Метаболомика и гипотермия
  2. Kosmos воспроизвёл вывод из на тот момент неопубликованной работы, выявив, что метаболизм нуклеотидов является основным изменённым путём в мозге мышей при гипотермии. Препринт был опубликован на BioRxiv уже после выполнения запуска Kosmos.
  3. Материаловедение и солнечные элементы
  4. Kosmos воспроизвёл вывод из препринта, опубликованного после датасет-катоффа используемых моделей и недоступного Kosmos во время выполнения. Было показано, что абсолютная влажность при термическом отжиге — ключевой фактор эффективности перовскитных солнечных элементов, включая выявление критического порога («фатального фильтра») около 60 г/м³, выше которого устройства выходят из строя.
  5. Правила нейронной связности
  6. Kosmos выявил те же математические закономерности нейронной связности между видами, что и в работе Piazza et al. При этом препринт не использовался во время выполнения, хотя и был опубликован до датасет-катоффа моделей.

Новые научные вклады (4 случая)

  1. SOD2 и фиброз миокарда
  2. Используя данные GWAS и pQTL, Kosmos выполнил менделевскую рандомизацию и показал статистические доказательства того, что высокие уровни SOD2 могут причинно снижать T1-время миокарда и фиброз. Роль SOD2 ранее была показана у мышей; теперь подтверждена релевантность для человека.
  3. Генетика диабета 2 типа
  4. Kosmos предложил новый молекулярный механизм, с помощью которого один SNP может снижать риск развития диабета 2 типа.
  5. Tau-патология при болезни Альцгеймера
  6. Разработан новый аналитический подход для восстановления последовательности молекулярных событий, приводящих к накоплению тау-белка, на основе протеомных данных пациентов.
  7. Уязвимость нейронов при старении
  8. При изучении транскриптомных данных одиночных ядер молодых и старых мышей Kosmos выявил, что нейроны энторинальной коры — первые поражаемые при болезни Альцгеймера — с возрастом снижают экспрессию генов флиппаз. Это может приводить к экспонированию сигналов «съешь меня» (фосфатидилсерин) и активации микроглии. Результат подтверждён на независимом наборе данных single-cell RNA-seq у людей с болезнью Альцгеймера.

Ограничения и практические моменты

Kosmos доступен уже сегодня. Важно понимать:

  • Это не чат-бот, а скорее инструмент глубинного исследования. Эффективная постановка задач требует времени.
  • Стоимость запуска — $200 за один run (200 кредитов по $1), с бесплатным доступом для академических пользователей.
  • Kosmos иногда уходит в «исследовательские тупики» или статистически значимые, но научно нерелевантные направления, поэтому мы часто выполняем несколько запусков на одну цель.
  • Интерфейс и UX всё ещё дорабатываются.

Оценка «6 месяцев работы»

Самый неожиданный результат — оценка, что один запуск Kosmos эквивалентен примерно 6 месяцам работы аспиранта или постдока. Эта оценка получена на основе опроса бета-пользователей и подтверждена независимыми расчётами по числу прочитанных статей и аналитических траекторий.

-3

Мы признаём, что такие оценки неидеальны, однако воспроизведение реальных научных результатов, на которые у людей уходили месяцы, в рамках одного запуска Kosmos, даёт веские основания считать их реалистичными.

-4