Перевод статьи - https://edisonscientific.com/articles/announcing-kosmos
Попробовать можно тут - https://platform.edisonscientific.com/login
Сегодня мы представляем Kosmos — нашего AI-учёного нового поколения. Kosmos — это крупное обновление по сравнению с Robin, предыдущим AI-учёным от FutureHouse. Подробности доступны в нашем техническом отчёте. Kosmos доступен для использования на платформе с первого дня.
Одновременно управление платформой FutureHouse переходит к Edison Scientific — новому коммерческому спин-оффу FutureHouse. Edison Scientific сохраняет щедрый бесплатный тариф, продолжая миссию FutureHouse по ускорению научного прогресса, и при этом предлагает платные возможности для продвинутых пользователей, которым требуются более высокие лимиты или дополнительные функции.
Почему Kosmos — это прорыв?
Предыдущие поколения AI-учёных, включая Robin, были ограничены прежде всего способностью синтезировать большие объёмы информации. Конечная длина контекста языковых моделей означает, что AI-система может сделать лишь ограниченное число шагов или логических выводов, прежде чем «упрётся в стену», что сдерживает сложность возможных открытий.
Ключевая инновация Kosmos — использование структурированных моделей мира, которые позволяют эффективно агрегировать информацию, извлечённую из сотен траекторий агентов, и сохранять связность рассуждений вокруг конкретной исследовательской цели на протяжении десятков миллионов токенов. Один запуск Kosmos включает чтение примерно 1500 научных статей и выполнение 42 000 строк аналитического кода — значительно больше, чем у любых других известных нам агентов.
Результаты и точность
Благодаря этому Kosmos выполняет существенно более сложный анализ, чем предыдущие инструменты. По оценкам наших бета-пользователей, Kosmos за один день способен сделать работу, на которую у человека ушло бы около шести месяцев. Мы также обнаружили, что 79,4% выводов Kosmos оказываются корректными.
Мы также объявляем о семи научных открытиях, сделанных Kosmos в сотрудничестве с академическими бета-тестерами, в областях от нейронаук до материаловедения и статистической генетики. Эпоха науки, ускоренной ИИ, уже наступила.
Прозрачность и воспроизводимость
Как и все наши системы, Kosmos создавался с приоритетом прозрачности и трассируемости. Каждый вывод в отчёте Kosmos можно отследить до конкретных строк кода или фрагментов научной литературы, на которых он основан. Все результаты полностью аудируемы. Мы валидировали Kosmos как через воспроизведение неопубликованных ранее результатов, так и через получение новых вкладов в научную литературу.
Открытия Kosmos
В отчёте описаны семь открытий.
Воспроизведение ранее известных результатов (3 случая)
- Метаболомика и гипотермия
- Kosmos воспроизвёл вывод из на тот момент неопубликованной работы, выявив, что метаболизм нуклеотидов является основным изменённым путём в мозге мышей при гипотермии. Препринт был опубликован на BioRxiv уже после выполнения запуска Kosmos.
- Материаловедение и солнечные элементы
- Kosmos воспроизвёл вывод из препринта, опубликованного после датасет-катоффа используемых моделей и недоступного Kosmos во время выполнения. Было показано, что абсолютная влажность при термическом отжиге — ключевой фактор эффективности перовскитных солнечных элементов, включая выявление критического порога («фатального фильтра») около 60 г/м³, выше которого устройства выходят из строя.
- Правила нейронной связности
- Kosmos выявил те же математические закономерности нейронной связности между видами, что и в работе Piazza et al. При этом препринт не использовался во время выполнения, хотя и был опубликован до датасет-катоффа моделей.
Новые научные вклады (4 случая)
- SOD2 и фиброз миокарда
- Используя данные GWAS и pQTL, Kosmos выполнил менделевскую рандомизацию и показал статистические доказательства того, что высокие уровни SOD2 могут причинно снижать T1-время миокарда и фиброз. Роль SOD2 ранее была показана у мышей; теперь подтверждена релевантность для человека.
- Генетика диабета 2 типа
- Kosmos предложил новый молекулярный механизм, с помощью которого один SNP может снижать риск развития диабета 2 типа.
- Tau-патология при болезни Альцгеймера
- Разработан новый аналитический подход для восстановления последовательности молекулярных событий, приводящих к накоплению тау-белка, на основе протеомных данных пациентов.
- Уязвимость нейронов при старении
- При изучении транскриптомных данных одиночных ядер молодых и старых мышей Kosmos выявил, что нейроны энторинальной коры — первые поражаемые при болезни Альцгеймера — с возрастом снижают экспрессию генов флиппаз. Это может приводить к экспонированию сигналов «съешь меня» (фосфатидилсерин) и активации микроглии. Результат подтверждён на независимом наборе данных single-cell RNA-seq у людей с болезнью Альцгеймера.
Ограничения и практические моменты
Kosmos доступен уже сегодня. Важно понимать:
- Это не чат-бот, а скорее инструмент глубинного исследования. Эффективная постановка задач требует времени.
- Стоимость запуска — $200 за один run (200 кредитов по $1), с бесплатным доступом для академических пользователей.
- Kosmos иногда уходит в «исследовательские тупики» или статистически значимые, но научно нерелевантные направления, поэтому мы часто выполняем несколько запусков на одну цель.
- Интерфейс и UX всё ещё дорабатываются.
Оценка «6 месяцев работы»
Самый неожиданный результат — оценка, что один запуск Kosmos эквивалентен примерно 6 месяцам работы аспиранта или постдока. Эта оценка получена на основе опроса бета-пользователей и подтверждена независимыми расчётами по числу прочитанных статей и аналитических траекторий.
Мы признаём, что такие оценки неидеальны, однако воспроизведение реальных научных результатов, на которые у людей уходили месяцы, в рамках одного запуска Kosmos, даёт веские основания считать их реалистичными.