21 подписчик

🧠 AI-агенты начали автоматизировать научные исследования

2 дня назад2 дня назад

1 мин

На arXiv вышла работа AutoSci: агентская система, которая пытается автоматизировать полный research pipeline: 🔹 поиск литературы 🔹 генерация гипотез 🔹 постановка экспериментов 🔹 запуск вычислений 🔹 анализ результатов 🔹 написание статьи Агент работает как stateful execution system, где исследование разбивается на этапы через orchestration layer SciFlow. Каждая стадия получает свой контекст, скиллы и execution logic. ⚙️ Главная фишка Самая сильная часть архитектуры - это память, SciMem. Система хранит не документы целиком, а сущности: 🔹 статьи 🔹 методы 🔹 гипотезы 🔹 эксперименты 🔹 результаты Всё живёт как state machine: ➖«гипотеза → тестирование → подтверждение / отклонение» ➖«эксперимент → запуск → результат → переоценка» Получается persistent reasoning layer, где агент не забывает прошлые попытки и может строить итеративные workflow. 🔬 А как защищаются от галлюцинаций? Авторы отдельно добавили Trust Guard для валидации памяти. Перед записью знание проверяется на п

На arXiv вышла работа AutoSci: агентская система, которая пытается автоматизировать полный research pipeline:

🔹 поиск литературы

🔹 генерация гипотез

🔹 постановка экспериментов

🔹 запуск вычислений

🔹 анализ результатов

🔹 написание статьи

Агент работает как stateful execution system, где исследование разбивается на этапы через orchestration layer SciFlow.

Каждая стадия получает свой контекст, скиллы и execution logic.

⚙️ Главная фишка

Самая сильная часть архитектуры - это память, SciMem.

Система хранит не документы целиком, а сущности:

🔹 статьи

🔹 методы

🔹 гипотезы

🔹 эксперименты

🔹 результаты

Всё живёт как state machine:

➖«гипотеза → тестирование → подтверждение / отклонение»

➖«эксперимент → запуск → результат → переоценка»

Получается persistent reasoning layer, где агент не забывает прошлые попытки и может строить итеративные workflow.

🔬 А как защищаются от галлюцинаций?

Авторы отдельно добавили Trust Guard для валидации памяти. Перед записью знание проверяется на происхождение источника, связи с текущими знаниями и на соответствие schema.

Таким отразом пытаются решить проблему долго работающих агентов с отравлением памяти и накопление ложных выводов после сотен шагов рассуждений.

🧪 Это работает?

В одном из экспериментов агент самостоятельно оптимизировал GPU kernel и получил 1.52× ускорение относительно исходника.

Стоит отметить, что во всех кейсах система сохраняла не только успехи, но и провалы, используя их как отрицательное знание для следующих итераций.

🔗 Исследование: https://arxiv.org/abs/2605.31468

Stay secure and read SecureTechTalks 📚

#кибербезопасность #AI #LLM #AgenticAI #AIsecurity #CyberSecurity #RAG #MemorySecurity #ResearchAgents #SecureTechTalks