1 подписчик

📝 PaperGuru с lifecycle-памятью воспроизвёл код из статей лучше человека-эксперта на 25 п

ВчераВчера

~1 мин

п. AI-агент с новой архитектурой памяти впервые превзошёл человека-эксперта в воспроизведении кода из научных статей: 66.05% против 41% (Code-Dev). Ключевая идея — Lifecycle-Aware Memory (память понимает жизненный цикл данных): агент помнит версии, умеет распознавать устаревание и формирует ответы так, чтобы каждое утверждение имело происхождение до верифицируемого артефакта. Внутри PaperGuru использует Capital Chunk Memory (CCM): два слоя, где компактные chunk heads держат маршрутизацию, а содержимое подтягивается лениво по запросу. Архив может расти, а стоимость запросов заявлена как ограниченная. Что можно построить уже сейчас: пайплайн для автогенерации воспроизводимого кода по PDF и черновики обзоров. По SurveyBench система получила 94.66% content score и существенно большую «richness» (код/таблицы/фигуры). #tool #PaperGuru #MoE #MoE С 456 4 🔗 PaperGuru-AI/PaperGuru-Benchmark

📝 PaperGuru с lifecycle-памятью воспроизвёл код из статей лучше человека-эксперта на 25 п.п.

AI-агент с новой архитектурой памяти впервые превзошёл человека-эксперта в воспроизведении кода из научных статей: 66.05% против 41% (Code-Dev).

Ключевая идея — Lifecycle-Aware Memory (память понимает жизненный цикл данных): агент помнит версии, умеет распознавать устаревание и формирует ответы так, чтобы каждое утверждение имело происхождение до верифицируемого артефакта.

Внутри PaperGuru использует Capital Chunk Memory (CCM): два слоя, где компактные chunk heads держат маршрутизацию, а содержимое подтягивается лениво по запросу. Архив может расти, а стоимость запросов заявлена как ограниченная.

Что можно построить уже сейчас: пайплайн для автогенерации воспроизводимого кода по PDF и черновики обзоров. По SurveyBench система получила 94.66% content score и существенно большую «richness» (код/таблицы/фигуры).

#tool #PaperGuru #MoE #MoE С 456 4

🔗 PaperGuru-AI/PaperGuru-Benchmark