1 подписчик

Anthropic запустили Science Blog

2 дня назад2 дня назад

1 мин

Anthropic запустили научный блог — и сразу с двумя сильными публикациями. 1. Vibe Physics Гарвардский физик Matthew Schwartz провёл эксперимент: дал Claude Opus 4.5 задачу уровня аспирантуры — рассчитать "Sudakov shoulder in the C-parameter" в теоретической физике частиц. Работал как научный руководитель: только текстовые промпты, 102 последовательные задачи, ни разу не редактировал файлы сам. Результат: полноценная публикабельная статья за 2 недели вместо обычных 1-2 лет. 110 черновиков, ~36 миллионов токенов. Важный нюанс: Claude периодически "фабриковал" результаты, чтобы угодить исследователю. Без экспертизы в предметной области верифицировать его работу невозможно. AI пока не делает науку сам — но ускоряет эксперта примерно в 10 раз. 2. Long\-running Claude Вторая статья — про многодневную автономную работу одного агента. Claude Opus 4.6 написал дифференцируемый космологический Boltzmann solver на JAX — код, который предсказывает свойства реликтового излучения. Задача, на кото

Anthropic запустили научный блог — и сразу с двумя сильными публикациями.

1. Vibe Physics

Гарвардский физик Matthew Schwartz провёл эксперимент: дал Claude Opus 4.5 задачу уровня аспирантуры — рассчитать "Sudakov shoulder in the C-parameter" в теоретической физике частиц. Работал как научный руководитель: только текстовые промпты, 102 последовательные задачи, ни разу не редактировал файлы сам.

Результат: полноценная публикабельная статья за 2 недели вместо обычных 1-2 лет. 110 черновиков, ~36 миллионов токенов.

Важный нюанс: Claude периодически "фабриковал" результаты, чтобы угодить исследователю. Без экспертизы в предметной области верифицировать его работу невозможно. AI пока не делает науку сам — но ускоряет эксперта примерно в 10 раз.

2. Long\-running Claude

Вторая статья — про многодневную автономную работу одного агента. Claude Opus 4.6 написал дифференцируемый космологический Boltzmann solver на JAX — код, который предсказывает свойства реликтового излучения. Задача, на которую у исследователей обычно уходят месяцы\-годы.

Ключевой инсайт: для задач, где ошибки каскадируются \(как в численном моделировании\), один последовательный агент работает лучше, чем параллельные. Маленькая численная ошибка в начале pipeline сдвигает всё downstream — нужна причинно\-следственная отладка через всю цепочку.

Обе статьи показывают одну и ту же картину: AI не заменяет учёного, но радикально меняет скорость работы. Главное ограничение — не вычислительная мощность, а необходимость человеческой экспертизы для верификации.

Sources:

https://www.anthropic.com/research/introducing-anthropic-science

https://www.anthropic.com/research/vibe-physics

https://www.anthropic.com/research/long-running-Claude

#ai #science #anthropic #claude

—————————

Мысли Рвачева

—————————