⚙️ Новая модель Claude Sonnet 4.5 от Anthropic показала рекордные результаты на практических тестах по программированию, но остаётся уязвимой в задачах, связанных с физическим мышлением. Это подчеркивает границы текущего ИИ — высокую специализацию при отсутствии универсального интеллекта. Claude Sonnet 4.5 демонстрирует 25,7% прирост производительности по сравнению с предыдущей версиейClaude 3.7 Sonnet, согласно комплексному анализу All-in-One AI. На тестах SWE-bench Verified — проверке решений на реальных GitHub-репозиториях — модель показала 77,2% точности в базовом режиме и 82% при параллельных вычислениях, что является лучшим результатом среди публичных моделей. Для справки: SWE-bench оценивает способность ИИ понимать кодовую базу и вносить исправления без ручных подсказок. Claude Sonnet 4.5 успешно справляется с задачами на уровне профессиональных разработчиков. Несмотря на успехи в кодинге, модель остаётся слабой в задачах, связанных с пространственным и физическим мышлением. В т
Claude Sonnet 4.5: новый стандарт в программировании и ограничение в физике
13 октября 202513 окт 2025
1
2 мин