Разработан новый инструмент с открытым исходным кодом для мониторинга различных моделей ИИ в реальном времени, включая OpenAI GPT-5, Claude Opus 4 и Gemini 2.5 Pro. Этот первый в своем роде сервис способен обнаруживать случаи, когда компании снижают возможности моделей для экономии затрат. Тесты можно запускать, используя собственные API-ключи OpenAI, xAI, Anthropic или Google. Пользователи, работающие с моделями ИИ для различных задач, особенно программирования, замечают, что эти инструменты часто работают нестабильно. В некоторых случаях они просто не дают ответов, иногда выдают ошибочный код, а когда предоставляют ожидаемый результат, делают это медленнее обычного. Именно здесь на помощь приходит AI Benchmark Tool, расположенный по адресу AistupidLevel.info, предоставляя информацию о производительности и точности нескольких моделей ИИ в реальном времени, включая данные о стоимости. Инструмент выполняет более 140 задач по кодингу, отладке и оптимизации на всех крупных моделях. На дан
Новый инструмент с открытым кодом измеряет "уровень глупости" ИИ-моделей
19 сентября 202519 сен 2025
1 мин