Индустрия искусственного интеллекта получила новый инструмент для объективной оценки моделей — систему AI IQ, которая измеряет интеллектуальные способности нейросетей по человеческой шкале IQ. Проект aiiq.org, запущенный 13 мая, уже протестировал более 50 ведущих языковых моделей и представил результаты в виде интерактивных визуализаций на стандартной колоколообразной кривой распределения интеллекта. Этот запуск стал знаковым событием для отрасли, поскольку впервые появилась возможность сравнивать разнородные AI-системы по единой, понятной широкой аудитории метрике. Методика AI IQ объединяет 12 различных бенчмарков в единую систему оценки, анализируя четыре ключевых типа рассуждений: абстрактное мышление, математические способности, программирование и академические знания. Такой комплексный подход позволяет создать целостную картину интеллектуальных возможностей каждой модели, выходя за рамки узкоспециализированных тестов. Каждая категория тестирования включает множество задач различн