Искусственный интеллект теперь повсюду, но многие до сих пор судят о его возможностях по заголовкам в новостях или маркетинговым заявлениям компаний. В итоге одни восхищаются, другие разочаровываются, а третьи вообще уверены, что ИИ — это просто пузырь, который вот-вот скоро лопнет. Но как на самом деле понять, какая языковая модель действительно хороша? Привет, на связи Алексей 👋 Я разработчик AI-мастермайнда neira.chat, и в этой статье хочу рассказать, почему в мире ИИ внешность может быть обманчива. Когда Google заявляет, что их Gemini — лидер индустрии, OpenAI нахваливает ChatGPT, а Anthropic рекламирует Claude, можно ли верить этим словам? Компании продают вам свой продукт, а значит, всегда будут преувеличивать его возможности. Даже тесты, которые они показывают, часто подогнаны под сильные стороны их моделей. Единственным относительно объективным способом оценить языковые модели между собой можно разве что с помощью Chatbot Arena. Это площадка, где вы можно провести "слепое тес