Как ИИ справляются с реальностью: большой тест ChatGPT, Grok, Gemini и Perplexity
Блогер Mrwhosetheboss провёл комплексное сравнение четырёх языковых моделей — ChatGPT (GPT-4o), Grok 3, Gemini 2.5 Pro и Perplexity Sonar Pro. Он оценил их поведение в прикладных задачах: от ответа на пространственные вопросы до анализа изображений и логики.
В задачах с визуализацией Grok оказался точнее конкурентов, а ChatGPT показал наименьшее количество ошибок и стал лидером. Perplexity уступил остальным по точности.
Все ИИ допускали ошибки, что подчёркивает ограниченность текущих систем.
👉 Подробнее читайте на сайте...
🏷 #сравнениеиимоделей #тестchatgpt4o #grok3ии #технологии