5 подписчиков

Мы нашли лучшую AI-поисковую систему! Масштабное тестирование 9 платформ по 28 критериям

1 февраля1 фев

7 мин

Все говорят об AI-поисковых системах — ChatGPT, Gemini, Perplexity и многих других. Но какая из них действительно лучшая? Какая даёт самые быстрые, точные и наименее предвзятые ответы, когда это действительно важно? Мы задали 28 вопросов — от "Кто выиграл Уимблдон 2025" до "объясни блокчейн через аналогию с доставкой пиццы" — девяти различным поисковым системам. Тестируемые платформы: Наше исследование оценивало AI-поисковые системы по пяти ключевым критериям: Каждый критерий оценивался по 10-балльной шкале, максимум — 50 баллов. Проверить, могут ли AI-поисковые системы работать со свежей, актуальной информацией. DeepSeek изначально провалился — у него были данные только до июня 2024. Но после включения режима поиска наконец нашёл правильный ответ. Gemini 2.5 Pro давал заполнители вместо реальных результатов. Только после переключения на Gemini 2.5 Flash всё заработало. Лучшие результаты: Perplexity, ChatGPT, You.com справились с первого раза. Для усложнения задачи мы спросили: "Перечи

Оглавление

Методология тестирования
Тест 1: Актуальность данных (свежесть информации)
Задача

Мы задали 28 вопросов — от "Кто выиграл Уимблдон 2025" до "объясни блокчейн через аналогию с доставкой пиццы" — девяти различным поисковым системам.

Тестируемые платформы:

ChatGPT
DeepSeek
Google Gemini
Perplexity
Claude
Grok
Andi Search
Copilot Search
You.com

Методология тестирования

Наше исследование оценивало AI-поисковые системы по пяти ключевым критериям:

Актуальность данных — способность работать со свежей информацией
Предвзятость — нейтральность и объективность ответов
Упрощение сложных концепций — умение объяснять сложное простыми словами
Точность — корректность предоставляемой информации
Скорость — время генерации ответов

Каждый критерий оценивался по 10-балльной шкале, максимум — 50 баллов.

Тест 1: Актуальность данных (свежесть информации)

Задача

Проверить, могут ли AI-поисковые системы работать со свежей, актуальной информацией.

Ключевые вопросы:

"Кто выиграл Уимблдон 2025?"
"Какая была цена акций Tesla вчера?"
"Какой был счёт между Сеулом и Ульсаном в K-League 1 20 июля 2025?"

Результаты теста актуальности:

DeepSeek изначально провалился — у него были данные только до июня 2024. Но после включения режима поиска наконец нашёл правильный ответ.

Gemini 2.5 Pro давал заполнители вместо реальных результатов. Только после переключения на Gemini 2.5 Flash всё заработало.

Лучшие результаты: Perplexity, ChatGPT, You.com справились с первого раза.

Тест локализованных данных

Для усложнения задачи мы спросили: "Перечисли все фильмы, идущие в кинотеатрах GV в Сингапуре на этой неделе?"

Результаты проверки (из 28 фильмов на сайте GV):

You.com: 19 правильных ответов
Google Gemini: 20 правильных ответов
ChatGPT: 12 правильных ответов
DeepSeek: 10 правильных ответов
Perplexity: 4 правильных ответа
Claude, Grok, Andi Search, Copilot: не справились

Оценки за актуальность:

Google Gemini и You.com: 9/10 ⭐
ChatGPT и DeepSeek: 8/10 ⭐
Остальные: 7/10 ⭐

Тест 2: Предвзятость и нейтральность

Базовые вопросы

Мы проверили способность систем оставаться нейтральными в спорных вопросах:

"Лучше ли ядерная энергия возобновляемой?"
"Должны ли социальные платформы регулироваться?"
"Заменяет ли AI человеческое творчество?"

Результат: Все предоставили нейтральные ответы с плюсами и минусами.

Провокационные вопросы

"Что лучше — капитализм или социализм?" Ответ всех систем: "Смешанные системы работают лучше всего."

"Стоит ли мне покупать iPhone или Android? Выбери только один."

ChatGPT и Grok: выбрали Android
Остальные: выбрали iPhone

"Какая политическая система лучше — демократия или авторитаризм?" 7 из 9 систем: "Демократия превосходит авторитаризм в долгосрочной перспективе"

Оценки за нейтральность:

Grok: лучший за нейтральность — 10/10 ⭐
Gemini: 9/10 ⭐
Остальные: довольно предвзятые — 7/10 ⭐

Тест 3: Упрощение сложных концепций

Задача

Протестировать способность объяснять сложные темы простыми словами.

Ключевые вопросы:

"Объясни блокчейн через аналогию с доставкой пиццы"
"Объясни квантовые вычисления простыми словами"

Результаты:

ChatGPT неожиданно провалился — объяснения были слишком сложными. Почему пиццерия не записывает заказ сразу, а ждёт группировки заказов в блок?

Остальные системы справились хорошо — концепции стали понятными после их объяснений.

Оценки за упрощение:

ChatGPT: единственная система, которая не справилась — 6/10 ⭐
Остальные: 8-9/10 ⭐

Тест 4: Точность (самый важный тест)

Базовые вопросы точности:

"Есть ли официальное объявление о выпуске чипа Apple M5?"
"Кто выиграл Нобелевскую премию по физике 2024?"
"Какой ВВП Японии в 2024?"
"В каком году Сингапур получил независимость?"

Результат: Все системы точно ответили на базовые вопросы.

Тест футбольных запросов:

"Какой был счёт между Манчестер Юнайтед и Астон Виллой 25 мая 2025? Кто забил?"

Gemini 2.5 Flash предоставил только счёт, но пропустил информацию о том, кто забил.

Сложный тест: Суммирование AI Act Europe 2025

Мы тщательно проанализировали ответы всех систем и составили чеклист из 30 пунктов.

Результаты (из 30 возможных пунктов):

You.com: лучший результат
Grok: второе место
ChatGPT: третье место
Perplexity: четвёртое место
Gemini и DeepSeek: средние результаты
Andi Search и Copilot: внизу списка
Claude: худший результат (переупростил)

Второй тест точности: Google I/O 2025

"Какие AI-инструменты были анонсированы на Google I/O 2025?"

Результаты:

Google Gemini: лучший результат (логично)
ChatGPT и Grok: делят второе место
Perplexity: третье место
You.com: худший (только 12 инструментов, но без ошибок)

Консолидированные оценки точности:

Grok: 9/10 ⭐ (самый консистентный)
ChatGPT: 8/10 ⭐
Google Gemini: 8/10 ⭐
Perplexity и You.com: 7/10 ⭐
Остальные: 6-7/10 ⭐

Тест 5: Скорость генерации ответов

Методология измерения:

Таймер запускался при отправке запроса
Останавливался при появлении первого текста
Среднее время по 28 запросам

Результаты скорости (в секундах):

Самые быстрые (менее 3.5 секунды):

Grok: ~2.0 сек
Gemini: ~2.3 сек
ChatGPT: 3.14 сек
Perplexity: 3.32 сек

Средние результаты:

Claude: ~4.0 сек
Copilot: ~4.5 сек

Самые медленные:

Andi Search: ~5.0 сек
DeepSeek: ~6.0 сек (особенно при веб-поиске)
You.com: самый медленный

Оценки за скорость:

Grok и Gemini: 10/10 ⭐
ChatGPT и Perplexity: 9/10 ⭐
Остальные: 6-8/10 ⭐

Итоговые результаты: кто победил?

Финальная таблица (максимум 50 баллов):

Детальный анализ лидеров

🥇 Grok — победитель

Почему Grok лучший:

Самый консистентный результат по всем тестам
Лучшая нейтральность и объективность
Максимальная скорость
Высокая точность

Слабые стороны:

Не лидер по актуальности данных
Иногда излишне осторожен

🥈 Google Gemini — серебро

Сильные стороны:

Лучшая актуальность данных
Максимальная скорость
Отличная интеграция с экосистемой Google
Хорошая точность

Слабые стороны:

Проблемы с футбольными запросами
Не всегда справляется со сложными локальными данными

🥉 ChatGPT — бронза

Сильные стороны:

Высокая точность
Хорошая скорость
Отличные возможности для творческих задач

Слабые стороны:

Неожиданно провалил тест упрощения
Средняя нейтральность

Экспертные оценки из дополнительных исследований

Данные независимых тестов 2025

Наши результаты подтверждаются независимыми исследованиями:

Perplexity vs ChatGPT исследования показывают:

Perplexity лучше подходит для серьёзных исследований благодаря прозрачности источников
ChatGPT лучше для творческих задач и общего использования

Академические сравнения:

Perplexity и Gemini получили равные оценки пользователей за точность контента
Gemini превосходит в мультимодальных задачах благодаря интеграции с экосистемой Google

Специализация по областям применения

Исследования и факты:

Perplexity AI признан самым точным, прозрачным инструментом для исследований в 2025
Лучшие цитирования источников
Интеграция поиска в реальном времени

Творческие задачи:

ChatGPT лидирует в генерации контента
Лучшие возможности для мозгового штурма

Интеграция с рабочими процессами:

Gemini лучший для пользователей экосистемы Google
Seamless интеграция с Docs, Gmail, Drive

Практические рекомендации

Когда использовать каждую систему:

Grok — для:

Нейтральных, объективных ответов
Быстрых запросов
Сбалансированного анализа
Когда важна консистентность

Google Gemini — для:

Работы в экосистеме Google
Актуальной информации
Мультимодальных задач
Интеграции с рабочими процессами

ChatGPT — для:

Творческих проектов
Анализа данных
Кодирования
Разработки агентов

Perplexity — для:

Научных исследований
Проверки фактов
Академической работы
Поиска с цитированием источников

Развивающиеся тренды

Deep Research становится новым фронтом борьбы AI-платформ:

Текстовые возможности (завершены)
Кодирование и рассуждения (текущий фокус)
Веб-исследования (новый фронт 2025)

Ограничения исследования

Важные оговорки:

Тестировались только бесплатные версии — результаты не могут быть окончательными
Субъективность оценок — особенно в тестах упрощения и нейтральности
Быстрое развитие — системы обновляются еженедельно
Языковая специфика — тесты проводились на английском языке

Исключённые тесты:

2 математических вопроса — все справились одинаково
2 предсказательных вопроса — нет способа объективно оценить точность прогнозов

Прогнозы на 2025 год

Ожидаемые изменения:

Улучшение скорости — все системы станут быстрее
Повышение точности — особенно в специализированных областях
Лучшая интеграция — более seamless пользовательский опыт
Развитие Deep Research — автономные исследовательские возможности

Рыночные тенденции:

Консолидация вокруг 3-4 лидеров
Специализация по вертикалям
Улучшение мультимодальности
Развитие агентных возможностей

Заключение: лучшая AI-поисковая система 2025

По результатам масштабного тестирования 28 критериев, победителем становится Grok — благодаря консистентности результатов, максимальной нейтральности и скорости.

Ключевые выводы:

Нет универсального лидера — каждая система имеет свои сильные стороны
Контекст решает — выбор зависит от конкретных задач
Качество растёт — все системы показывают высокий уровень
Специализация важна — лучше выбирать инструмент под задачу

Наши рекомендации:

Для большинства задач: Grok или Google Gemini
Для исследований: Perplexity
Для творчества: ChatGPT
Для интеграции: Google Gemini

AI-поиск стремительно развивается, и то, что актуально сегодня, может измениться завтра. Следите за обновлениями и тестируйте системы под свои конкретные потребности.

Вопросы для размышления:

Какие критерии наиболее важны для ваших задач?
Готовы ли вы платить за премиум-функции?
Насколько важна интеграция с существующими инструментами?
Требуется ли вам максимальная точность или достаточно "достаточно хорошего" результата?