? В интернете можно найти сотни бенчмарков, по которым сравнивают нейросети: одни гоняют их по решению университетских задач и математических головоломок, другие проверяют логику и здравый смысл, третьи оценивают практическое применение: способность писать код, создавать тексты или генерировать идеи. Почему бы не провести своё исследование? Спойлер: на мой вгляд, Google справился лучше всех. Задача: собрать лендинг для конференции Digital Learning с новым дизайном. Условия: 1. Один плохой промпт (мы же хотим написать ИИшке «сделай хороший сайт для конференции» и чтобы она сделала, правда?); 2. Дал ссылку на лендинг конференции (чтобы было понятно, что за мероприятие, какая программа и условия); 3. Не больше 2 итераций правок (с бесконечными правками всё что угодно можно довести до идеала); 4. Нужна только главная страница сайта. Участники: Google Gemini (с Antigravity (да, не совсем честно)), DeepSeek, GPT-5.1 (OpenAI) и Grok. Результаты есть в видео в шапке. При клике на ссылки