77 подписчиков

Кто лучше вайбкодит

14 января14 янв

2 мин

? В интернете можно найти сотни бенчмарков, по которым сравнивают нейросети: одни гоняют их по решению университетских задач и математических головоломок, другие проверяют логику и здравый смысл, третьи оценивают практическое применение: способность писать код, создавать тексты или генерировать идеи. Почему бы не провести своё исследование? Спойлер: на мой вгляд, Google справился лучше всех. Задача: собрать лендинг для конференции Digital Learning с новым дизайном. Условия: 1. Один плохой промпт (мы же хотим написать ИИшке «сделай хороший сайт для конференции» и чтобы она сделала, правда?); 2. Дал ссылку на лендинг конференции (чтобы было понятно, что за мероприятие, какая программа и условия); 3. Не больше 2 итераций правок (с бесконечными правками всё что угодно можно довести до идеала); 4. Нужна только главная страница сайта. Участники: Google Gemini (с Antigravity (да, не совсем честно)), DeepSeek, GPT-5.1 (OpenAI) и Grok. Результаты есть в видео в шапке. При клике на ссылки

Кто лучше вайбкодит?

В интернете можно найти сотни бенчмарков, по которым сравнивают нейросети: одни гоняют их по решению университетских задач и математических головоломок, другие проверяют логику и здравый смысл, третьи оценивают практическое применение: способность писать код, создавать тексты или генерировать идеи.

Почему бы не провести своё исследование?

Спойлер: на мой вгляд, Google справился лучше всех.

Задача: собрать лендинг для конференции Digital Learning с новым дизайном.

Условия:

1. Один плохой промпт (мы же хотим написать ИИшке «сделай хороший сайт для конференции» и чтобы она сделала, правда?);

2. Дал ссылку на лендинг конференции (чтобы было понятно, что за мероприятие, какая программа и условия);

3. Не больше 2 итераций правок (с бесконечными правками всё что угодно можно довести до идеала);

4. Нужна только главная страница сайта.

Участники: Google Gemini (с Antigravity (да, не совсем честно)), DeepSeek, GPT-5.1 (OpenAI) и Grok.

Результаты есть в видео в шапке. При клике на ссылки выше можно «пощупать» сайты самим.

По каким критериям сравнивал?

1. Дизайн (субъективно)

2. Функциональность (наличие багов и прикольные/полезные/сложные функции)

3. Адекватность информации*

4. Скорость работы

*Конечно, правильно было бы разделить запрос на 2 части: в начале составить текст и отредактировать его, а потом попросить использовать этот текст в лендинге. Но с таким подходом любая нейросеть напишет адекватный текст.

🎨 Дизайн

Мне понравились все варианты.

Больше всех постарался Google: добавил кучу ховеров и анимаций, уместно использовал шрифты, «трендово» применил бенто-стиль (если бы вместо смайликов нарисовал иконки – цены бы ему не было).

С точки зрения мобильной версии – все справились хорошо, кроме ChatGPT. Адаптив там есть, но весь кривой.

⚙️ Функциональность и баги

Тут очевидное лидерство за Google (ну кто бы сомневался, т.к. я использовал Antigravity).

Всё работало с самого начала без багов. Отдельный плюс за удобную систему фильтров. В дополнительных итерациях добавил фотографии спикеров (ему, как и всем остальным, пришлось кидать ссылки на фотки) + воспользовавшись «инициативой» платформы, добавил чат с ИИ (промпт писал тоже Google, и над ним явно нужно поработать), но фишка классная.

DeepSeek сделал таймер обратного отсчёта (скопировал идею с оригинального сайта). Но если идея хорошая, почему бы и не скопировать?

Но был единственным, у кого были баги и после первой итерации, и после второй всё исправить не удалось.

ChatGPT добавил очень неудобную (но сложную) форму для заявок. Плюс за сложность, минус за UX.

📝 Адекватность информации

Тут не справились все.

DeepSeek более-менее постарался брать информацию с сайта, а не выдумывать всё полностью (не то чтобы получилось хорошо, но лучше, чем у других).

Grok вообще не заморачивался и накидал шаблон – дальше заполняй сам (вот тут поменяй имя на нужное тебе, сюда ссылку на фотку, дальше тему укажи, хочешь добавить ещё выступления – скопируй блок). Интересное сделал ИИ – рутину, человек, пожалуйста, делай сам.

⚡️ Скорость работы

Google, ChatGPT и Grok справились практически одновременно. А вот DeepSeek думал в несколько раз дольше, и контекст оказался слишком большим. Пришлось просить его продолжать.

А чья работа больше всего понравилась вам?

———-

Алексей Миляев и команда сообщества Digital Learning