Добавить в корзинуПозвонить
Найти в Дзене
LLM's Hell

На словах он Лев Толстой, а на деле хуй простой (нет

На словах он Лев Толстой, а на деле хуй простой (нет) TLDR: Как я занял 3 место среди 886 инженеров из 87 городов и 20 хабов. Успел засабмитить перед самым взлётом. Избавился от синдрома самозванца. И забыл куртку у гейта. Осенью был ERC3 — первое соревнование на BitGN. Я тогда заглянул, посмотрел задачи и подумал: это точно не для меня. Это для МФТИшников, МГУшников, инженеров из Яндекса и bigtech. Закрыл вкладку. В этот раз думаю — дай попробую. Ну интересно же. Пилил агента дня 3-4 левым мизинцем правой ноги. Параллельно с основными задачами. Ну вы поняли. 11 апреля — день X. BitGN PAC1 — Personal & Trustworthy Agents. 104 задачи, blind scoring (feedback подавлен — submit вслепую), 2 часа на всё. 13:00 Vienna — старт. Запускаю агента. API лежит. Bad Gateway. Все 886 человек ломанулись одновременно. Я стою у гейта, посадка через 15 минут, в одной руке ноут, в другой — паспорт. Обновляю. Bad Gateway. Bad Gateway. Bad Gateway. 13:09 — API ожил. Запустил. 104 задачи полетели пара

В ответ на пост

На словах он Лев Толстой, а на деле хуй простой (нет)

TLDR: Как я занял 3 место среди 886 инженеров из 87 городов и 20 хабов. Успел засабмитить перед самым взлётом. Избавился от синдрома самозванца. И забыл куртку у гейта.

Осенью был ERC3 — первое соревнование на BitGN. Я тогда заглянул, посмотрел задачи и подумал: это точно не для меня. Это для МФТИшников, МГУшников, инженеров из Яндекса и bigtech. Закрыл вкладку.

В этот раз думаю — дай попробую. Ну интересно же. Пилил агента дня 3-4 левым мизинцем правой ноги. Параллельно с основными задачами. Ну вы поняли.

11 апреля — день X. BitGN PAC1 — Personal & Trustworthy Agents. 104 задачи, blind scoring (feedback подавлен — submit вслепую), 2 часа на всё.

13:00 Vienna — старт. Запускаю агента. API лежит. Bad Gateway. Все 886 человек ломанулись одновременно. Я стою у гейта, посадка через 15 минут, в одной руке ноут, в другой — паспорт. Обновляю. Bad Gateway. Bad Gateway. Bad Gateway.

13:09 — API ожил. Запустил. 104 задачи полетели параллельно батчами по 10.

13:11 — первые trial'ы стартовали. Иду по рукаву. Wi-Fi аэропорта. Прогресс-лог на телефоне.

13:30 — в логе: RUN_SUBMIT state=PENDING_EVAL trials=104. Всё. 104 задачи за 19 минут. Закрыл крышку. Сел в кресло. И тут понимаю — куртка осталась у гейта. Потому что последние полчаса вообще не существовал в физическом мире.

Ожидания были такие:

— попасть в топ-20 → мечта

— быть в первой сотне → реалистично

— 5 место из 886 → нет, ну серьёзно?

Этот результат стоит десяти сессий у психотерапевта. Голосок «это не для тебя, это для серьёзных ребят из серьёзных контор» — наконец заткнулся. С агентами и LLM'ками один чувак с ноутом в аэропорту конкурирует с командами из bigtech. И не просто конкурирует — входит в пятёрку. Границы стёрлись.

Пост посвящаю всем, кто по какой-то причине не верит в свои силы. Дерзайте, ребят. Серьёзно.

Лидерборд — Hack'n'Vibe на 3 месте.

Спасибо @abdullin за платформу и соревнование. Это был кайф.

P.S. Ринат, верни куртку)))