Узнайте, как сделать ИИ размером с фото, который работает без интернета.
Представьте, что вам предлагают уместить разумный ИИ в файл размером с одну фотографию с телефона. Не урезанный чат-бот, не заглушку, а полноценную языковую модель, которая умеет рассуждать и отвечать на вопросы. Именно этим занимаются участники Parameter Golf - открытого соревнования от OpenAI, где главное правило звучит жёстко: итоговый файл с нейросетью не должен превышать 16 мегабайт.
Проект выложен в открытый доступ с лицензией MIT - это значит, что код можно брать, менять и использовать без каких-либо ограничений. Написан он на Python - языке программирования, который стал стандартом в мире искусственного интеллекта благодаря огромному количеству готовых инструментов.
Parameter Golf: откуда взялось название и зачем это нужно
В гольфе побеждает тот, кто загонит мяч в лунку наименьшим числом ударов. Здесь та же логика: побеждает тот, кто создаст наиболее умную нейросеть при наименьшем количестве «параметров» - числовых значений, из которых, собственно, и состоит любой ИИ. Чем их меньше, тем меньше весит файл. Чем меньше весит файл, тем сложнее сохранить в нём что-то осмысленное.
Современные нейросети, которыми пользуются миллионы людей, весят от нескольких гигабайт до сотен. GPT-4, по оценкам специалистов, занимает терабайты памяти в рабочем состоянии. Запустить такое на домашнем компьютере невозможно - нужны целые серверные залы. Parameter Golf ставит задачу ровно наоборот: как сделать ИИ, который поместится на старой дискете? Не метафорически, а буквально - стандартная дискета вмещала 1,44 МБ, и некоторые участники уже умудряются создавать модели, которые в десяток таких дискет всё-таки влезут.
Зачем это нужно на практике? Представьте умный термостат, который понимает голосовые команды без подключения к интернету. Или медицинский прибор в отдалённой больнице, который анализирует симптомы без облака. Или старый смартфон, который получает локальный ИИ-помощник без подписки. Всё это становится реальным, если научиться упаковывать интеллект в крошечный объём.
Как работает сжатие: веса нейронов до одного бита
Обычная нейросеть хранит каждый свой параметр как число с большой точностью - грубо говоря, с десятками знаков после запятой. Участники Parameter Golf применяют технику, которую называют квантованием: точность намеренно снижается. Вместо числа с десятками знаков - число с двумя. Или с одним. Или вообще просто «да» и «нет» - ноль и единица.
В таблице лидеров уже есть решения, где каждый параметр нейросети хранится в одном бите - это как если бы вся сложность человеческого мышления была закодирована исключительно переключателями «включено/выключено». Звучит как издевательство над здравым смыслом, но такие модели работают - пусть и хуже гигантов, зато умещаются в 16 мегабайт и запускаются на чём угодно.
Помимо квантования, инструментарий проекта включает так называемое низкоранговое обучение - метод, при котором нейросеть учится не запоминать всё подряд, а выделять самое важное, отбрасывая избыточные связи. Это как конспект вместо учебника: информации меньше, но суть сохранена.
Запуск на MacBook: что реально нужно для старта
Для владельцев Mac с чипами M1, M2 или M3 предусмотрен упрощённый сценарий. Проект поддерживает библиотеку MLX - специальный инструмент Apple для вычислений на собственных процессорах, которые совмещают в себе и обычное ядро, и графическое. Это позволяет обучать небольшие модели прямо на ноутбуке, без аренды серверов.
Процесс выглядит так: скачиваете проект со страницы на GitHub, создаёте изолированное рабочее окружение Python (чтобы не засорять систему), устанавливаете нужные библиотеки и запускаете скрипт, который сам загружает обучающие данные. Данные - это очищенный массив текстов FineWeb с уже подготовленным словарём, так что самостоятельно искать обучающие материалы не нужно.
Управляется всё через терминал - окно, куда вводятся текстовые команды. Для человека, который никогда этим не занимался, порог входа ощутимый. Это честно. Проект не притворяется, что он для всех - он для тех, кто готов разобраться.
Для серьёзных результатов и попытки попасть в таблицу лидеров нужны мощные видеокарты NVIDIA. Аренда одной такой карточки на облачных платформах стоит от 2 до 8 долларов в час. Но OpenAI выделила грант в миллион долларов на вычислительные мощности для участников, у которых нет своего оборудования - заявку можно подать через страницу проекта.
Таблица лидеров как способ попасть в штат OpenAI
Это, пожалуй, самая неожиданная деталь проекта. OpenAI открыто говорит: хорошие результаты в этом соревновании - прямой путь к разговору о работе в исследовательской команде. Не резюме, не рекомендательные письма, а конкретный результат в таблице лидеров.
С одной стороны, это честный фильтр: человек, который сумел уместить работающий ИИ в 16 мегабайт, явно понимает, что делает. С другой - это бесплатный краудсорсинг исследований для самой дорогой компании в мире ИИ. Участники тратят своё время и деньги на аренду серверов, а OpenAI получает поток свежих идей по оптимизации. Назвать это чисто альтруистичным жестом сложно.
Тем не менее для разработчика или студента, который хочет доказать свою квалификацию, это редкая возможность. Портфолио с реальным местом в международной таблице лидеров весит куда больше, чем сертификат об окончании онлайн-курса.
Экономия против подписки: считаем деньги
Если вы разработчик и используете платные интерфейсы к нейросетям для своих задач - скажем, для автоматической обработки текстов или ответов на типовые вопросы - счёт за месяц легко достигает 5 000-15 000 рублей при умеренной нагрузке. При активном использовании цифра уходит за 15 000 рублей и выше.
Собственная модель, обученная один раз и работающая на вашем компьютере, а не на чужом сервере, обнуляет эти расходы полностью. Да, она будет менее умной, чем GPT-4. Но для конкретной узкой задачи - классификации обращений, генерации шаблонных ответов, анализа коротких текстов - 16-мегабайтная модель, заточенная под вашу задачу, вполне справится.
Здесь стоит сказать прямо: я убеждён, что эпоха гигантских универсальных моделей как единственного варианта заканчивается. Будущее - за компактными специализированными ИИ, которые делают одно дело хорошо и не требуют подписки. Parameter Golf - это не академическая игрушка, а практическое доказательство этой идеи. Многие не согласятся, и я понимаю почему - универсальность больших моделей действительно удобна. Но удобство, за которое платишь каждый месяц, рано или поздно начинает раздражать.
Если вы когда-нибудь думали о том, чтобы разобраться в устройстве нейросетей не по учебнику, а через реальную задачу с конкретным ограничением - вот она. Шестнадцать мегабайт. Уложитесь?
Источник: Parameter Golf