Добавить в корзинуПозвонить
Найти в Дзене
Кормщик

Сколько бумажных томов занял бы ChatGPT?

Представим странную вещь: взять «рабочую начинку» ChatGPT, напечатать её на бумаге А4 шрифтом 12 px и сшить в тома по 300 листов. Сразу оговорка: исходный код ChatGPT закрыт, поэтому точно посчитать нельзя. Но основная «масса» нейросети — это не обычный программный код, а миллиарды чисел-параметров, по которым модель и работает. Возьмём очень грубую оценку: модель уровня GPT-3 имела около 175 миллиардов параметров. Если каждый параметр напечатать как число, то получится примерно 1,5–2 триллиона символов. На одну страницу А4 шрифтом 12 px поместится примерно 5–6 тысяч символов. Итог: около 250–350 миллионов страниц А4. Если сшивать по 300 листов в один том, получится примерно: от 800 тысяч до 1 миллиона бумажных томов. То есть ChatGPT в бумажном виде — это не шкаф и не комната. Это целая библиотека размером с отдельное здание. И самое интересное: сама программа, которая запускает модель, может быть сравнительно небольшой. Главный объём — это не «код» в привычном смысле, а огромная табл

Представим странную вещь: взять «рабочую начинку» ChatGPT, напечатать её на бумаге А4 шрифтом 12 px и сшить в тома по 300 листов.

Сразу оговорка: исходный код ChatGPT закрыт, поэтому точно посчитать нельзя. Но основная «масса» нейросети — это не обычный программный код, а миллиарды чисел-параметров, по которым модель и работает.

Возьмём очень грубую оценку: модель уровня GPT-3 имела около 175 миллиардов параметров. Если каждый параметр напечатать как число, то получится примерно 1,5–2 триллиона символов.

На одну страницу А4 шрифтом 12 px поместится примерно 5–6 тысяч символов.

Итог:

около 250–350 миллионов страниц А4.

Если сшивать по 300 листов в один том, получится примерно:

от 800 тысяч до 1 миллиона бумажных томов.

То есть ChatGPT в бумажном виде — это не шкаф и не комната.

Это целая библиотека размером с отдельное здание.

И самое интересное: сама программа, которая запускает модель, может быть сравнительно небольшой. Главный объём — это не «код» в привычном смысле, а огромная таблица чисел, в которой после обучения записан опыт модели.

Вот так современный искусственный интеллект выглядит на бумаге:
не как робот, а как миллион томов чисел.