Динозавры вымерли. И большие языковые модели — тоже. Эволюция ИИ только начинается
Почему гонка за параметрами и контекстом — тупик, а будущее за стаей маленьких, быстрых и энергоэффективных агентов. И как мой эксперимент с Nemotron это доказывает. Вечер. Чай. Диспетчер задач. Логи LM Studio. Моя модель — Nemotron 3 Nano 4B в квантизации Q8_0. Малышка на 4 миллиарда параметров. На ней я гонял OpenClaw, заставлял искать в интернете, писать код, анализировать книги. И я заметил странную вещь. Модель могла выдать огромную генерацию на 50K токенов и почти не тронуть память. Но когда я давал ей 10 маленьких задач по 5K токенов — память раздувалась как снежный ком...