9 подписчиков

В последнем посте про экономику AI-бума я упомянул контртренд против повышения цен за облака — домашние АИ серверы

28 апреля28 апр

1 мин

Решил посмотреть на ситуацию глазами реального потребителя. Хочу локальный AI. Это же просто, да? Нет. Открытые модели наконец стали нормальными. DeepSeek V4-Flash, Qwen 3.6-27B — это уже не игрушки. Реально заменяют ChatGPT/Claude для большинства задач. Бесплатно, локально, ваши данные никуда не уходят. Берёшь сервер, запускаешь, всё работает. Казалось бы. Но нет. Для нормальных моделей нужно минимум 128 ГБ памяти. Звучит как технический нюанс. На практике — это ад. Mac Studio M4 Max 128 ГБ — идеальная машина. Но недоступна нигде на планете. Глобальный дефицит RAM. Производители памяти отдают всё AI-датацентрам, на потребительские устройства не хватает. DGX Spark / Dell Pro Max GB10 — есть в наличии, $3 700–4 700, полный CUDA стек, DeepSeek V4 запустился в день релиза. Но это сервер, не компьютер. И память в три раза медленнее чем у Mac — 273 ГБ/с против 819 ГБ/с. На генерации токенов разница огромная. GMKtec EVO-X2 — китайский мини-ПК, те же 128 ГБ за $2 000. Раскупают мгно

В последнем посте про экономику AI-бума я упомянул контртренд против повышения цен за облака — домашние АИ серверы.

Решил посмотреть на ситуацию глазами реального потребителя.

Хочу локальный AI. Это же просто, да?

Нет.

Открытые модели наконец стали нормальными. DeepSeek V4-Flash, Qwen 3.6-27B — это уже не игрушки. Реально заменяют ChatGPT/Claude для большинства задач. Бесплатно, локально, ваши данные никуда не уходят.

Берёшь сервер, запускаешь, всё работает. Казалось бы.

Но нет.

Для нормальных моделей нужно минимум 128 ГБ памяти. Звучит как технический нюанс. На практике — это ад.

Mac Studio M4 Max 128 ГБ — идеальная машина. Но недоступна нигде на планете. Глобальный дефицит RAM. Производители памяти отдают всё AI-датацентрам, на потребительские устройства не хватает.

DGX Spark / Dell Pro Max GB10 — есть в наличии, $3 700–4 700, полный CUDA стек, DeepSeek V4 запустился в день релиза. Но это сервер, не компьютер. И память в три раза медленнее чем у Mac — 273 ГБ/с против 819 ГБ/с. На генерации токенов разница огромная.

GMKtec EVO-X2 — китайский мини-ПК, те же 128 ГБ за $2 000. Раскупают мгновенно везде где появляется.

А может подождать M5?

Mac Studio M5 анонсируют скорее всего на WWDC 8 июня. Но аналитики уже намекают на октябрь из-за тех же проблем с памятью. И даже если выйдет в июне — 128 ГБ конфигурации снова будут в дефиците.

Что реально можно купить сейчас:

M3 Ultra 96 ГБ — доставка через месяц. Не 128 ГБ, старый чип, нет CUDA. Но 819 ГБ/с — быстрее всех конкурентов на инференсе. 96 ГБ тянет 70B модели нормально.

Универсальный компьютер — macOS, тихий, встаёт на стол. Включил и работает.

Dell GB10/DGX Spark лучше только если AI-разработка — основная работа. Fine-tuning без ограничений, весь PyTorch-стек, новые инструменты в день релиза. Но токены генерирует медленнее, и это не компьютер — это сервер.

Контртренд против облачных цен существует. Отличные открытые модели существуют и бесплатны. Но пока выглядит так: подписки дорожают, а железо для обычного пользователя — не купить.

@gostev_future