Добавить в корзинуПозвонить
Найти в Дзене

Кластер Proxmox с хранилищем TrueNAS SCALE: кейс миграции с VMware

Дистрибьюторская компания из Московской области — 60 сотрудников, три сервера, 15 виртуальных машин — платила за VMware $0 и жила спокойно. До февраля 2024 года, пока Broadcom не закрыл бесплатную версию ESXi. Дальше выбор простой: заплатить ~$4 800 в год за лицензии или пересобрать инфраструктуру. Клиент выбрал второе. Три хоста VMware ESXi с бесплатной лицензией — классическая схема для небольшой компании. На каждом хосте свой RAID-10, никакого общего хранилища. Работало — но с серьёзными ограничениями. Нет живой миграции. Любое плановое обслуживание ноды — обновление прошивки, замена диска — требовало ручной остановки виртуальных машин. Простой в рабочее время, звонки директору, нервы. Изолированные диски. Без общего пула хранилища отказ контроллера означал потерю всех машин на этом хосте. Одна точка отказа на каждый сервер. Реальный инцидент. RAID деградировал, диск вышел из строя. Восстановление заняло 8 часов. Ещё один отказ в этот период — и 1С:Предприятие потеряно вместе с дан
Оглавление

Дистрибьюторская компания из Московской области — 60 сотрудников, три сервера, 15 виртуальных машин — платила за VMware $0 и жила спокойно. До февраля 2024 года, пока Broadcom не закрыл бесплатную версию ESXi. Дальше выбор простой: заплатить ~$4 800 в год за лицензии или пересобрать инфраструктуру. Клиент выбрал второе.

Что было не так с ESXi

Три хоста VMware ESXi с бесплатной лицензией — классическая схема для небольшой компании. На каждом хосте свой RAID-10, никакого общего хранилища. Работало — но с серьёзными ограничениями.

Нет живой миграции. Любое плановое обслуживание ноды — обновление прошивки, замена диска — требовало ручной остановки виртуальных машин. Простой в рабочее время, звонки директору, нервы.

Изолированные диски. Без общего пула хранилища отказ контроллера означал потерю всех машин на этом хосте. Одна точка отказа на каждый сервер.

Реальный инцидент. RAID деградировал, диск вышел из строя. Восстановление заняло 8 часов. Ещё один отказ в этот период — и 1С:Предприятие потеряно вместе с данными.

Медленные резервные копии. Полный бэкап 15 машин через vzdump на NFS-шару занимал 6+ часов и тормозил продакшен в ночное окно.

После отмены бесплатного ESXi ситуация обострилась. Broadcom в апреле 2025 вернул урезанный ESXi 8.0U3e — без vCenter, без живой миграции, без отказоустойчивости и с лимитом 8 виртуальных процессоров на машину. Для продуктивной среды — неприемлемо.

Альтернатива — vSphere Standard: ~$4 800 в год (96 ядер по $50). Старый пакет Essentials Plus Kit за ~$6 000 единоразово сняли с продажи в Q4 2024.

Директор принял решение уходить.

Из чего собрали новый кластер

Гипервизор: Proxmox VE

Proxmox VE 8.x+ — открытая платформа виртуализации на базе Debian. Поддерживает кластеризацию из коробки, живую миграцию при наличии общего хранилища, снимки, резервное копирование. Community Edition — бесплатный без ограничений по функциям.

Три физических сервера клиента стали тремя нодами кластера.

Хранилище: TrueNAS SCALE

TrueNAS SCALE 25.04+ — дистрибутив от iXsystems на базе Linux с файловой системой ZFS. Бесплатный, в том числе для коммерческого применения.

На выделенном сервере собрали хранилище:

  • ZFS-пул RAIDZ2 из 8 дисков по 4 ТБ (SATA)
  • 2 NVMe-диска в роли журнала записи (SLOG) и кэша чтения (L2ARC)
  • Датасет tank/proxmox для виртуальных машин

RAIDZ2 выдерживает одновременный отказ двух дисков — данные сохраняются.

Транспорт: iSCSI

Связку между Proxmox и TrueNAS обеспечил плагин TrueNAS Storage Plugin v1.2.6. Протокол — iSCSI по локальной сети.

Плагин автоматически создаёт хранилище и настраивает его при добавлении нового диска к виртуальной машине. Параметр shared 1 активирует живую миграцию автоматически — Proxmox видит хранилище как общее для всего кластера.

Как проходила миграция

Работу выполнили за 2 недели, поэтапно — без остановки продакшена.

Каждая виртуальная машина переезжала отдельно: экспорт из ESXi, конвертация формата диска, импорт в Proxmox, проверка, переключение. Следующая — только после того, как предыдущая стабильно работает.

Что получил клиент

Живая миграция. Виртуальная машина переезжает между нодами без остановки — обновление сервера, замена памяти, перезагрузка в рабочее время больше не означают простой для пользователей.

Мгновенные снимки. ZFS делает снимок состояния системы моментально — без нагрузки на диски и без остановки машины. Поддерживаются снимки с сохранением оперативной памяти. Vzdump с его 6-часовыми окнами ушёл в прошлое.

Экономия места. Тонкое выделение дискового пространства: 15 машин с суммарным «назначенным» объёмом 800 ГБ реально занимают ~340 ГБ на пуле.

Отказоустойчивость хранилища. RAIDZ2 держит отказ двух дисков. Общий пул для всех нод — нет изолированных точек отказа.

Сравнение до и после:

  • Хранилище: локальный RAID-10 на каждом хосте → общий ZFS-пул RAIDZ2 по iSCSI
  • Живая миграция: нет → есть, без простоя
  • Снимки: vzdump, 6+ часов → ZFS, мгновенно
  • Thin provisioning: нет → есть (800 ГБ → ~340 ГБ на диске)
  • Обслуживание нод: простой машин → миграция без остановки
  • Лицензии: ~$4 800 в год → $0

Результаты

0 ₽ стоимость лицензий в год. 100% uptime при обслуживании нод. Проект выполнен за 2 недели, миграция поэтапно без простоя.

Proxmox + TrueNAS SCALE — это не компромисс. Это полноценная замена vSphere с живой миграцией, мгновенными снимками и RAIDZ2, которая ничего не стоит в части лицензий.

Полный кейс с техническими деталями: Кластер Proxmox + TrueNAS SCALE: миграция с VMware