Знаете, что сейчас происходит с дата-центрами? Представьте: ИИ-системы набирают обороты, все строят модели, запускают inference (ну, вывод результатов из моделей, если по-простому), а хранилища данных… буквально задыхаются. И вот тут выясняется неожиданная вещь: старые добрые жесткие диски (HDD) вдруг стали узким местом всей этой ИИ-фабрики.
Вот в чем штука. Данные, которые раньше спокойно лежали в холодном архиве и никого не трогали, теперь постоянно нужны — для обучения моделей, для точных предсказаний. Из холодных они превратились в «теплые». А это значит, нужна низкая задержка, высокая пропускная способность, параллельные вычисления. HDD, конечно, останутся для дешевого холодного хранения, но если не переосмыслить их роль — они рискуют стать самым слабым звеном.
HDD не справляются с новыми реалиями
«Современные ИИ-нагрузки в сочетании с ограничениями дата-центров создали новые вызовы для HDD», — отмечает Джефф Януковиц (Jeff Janukowicz), вице-президент по исследованиям в IDC. И правда: производители HDD наращивают емкость дисков, но это часто идет в ущерб производительности. Диски становятся больше, а работают медленнее. В итоге в индустрии все чаще говорят о «nearline SSD» (это такие SSD для теплых данных, если кто не в курсе).
Сейчас операторам ИИ нужно выжимать максимум из GPU, эффективно управлять сетевыми хранилищами, масштабировать вычисления — и при этом экономить на электричестве и месте, которых вечно не хватает. Каждый ватт на счету. Каждый квадратный сантиметр важен. По словам Роджера Корелла (Roger Corell), старшего директора по ИИ и маркетингу в Solidigm, тут нужна не просто техническая модернизация. Нужна глубокая перестройка подхода.
«Речь идет о тектоническом сдвиге в ценности данных для ИИ», — говорит Корелл. «Вот тут-то и появляются высокоемкие SSD. Вместе с емкостью они дают производительность и эффективность — позволяют хранилищам эксабайтного масштаба (это квадриллион байт, представляете?) не отставать от стремительного роста объемов данных. Все это потребляет энергию и место, так что делать это надо максимально эффективно, чтобы дать больше возможностей для GPU в этой ограниченной среде».
По сути, высокоемкие SSD не просто вытесняют HDD. Они убирают одно из главных узких мест на ИИ-фабрике. Огромный прирост в производительности, эффективности, плотности хранения — все это освобождает энергию и место для GPU. Это не просто апгрейд хранилища. Это структурный сдвиг в том, как проектируется дата-инфраструктура в эпоху ИИ.
HDD против SSD: больше чем просто железо
Ладно, HDD — впечатляющая механическая конструкция, спору нет. Но там куча движущихся частей, которые в масштабе жрут больше энергии, занимают больше места и ломаются чаще, чем твердотельные накопители. Вращающиеся пластины, механические головки чтения-записи — все это по определению ограничивает количество операций ввода-вывода в секунду (IOPS). Для ИИ-нагрузок, где нужна низкая задержка, высокая параллельность и стабильная пропускная способность, это прямое узкое место.
HDD плохо справляются с задачами, чувствительными к задержкам: физический поиск данных вносит механические задержки, которые просто не годятся для inference и обучения в реальном времени. Ну и энергопотребление с охлаждением при частом интенсивном доступе к данным растут значительно, эффективность падает по мере роста объемов.
А вот тут интересно. Solidigm и VAST Data провели исследование экономики хранения данных в масштабе эксабайта — сравнивали потребление энергии SSD и HDD за 10 лет. Решение на базе SSD от VAST снижает энергопотребление примерно на $1 млн в год. В ИИ-среде, где каждый ватт на вес золота, это огромное преимущество.
Давайте посчитаем. Чтобы сравняться по емкости с одним SSD Solidigm на 122 ТБ, нужно четыре HDD по 30 ТБ. Учитывая методы сжатия данных VAST (которые возможны благодаря высокой производительности SSD), для решения на эксабайт требуется 3738 SSD Solidigm против более чем 40 000 высокоемких HDD. И знаете что? Решение на SSD от VAST потребляет на 77% меньше энергии для хранения. Вдумайтесь: 77%!
Сокращение площади дата-центров
«Мы поставляем диски на 122 терабайта ведущим OEM и крупнейшим облачным провайдерам ИИ в мире», — рассказывает Корелл. «Когда сравниваешь конфигурацию полностью на 122 ТБ SSD с гибридной HDD + TLC SSD, получаешь экономию площади дата-центра девять к одному. Девять к одному, Карл! И да, это важно для огромных дата-центров, которые строят собственные атомные реакторы и подписывают жирные контракты на возобновляемую энергию. Но это все более критично для региональных и локальных дата-центров, для edge-развертываний, где место на вес золота».
Эта экономия 9:1 — это не только про место и энергию. Это возможность разместить инфраструктуру там, где раньше было невозможно, нарастить GPU или построить более компактные решения.
«Если тебе дали X земли и Y электричества, ты их используешь. Ты же занимаешься ИИ», — объясняет Корелл. «Каждый ватт и каждый квадратный сантиметр на счету. Так почему бы не использовать их максимально эффективно? Получи самое эффективное хранилище на планете и дай больше возможностей для GPU в тех рамках, что у тебя есть. В долгосрочке это сэкономит операционные расходы. У тебя на 90% меньше хранилищных отсеков для обслуживания — и связанные с этим затраты просто исчезают».
И вот что еще часто упускают из виду. Гораздо больший физический объем данных на механических HDD означает больший след от строительных материалов. Производство бетона и стали в совокупности дает более 15% мировых выбросов парниковых газов. Сокращая физический объем хранилищ, высокоемкие SSD могут снизить связанные с бетоном и сталью выбросы более чем на 80% по сравнению с HDD. Ну и на последнем этапе жизненного цикла — при утилизации дисков — будет на 90% меньше устройств для утилизации.
Переосмысление стратегий холодного и архивного хранения
Переход на SSD — это не просто апгрейд хранилища. Это фундаментальное переосмысление стратегии дата-инфраструктуры в эпоху ИИ. И процесс набирает обороты.
«Крупные гиперскейлеры пытаются выжать максимум из существующей инфраструктуры, творят с HDD, честно говоря, неестественные вещи: переполняют их почти до 90%, чтобы выжать побольше IOPS на терабайт. Но они начинают понимать», — говорит Корелл. «Как только они перейдут на современную инфраструктуру полностью на высокоемких накопителях, вся индустрия пойдет по этому пути. Плюс мы уже видим, как уроки, извлеченные из ценности современных хранилищ в ИИ, применяются и в других сегментах: big data аналитика, HPC (высокопроизводительные вычисления) и многое другое».
Хотя решения all-flash (полностью на флеш-памяти) принимаются почти повсеместно, место для HDD всегда останется, добавляет он. HDD продолжат использовать для архивов, холодного хранения и сценариев, где чистая стоимость за гигабайт важнее, чем доступ в реальном времени. Но по мере того, как токен-экономика разогревается, а предприятия осознают ценность монетизации данных, сегменты теплых и нагревающихся данных будут продолжать расти.
Решение энергетических вызовов будущего
Уже 4-е поколение, более 122 совокупных эксабайт поставлено на сегодняшний день — технология QLC (Quad-Level Cell) от Solidigm лидирует в индустрии, балансируя между высокой емкостью дисков и экономической эффективностью.
«Мы не думаем о хранилище просто как о хранении битов и байтов. Мы думаем о том, как разработать эти потрясающие диски, которые способны приносить выгоду на уровне решения», — говорит Корелл. «Яркая звезда тут — наш недавно запущенный E1.S, разработанный специально для плотного и эффективного хранения в конфигурациях прямого подключения для GPU-серверов следующего поколения без вентиляторов».
Solidigm D7-PS1010 E1.S — это прорыв. Первый в индустрии eSSD с односторонним прямым жидкостным охлаждением чипа. Solidigm работали с NVIDIA, чтобы решить двойную задачу: управление теплом и экономическая эффективность при высокой производительности для требовательных ИИ-нагрузок.
«Мы быстро движемся к среде, где все критические IT-компоненты будут с прямым жидкостным охлаждением чипа на стороне прямого подключения», — говорит он. «Думаю, рынку нужно пересмотреть подход к охлаждению, потому что проблемы с электропитанием не исчезнут при моей жизни, это точно. Нужно применять облачное мышление нового поколения к архитектуре наиболее эффективной инфраструктуры».
Все более сложный inference упирается в «стену памяти» (memory wall), что делает архитектуру хранения первоочередной задачей проектирования, а не запоздалой мыслью. Высокоемкие SSD в паре с жидкостным охлаждением и эффективным дизайном — пожалуй, единственный путь удовлетворить растущие требования ИИ. Задача сейчас — строить инфраструктуру не просто для эффективности, а для хранилища, которое может эффективно масштабироваться по мере роста данных. Те организации, которые переосмыслят хранилище сейчас, смогут масштабировать ИИ завтра.
Хотите быть в курсе того, как развивается инфраструктура для ИИ, какие технологии хранения данных выходят на первый план и как это влияет на индустрию?🔔 Чтобы узнать больше о новинках в области ИИ-инфраструктуры, хранилищ данных и следить за новостями мира искусственного интеллекта, подписывайтесь на мой канал «ProAI» в Telegram!