Национальное управление США по воздухоплаванию и исследованию космического пространства (NASA) планирует использовать сервисы AWS для хранения к 2025 году порядка 247 Пбайт данных. В настоящее время объём хранящихся данных NASA составляет 32 Пбайт.
Все они были получены в рамках программы Earth Science Data and Information System (ESDIS), собирающей информацию множества миссий в ходе наблюдения за процессами на нашей планете. Для их хранения используется более десятка центров Distributed Active Archive Center (DAAC).
В 2019 году NASA решило перейти на хранение данных в облаке Amazon в рамках проекта Earthdata Cloud. Начало перехода с собственного хранилища DAAC на облачное было запланировано на первый квартал 2020 года.
Как ожидается, исследователи и коммерческие пользователи данных NASA Earth Science теперь получат больше возможностей для быстрого доступа к большим объёмам данных и для их обработки, что позволит проводить новые виды исследований и анализа. К тому же данные, которые ранее были географически разбросаны, теперь будут доступны через облако, экономя время и ресурсы.
Всё выглядит очень привлекательно, но, как оказалось, NASA не учло ряд моментов. Согласно опубликованному в марте отчёту об аудите Генерального инспектора NASA, система Earth Observing System Data and Information System (EOSDIS), через которую и предоставляется доступ пользователям, не учитывает то, как платежи за получение данных из облака повлияют на планы космического агентства.
И что ещё хуже, NASA «до сих пор не определило, какие именно наборы данных перейдут в Earthdata Cloud, и не разработало модели затрат, основанные на опыте эксплуатации и метриках использования и доступа». Если сейчас информация, хранимая в DAAC бесплатна для агентства, то за получение пользователями данных в сервисах AWS с NASA будет взиматься плата каждый раз, когда они предоставляются.
«Это означает, что EDSIS несёт затраты на доступ к данным в облаке. В конечном итоге ESDIS будет нести ответственность как за облачные расходы, включая расходы на предоставление данных, так и за расходы на эксплуатацию 12 центров DAAC», — отмечено в отчёте об аудите. В результате, как утверждается в документе, к 2025 году расходы NASA на облачные вычисления увеличатся примерно на $30 млн в год в дополнение к указанным в контракте с AWS ежегодным выплатам в размере $65 млн.
Отметим, что проблема корректного, пусть даже приблизительного расчёта стоимости услуг для хоть сколько-нибудь крупного проекта актуальна для всех облачных провайдеров. Впрочем, для действительно крупных клиентов последние предоставляют особые, упрощённые условия. NASA к таковым, видимо, не относится.