История вопроса: когда флешки устареют
Сегодня кажется, что любой документ, фотография или фильм существуют где-то “в облаке” — но всё это огромные потоки нулей и единиц оседают в дата-центрах, превращаясь в ряды жёстких дисков. Хранилища становятся похожи на заводские кварталы: одно движение и что-то теряется, ломается, устаревает. А ведь с каждым годом человечеству нужно всё больше памяти для знаний, архивов, науки и сервисов.
Инженеры и учёные уже давно искали способ “упаковать” данные так же плотно, как это делает природа. Идея использовать молекулу ДНК возникала ещё в 1980-х, но только в последние пять лет она стала реально воплощаться — сначала в лабораториях, а теперь и в экспериментальных промышленных прототипах.
Как работает ДНК-хранилище
В основе технологии, простая и гениальная мысль: любую цифровую информацию можно закодировать с помощью четырёх “букв” ДНК, аденина (A), гуанина (G), тимина (T) и цитозина ©. Компьютерный файл для начала переводится в двоичный код, а затем этот набор нулей и единиц превращается в цепочку “генетических букв”, из которых потом синтезируется реальная молекулярная последовательность. Получившиеся ниточки ДНК заказывают у специальных биотехнологических компаний, которые и отправляют их заказчику в tubes — маленьких пробирках.
Крошечный объём — и фантастическая плотность: по оценке исследователей из университета Вашингтона и корпорации Microsoft, в одном грамме ДНК уместится 215 петабайт (215 000 000 гигабайт) данных. Можно сказать, что при теоретически идеальной организации — все знания интернета за год способны поместиться в коробку из-под обуви.
Сам процесс записи похож на алхимию: сначала готовят цифровой код, проводят его через алгоритмы помехоустойчивого шифрования (чтобы при ошибке в паре “букв” информация не потерялась), а затем “печатают” множество цепей ДНК с этими порядками. Чтение осуществляется с помощью секвенаторов — аппаратуры, похожей на ту, что используют генетики для анализа крови или тканей.
Возможности и ограничения: в чём революция и главная загвоздка
Выглядит это действительно как революция. Никаких движущихся частей, никакой магии электромагнитных волн, только молекулы и стеклянные пробирки. Эксперимент, проведённый совместно Microsoft и Университетом Вашингтона ещё в 2016 году, позволил зашифровать на ДНК полноформатное видео, исторический том Шекспира, картину и… вирус компьютерной игры Pac-Man. В 2022 Microsoft объявила об устойчивой работе макета архива на ДНК емкостью около 5 мегабайт: это немного, но для “полимерных флешек” — громадный шаг.
Но у ДНК-хранилищ есть и свои слабые стороны. Главное — скорость чтения. Даже с современными секвенаторами (вроде MinION, Illumina, Oxford Nanopore) процесс декодирования небольшого файла может занять часы, а для крупного архива — дни. Пока технология подходит для долгого хранения (архивов, библиотек, государственных реестров), но совершенно не годится для “горячих” облаков или быстрого поиска.
Вторая слабая сторона — цена. Несмотря на то, что стоимость синтеза ДНК падает каждый год, даже сегодня хранение 1 мегабайта данных стоит от 250 до 1000 долларов. Однако тренд явно идет к экономии: через 5–10 лет предполагается достижение “ценового порога”, когда архивирование государственных данных или редких научных знаний на ДНК выйдет дешевле магнитных лент.
Куда стремится технология
Мировые лидеры экспериментов — США (Microsoft, Университет Вашингтона), компания Catalog (США) и несколько команд в Германии и Японии. Российские компании и “курилки” институтов уже обсуждают, как использовать ДНК-хранение для национальных архивов, культурного наследия, уникальных данных медицинских клиник и регистров биобанков. В 2021–2023 годах МГУ, институты РАН и несколько коммерческих лабораторий (“БиоАрхив”, “Генотек”) тоже вели опытные зашифровки “мини-архивов” — публиковались отчёты о первых мегабайтах, записанных “на молекулу”.
Лондонский музей естественной истории заявил об оцифровке уникальных экспонатов с сохранением копии в ДНК. В России обсуждают возможность записи “золотого фонда” архивов, картин, чертежей, редких книг, на молекулярные носители для сохранности в перспективе сотен лет.
Кстати, срок “жизни” у молекулы ДНК, хранящейся без доступа к воде и при низкой температуре, по сути не ограничен. Хорошо сохранившиеся древние молекулы находят в зубах мамонтов или мумифицированных останках возрастом десятки тысяч лет. Это значит, что архив на ДНК переживёт не одну технологическую революцию.
Российский опыт и вызовы будущего
Уже сейчас российские институты проводят пилотные эксперименты. Физико-химический институт РАН опубликовал протоколы по кодированию на ДНК лабораторных записей, а в научно-популярных изданиях (“Наука в России”, РИА Новости) регулярно появляются подробные разборы о перспективах таких архивов именно для национальных задач.
В 2023 году коллектив МГУ смог записать стихотворение Пушкина и короткий фрагмент Мандельштама на цепочку ДНК, а затем спустя недели считать его обратно без ошибок. Это был чисто демонстрационный проект, который показал: технология работает не только в западных лабораториях.
Есть и вызовы: сложность интеграции ДНК-хранилищ в современные информационные системы, почти неподъёмная цена для обычных компаний и малых архивов, а также требования к безопасности и биохимической чистоте процесса.
Однако и в России, и во всём мире долгоиграющие архивы на ДНК становятся не вопросом фантастики, а стратегией хранения для “вечности”. Быть может, самый ценный архив будущего будет выглядеть совсем не как сервер с вентиляторами, а как простая пластиковая коробочка с прозрачной каплей внутри.
----------------------------------------
РЕКОМЕНДУЕМ ПОЧИТАТЬ: