Найти тему

Хранение данных в ДНК

Оглавление


По некоторым прогнозам уже в ближайшем будущем количество информации на Земле достигнет 175 зетабайт (175 миллиардов терабайт). Это означает, что хранение данных станет все более дорогим, современные технологии не считаются надежными для хранения такого количества данных.

Но сейчас развивается новое направление - хранение информации в синтетических молекулах ДНК.

Механизм

Молекулы ДНК хранят генетическую информацию о живых организмах, состоят из длинной цепочки нуклеотидов четырех видов: аденин (А), тимин (Т), гуанин (G), циазин (C). Последовательность нуклеотидов - это четырехзначный код, который содержит данные об организмах. Цифровая информация записана виде единиц и нулей, а информация в ДНК из четырех нуклеотидов. Необходимо перевести зашифрованную информацию из двоичной системы в четверичную, создать цепочку (секвенировать), и после поместить на искусственную или натуральную молекулу.

Созданный ДНК код собирается в молекулу ДНК с помощью биологических реакций - получается искусственная ДНК молекула. Обычно синтезируются короткие фрагменты, так как это быстрее и проще, а после они собираются в блоки в едином хранилище.

ДНК разлагаются, и их необходимо хранить в специальных условиях, для этого применяют специальные растворы. ДНК хранятся «в стекле», но некоторые компании сохраняют молекулы в бактериях (в живых организмах).

Для того, чтобы прочесть ДНК нужно использовать полимеразную цепную реакцию, ферментами информация многократно копируется, до тех пор, пока не станет видимой.

После этого необходимо секвенирование - составление последовательности нуклеотидов. Изначально необходимы были химические реакции, этот метод был длительным и сложным, но появились инновационные способы, менее затратные и быстрые.

Секвенированные данные переводят в двоичный код, понятный компьютеру.

-2

Преимущества

ДНК являются наиболее плотной технологией хранения данных. Плотность хранения в 1009 раз больше, чем в жестком диске. Правда, такая плотность пока не достигнута, но разработчики постоянно увеличивают плотность хранения данных. В 2012 году технологии позволяли хранить информацию с плотностью в сто раз меньшей, чем позволяют современные технологии.

Кроме этого огромным преимуществом ДНК хранения является его долгосрочность, как известно ученые умеют расшифровывать ДНК живых организмов, живших десятки тысяч лет назад. При температуре 9 градусов ДНК могут быть сохранены 2000 лет, при - 18 градусов - более 2000 столетий. Магнитные летны, например, хранятся 30 лет.

ДНК хранилище легко использовать, и оно будет актуальным через много лет. Строение ДНК постоянно уже 3 млрд. лет, и человек всегда найдет доступ к подобной информации. Такому методу не грозит устаревание, как цифровым технологиям. Иногда мы не можем прочитать данные с дискеты, не найдя подходящего дисковода.

Эта технология экологична, в отличие от цифровой. Сервера оставляют углеродный след, который равен всему объему углерода, производимому всеми самолетами мира. К тому же ДНК не нужно электричество.

Недостатки

У хранения данные в ДНК есть и свои недостатки. Например, дороговизна, для загрузки 1 мегабайта понадобится 1$. Конечно компании стараются снизить эту стоимость. Наиболее дорогой частью технологии считается синтез искусственной ДНК - молекулы.

Но сейчас синтезированием ДНК- молекул занимаются и другие индустрии - биология, медицина. Это дает веру в ускорение развития технологии. На основе этих молекул создаются вакцины, полезные бактерии.

Это приводит к уменьшению стоимости синтезирования молекулы, за 30 лет технология подешевела в 10 миллионов раз.

Еще одним способом решения проблемы высокой стоимости является использование натуральных ДНК-молекул вместо искусственных. Ученые из Гарвардского университета в 2017 году, использовав технологию CRISPR, записали анимацию в ДНК живых бактерий. Эта технология дает возможность бактериям вырабатывать иммунитет в ответ на вирус. Но, к сожалению, такая молекула может мутировать, а это негативно отражается на надежности хранения.

У такой технологии еще очень низкая скорость работы. Пользуясь компьютером, мы постоянно имеем доступ к данным, но в ДНК технологиях нет быстрого доступа и способа быстрого извлечения данных.

Ну и устройства для загрузки и выгрузки информации не очень компактны, например, могут быть размером с кухню. Но у компаний есть амбициозная цель - создать на чипе лабораторию с резервуарами ДНК.

-3

Что такое ДНК

ДНК - это полимерная молекула, которая выглядит как двойная спираль. Нити которой являются цепочками нуклеотидов. Нуклеотид состоит из: азотистого основания, сахара и остатка фосфорной кислоты. Сахар и ортофосфорная кислота не отличаются в отдельных нуклеотидах, а азотистых оснований есть четыре вида : аденин (А), гуанин (Г), тимин (Т) и цитозин (Ц).

Азотистые основания одной нити могут быть расположены как угодно, но последовательности нуклеотидов обоих нитей взаимозависимы. Нити соединены водородными связями, которые соединяют азотистые основания, которые располагаются друг напротив друга. Только определенные основания создают пары - аденин (А) соединяется с тимином (Т), а цитозин (Ц) - с гуанином (Г).

Последовательность оснований - это генетическая информация.

ДНК хранится в хромосомах, а хромосомы - в ядрах клеток.

Чтобы прочесть и воссоздать информацию ДНК, необходимо перенести ее на РНК (рибонуклеиновую кислоту) - это называется транскрипцией. РНК в отличие от ДНК состоит из одной цепи с той же последовательностью азотистых оснований. Вместо тимина там будет урацил (У).

Основания можно записать как текст, состоящий из четырех букв. Клетка считывает этот текст тройками букв (триплетами или кодонами). Выделенный участок начинается со «старт-кодона» - АУГ - начинается синтез белка. Следующие каждые три основания обозначают конкретную аминокислоту. «Стоп-кодонов» есть три варианта - УАА, УАГ и УГА.

Белки состоят из аминокислот, а мы из белков. Процессы в нашем теле связаны с работой белков. Все ферменты, часть гормонов - это белки. Синтез белков обеспечивает жизнь и рост организма. Таким образом тройки букв кодируют многие процессы в нас.

Каждый отдельный участок ДНК, являющийся характеристикой организма - это ген, единица передачи наследственной информации.

О Biomemory

Это сайт Biomemory - https://www.biomemory.com

Они специализируются на устойчивых решениях для хранения. Это ведущий высокотехнологичный стартап, специализирующийся на исключительно основанным на ДНК хранении данных. Это французский стартап и предлагает он уникальные DNA card, размером с кредитку, хранящую килобайт данных. ДНК хранится в чипе карты DNA card. ДНК нить засушивается и размещается в карте. Компания была основана в 2021 г.

Существенный вклад окажет взаимодействие с ведущими игроками в области хранения данных, чтобы обеспечить растущий спрос на высокоплотное хранение, предохраняя нашу планету от излишнего потребления энергии - считает руководство Biomemory.

Компания собрала прекрасную команду ученых. Например, доктор Доминик Лок, который возглавлял Биологию контроля болезней в отделе растениеводства Байер и был директором Инжиниринга клеточной стенки в национальной лаборатории Лоуренс Беркли 10 лет принесет специализированные инновации в команду биотехнологий Biomemory, которые обеспечат помощь в оптимизации процессов.