В 2020 году каждый человек производит около 1,7 мегабайта данных каждую секунду. Всего за один год это составляет 418 зеттабайт или 418 миллиардов жестких дисков емкостью один терабайт, сообщает Phys.org
В настоящее время мы храним данные как единицы и нули в магнитных или оптических системах с ограниченным сроком службы. Между тем центры обработки данных потребляют огромное количество энергии и оставляют огромный углеродный след. Проще говоря, способ хранения постоянно растущего объема данных неустойчив. Но есть альтернатива: хранение данных в биологических молекулах, таких как ДНК. В природе ДНК кодирует, хранит и делает читаемыми огромные объемы генетической информации в крошечных пространствах (клетки, бактерии, вирусы) - и делает это с высокой степенью безопасности и воспроизводимости.
По сравнению с обычными устройствами хранения данных ДНК более долговечна и компактна, может хранить в десять раз больше данных, имеет в 1000 раз более высокую плотность хранения и потребляет в 100 миллионов раз меньше энергии для хранения того же объема данных, что и диск. Кроме того, устройство для хранения данных на основе ДНК будет крошечным: глобальные данные за год могут храниться всего в четырех граммах ДНК.
Один из способов - использовать отверстия наноразмеров, называемые нанопорами, которые бактерии пробивают в других клетки, чтобы разрушить их. Атакующие бактерии используют специализированные белки, известные как «порообразующие токсины», которые фиксируются на клеточной мембране и образуют через нее трубчатый канал.
Потенциал нанопор вдохновил ученых из Школы естественных наук EPFL исследовать нанопоры, образованные порообразующим токсином аэролизином, созданным бактерией Aeromonas hydrophila. Под руководством Маттео Дал Пераро из Школы естественных наук EPFL исследователи показывают, что нанопоры аэролизина могут использоваться для декодирования двоичной информации.
Исследователи использовали мутанты аэролизина для систематического создания нанопор для считывания сигналов своих информационных полимеров. Они оптимизировали скорость прохождения полимеров через нанопору, чтобы она могла выдавать однозначно идентифицируемый сигнал. «Но в отличие от обычных считывателей нанопор, этот сигнал обеспечивает цифровое считывание с однобитным разрешением и без ущерба для плотности информации», - говорит д-р Чан Цао, первый автор статьи.
Для декодирования считываемых сигналов команда использовала глубокое обучение, которое позволило им с высокой точностью декодировать до 4 бит информации из полимеров. Они также использовали подход для слепой идентификации смесей полимеров и определения их относительной концентрации.
Система значительно дешевле, чем использование ДНК для хранения данных, и обеспечивает более длительный срок службы. Кроме того, он «миниатюризируемый», что означает, что его можно легко включить в портативные устройства хранения данных.