Найти в Дзене

Анализ данных секвенирования старого и нового поколения NGS (ч.2)

Начало понимания

Можно только условно рассматривать секвенирование старого поколения как секвенирование участков геномов и секвенирование NGS, как полногеномное секвенирование.

Как я уже писала, ДНК, из которой состоят наши гены и геномы, - это последовательность нуклеотидов, и их может быть 4 варианта А, Т, Г, Ц, а секвенировать - это и значит в упрощенном виде понять последовательность этих четырех букв.

На секвенировании первого поколения, скажу честно, открывали и читали вручную, не доверяя машинам и сравнивая с близкородственными, потому что в одной точке может быть несколько пиков. Опять же секвенируется всё с перекрытием в несколько повторов, поэтому если в 5 повторах одна буква, а в двух других другие, то очевидно, что побеждает большинство.

И это было возможно, когда ты взял один ген, который у бактерии около 1-1,5 тпн (тысяч пар нуклеотидов).

Когда участок большой, так нельзя, надо иметь уже софт, которому доверяешь качество прочтения и сборки разных копий повторов - в один большой контиг.

Для того, чтобы понимать, что вы видите, нужно вспомнить генетические термины: мутации могут быть заменами одних нуклеотидов на другие, вставками (инсерциями), потерями нуклеотидов (делециями) - если сравнивать несколько близкородственных последовательностей.
Для того, чтобы понимать, что вы видите, нужно вспомнить генетические термины: мутации могут быть заменами одних нуклеотидов на другие, вставками (инсерциями), потерями нуклеотидов (делециями) - если сравнивать несколько близкородственных последовательностей.

Ещё нужно помнить, что разные методы секвенирования отличаются разной точностью, разной стоимостью и разной скоростью.

-3

Когда вы сравниваете разные последовательности - это называют выравниванием.

-4

И, помним, что три нуклеотида (триплет) соответствуют одной аминокислоте в белке, а секвенировать мы можем и экзом (кодирующую часть ДНК, только гены у эукариот) и РНК (транскриптом).

взгляд генетика

На самом деле, взгляд биологов, медиков и программистов заметно разный. Но нам ничто не мешает углубиться.

Какие компании и что нам предлагают в качестве оборудования

Начну издалека, от Адама и Евы, - первым аппаратом на пути к получению секвенируемых участков явился амплификатор, упомянутая в ч.1 ПЦР-машина. Методы амплификации — создания множественных копий фрагмента нуклеиновой кислоты — берут свое начало от полимеразной цепной реакции, изобретенной Кэри Муллисом с использованием тех самых термостабильных ферментов, полученных первоначально у архебактерий. Ибо нормальные ферменты не очень любят температуры выше 40 гр по С. Их выпускают много где, и в России тоже (знаменитая ДНК-технология).

Терцик, ностальгия
Терцик, ностальгия

Первые автоматизированные секвенаторы были представлены Applied Biosystems в 1987 и использовали метод Сэнгера. Этот метод лежит в основе секвенаторов первого поколения. С его помощью был завершен проект «Геном человека» в 2001 году (полное чтение генома человека). Установки первого поколения представляли собой автоматизацию электрофорезных систем, которые определяли миграцию меченых фрагментов ДНК в геле, разделяя их по массе (длине).

Тоже ностальгия
Тоже ностальгия

В 2016 году бесспорное лидерство на рынке геномного секвенирования уже принадлежало американской компании Illumina, разработавшей модельный ряд флуоресцентных секвенаторов.

-8

Второе место в 2016 году занимала американская компания Thermo Fisher Scientific, развивающая полупроводниковую технологию секвенирования ДНК. Их секвенатор Ion S5, несмотря на сравнительно скромную производительность (до 12 Gb), вполне достойно конкурировал с настольными секвенаторами компании Illumina в нише таргетного (клинического) секвенирования.

Полупроводниковый секвенатор Ion S5
Полупроводниковый секвенатор Ion S5

В сентябре 2017 года компания BGI объявила о начале приёма заявок на секвенирование геномов по $600, что сразу же вывело Китай в лидеры геномных гонок. Этот прорыв стал возможен благодаря созданию CNGB (China National GeneBank) — крупного центра, располагающего 150 флуоресцентными китайскими секвенаторами BGISEQ-500.

-10

Правда, производительность одного американского NovaSeq 6000 равна производительности 50…60 китайских BGISEQ-500. Поэтому самым крупным центром секвенирования на сегодняшний день можно считать китайскую же компанию Novogene, которая в начале этого года приобрела сразу 25 NovaSeq 6000. Их суммарная производительность составляет около четверти миллиона геномов в год. Цифра впечатляющая, но если ежегодно секвенировать по 0,3 миллиона геномов (~0,05 млн. в CNGB плюс ~0,25 млн. в Novоgene), то на секвенирование 100 миллионов геномов в рамках стартовавшей в прошлом году программы «China Precision Medicine Initiative» (2016…2030 г.г., $9,2 млрд.) потребуется больше 300 лет. И чтобы уложиться в отведённые сроки (до конца 2030 года) китайцам придётся построить и оснастить секвенаторами ещё несколько десятков подобных центров.

В начале 2017 года в продаже появились миниатюрные нанопоровые секвенаторы MinION, а в мае – GridION X5, разработанные компанией Oxford Nanopore Technologies (ONT, UK). Наиболее производительная модель (PrometION) проходит бета-тестирование в нескольких геномных центрах и должна появиться в продаже в ближайшие месяцы.

-11

Сравнительно низкая точность нанопорового секвенирования (~90% при однократном чтении) не позволяет этим приборам конкурировать с флуоресцентными секвенаторами (точность ~99,9% при однократном чтении) при определении точечных мутаций (Single Nucleotide Polymorphisms, SNPs), но большая длина ридов (>10 000 п.о.) делает их незаменимыми при картировании полиморфизмов типа Copy Number Variations (CNVs). Кроме того, нанопоровые секвенаторы неплохо справляются с идентификацией вирусов и бактерий, оценкой их лекарственной устойчивости, анализом транскриптомов, HLA-типированием, установлением отцовства и со многими другими задачами таргетного секвенирования, что позволяет им успешно бороться за эти ниши рынка NGS (Next Generation Sequencing).

Вмешательство в геномные гонки Китая и Великобритании обострило конкурентную борьбу. Это ещё не отразилось на ценах таргетного секвенирования, но стоимость секвенирования генома человека за последний год уменьшилась на 40% (с $1000 до $600).

Стоит ли России участвовать в геномных гонках, или проще подождать появления дешёвых китайских, английских или американских секвенаторов? Но такое ожидание может сильно затянуться. Да и за державу обидно. Этим определяется актуальность рассмотрения вопроса о возможности разработки отечественного секвенатора и его обеспечения расходными материалами и реагентами.

Основная цель такой разработки — «догнать и перегнать Америку» (а также Китай, Великобританию, Южную Корею, Австралию, Саудовскую Аравию и т.д.). Или хотя бы только догнать. Или даже не догнать, а просто постараться сделать секвенирование в России более доступным. В первую очередь – добиться импортозамещения хотя бы части расходных материалов и реагентов. Сложнее будет скопировать секвенаторы. Но можно не просто копировать зарубежные разработки, а попытаться их улучшить. А если не улучшить, то хотя бы удешевить. Задача не слишком амбициозная, зато выполнимая.

Один из проектов подобного рода прорабатывался четырьмя институтами Сибирского отделения РАН (2012…2014 г.г.), которые безуспешно пытались освоить технологию секвенирования SMRT (Pacific Bioscience, USA). Ещё можно упомянуть о двух попытках разработать мономолекулярную технологию секвенирования, основанную на рамановской спектроскопии – в Черноголовке (ООО «ИнСпектр», 2010…2012 г.г.) и в Зеленограде (ООО «Нано Вижин», 2013…2014 г.г.) – и о зеленоградском же проекте RuSeq, нацеленном на совершенствование технологии tSMS (Helicos, USA).

Понятно, что при выборе осваиваемых (копируемых/улучшаемых/"передираемых") технологий NGS нужно учитывать перспективы их развития. И, учитывая крайне ограниченные возможности, оценивать эти перспективы только для трёх наиболее совершенных технологий – флуоресцентной, полупроводниковой и нанопоровой.

1. Флуоресцентная технология

Секвенаторами в данном случае служат прецизионные сканирующие эпифлуоресцентные микроскопы, оснащённые системой подачи реагентов в проточные ячейки. Характерной особенностью последних моделей является упорядоченность расположения субмикронных кластеров ДНК (Illumina, NovaSeq 6000) или ДНК-наноболлов (BGI, BGISEQ-500) в одноразовых проточных ячейках.

Собирать подобные микроскопы в России придётся в основном из импортных комплектующих, поэтому стоить они будут не дешевле китайских аналогов. Правда, аналоги эти пока не продаются, но через 2…3 года, скорее всего, будут доступны и у нас. Поэтому лучше ориентироваться не на разработку флуоресцентных секвенаторов, а на освоение производства их расходных комплектующих и реагентов — проточных ячеек и меченых нуклеотидов. Если, конечно, флуоресцентные технологии через несколько лет не будут заменены люминесцентными.

2. Полупроводниковая технология

Компания Thermo Fisher Scientific потратила на приобретение полупроводниковой технологии секвенирования миллиарды долларов. Теперь обострение конкурентной борьбы требует резкого снижения цен, и вернуть потраченные миллиарды, тем более с прибылью, ей вряд ли удастся. Сторонних разработчиков подобные проблемы не волнуют, поэтому для них полупроводниковая технология по-прежнему сохраняет привлекательность. Особенно если удастся воспользоваться готовыми pH-сенсорными чипами, на разработку которых были потрачены миллионы долларов.

 pH-сенсорные чипы полупроводникового секвенатора S5
pH-сенсорные чипы полупроводникового секвенатора S5
-13

3. Нанопоровая технология

Первый нанопоровый секвенатор MinION похож на первый блин — уже «съедобен», но следующие должны получиться намного лучше. Точность чтения у него не более чем удовлетворительная, да и то не для всех приложений. Что касается производительности, то для секвенирования геномов её явно недостаточно, поскольку на каждый геном приходится тратить не меньше пяти одноразовых ячеек стоимостью от $500 до $900 (в зависимости от их количества в заказе).

В ячейках MinION встроены чипы, усиливающие и оцифровывающие сигналы (пикоамперные токи) от 512 нанопор.

Для большинства задач таргетного секвенирования производительность MinION (5…10 Gb) явно избыточна. Поэтому компания ONT планирует выпустить на рынок MinION Dx (или FLONGLE) – модификацию MinION с адапторной вставкой для ячеек на 128 или 256 пор.

-14

Компактный нанопоровый секвенатор (SmidgION), подключаемый к смартфону (iPhone7...X)

-15

Дешёвое и доступное для всех нанопоровое секвенирование способно изменить весь рынок NGS (а заодно и весь мир). Но эта способность проявится в полной мере только после появления достойных конкурентов. Одним из таких конкурентов может стать компания Roche Sequencing, разрабатывающая собственную технологию нанопорового секвенирования с 2014 года. Судя по некоторым публикациям и сообщениям в Интернете, скоро могут появиться и другие конкуренты.

Каждый прибор и каждая проточная ячейка привязывается к конкретному пользователю, за которым стоит фактический адрес лаборатории, где он работает и проводит исследования. При этом компания Oxford Nanopore Technologies может получить информацию о местонахождении каждого прибора.
• Санкционная политика: перед поставкой продукции компания Oxford Nanopore Technologies проводит проверку каждой организации и новых конечных пользователей.
• Во избежание попадания в Список запрещенных к отгрузкам лабораторий запрещается передавать продукцию Oxford Nanopore Technologies третьим лицам.

Цитируем довоенный послекрымский хабр: "Интересно, что в соответствии вышеупомянутым «Списком запрещённых к отгрузкам лабораторий» компания ONT недавно отказалась продать MinION таким «военизированным» организациям как МГУ и СПбГУ".

Roche Швейцария, американская Life Technologies (сейчас Thermo Fisher Scientific) производит под брендами Applied Biosystems и Ion Torrent, американская Illumina NGS-компания, PacBio (США) NGS-одномолекулярные технологии, китайская MGI секвенирование "наношариками".
Roche Швейцария, американская Life Technologies (сейчас Thermo Fisher Scientific) производит под брендами Applied Biosystems и Ion Torrent, американская Illumina NGS-компания, PacBio (США) NGS-одномолекулярные технологии, китайская MGI секвенирование "наношариками".

Китайцы своими DNA nanoball sequencing технологиями понятно и ожидаемо отрабатывали секвенирование коронавируса, MGISEQ-2000 используется in single-cell RNA sequencing для исследования патогенеза COVID-19 patients, как опубликовано в Nature Medicine.

В Табл. не упомянуты британские нанопоры Oxford Nanopore Technologies Limited, но мы о них сказали, и американская Beckman Coulter Inc., которая ранее производила капилярные секвенаторы на основании прерывания цепи, а сейчас производит системы секвенирования и анализа с использованием красителя-терминатора.

Ещё новости с фронтов, конец 22г.: "Российское представительство американского производителя научного оборудования Thermo Fisher Scientific подала заявление о ликвидации юридического лица в России.

В марте 2022 г. из-за прекращения поставок реагентов российские исследовательские центры, использующие оборудование Thermo Fisher, столкнулись с трудностями. В случае полного ухода компании из страны больше всего пострадают учреждения здравоохранения и научные лаборатории.

В июне 2022 года российский завод по производству лабораторного пластика Thermo Fisher Scientific перестал поставлять продукцию дистрибьюторам. Персонал был уволен по соглашению сторон".

Продолжение рассказа о высоких медбио технологиях следует..