Англо-русский технический словарь Прочтение Следующего Поколения (ПСП).

13 июля 202413 июл 2024

10 мин

Еще раз это англо-РУССКИЙ словарь. Для тех кто не знает что такое прочтение ДНК или секвенирование, то ознакомится с материалом можно тут. Adapters - Переходники. Короткие особенные последовательности олигонуклеотидов. Их приклеивают к 5ʹ и 3′ концам каждого кусочка шаблона для создания библиотеки для прочтения. В итоге у каждого шаблона будет два переходника на обоих концах молекулы. У всех молекул ДНК в смеси будут одни и те же два переходника. На поверхности проточной ячейки находятся взаимодополняющие одноцепочечные половинки этих переходников (P5 и P7). Alignment - Сравнивание. Полученное прочтение сравнивают с эталонным геномом. Эталонный ген будет таким ATTCGGCTGAAATCGGCAT, а машина прочитала и выдала вам такую последовательность TAAATCGGCAT. Ваш кусочек ДНК это конец эталонного гена, но первое основание другое чем в эталонном гене, у вашего образца произошла мутация. Base - Основание. Азотистые основания: аденин (A), гуанин (G), цитозин (C), и тимин (T) из которых

Еще раз это англо-РУССКИЙ словарь. Для тех кто не знает что такое прочтение ДНК или секвенирование, то ознакомится с материалом можно тут.

Adapters - Переходники. Короткие особенные последовательности олигонуклеотидов. Их приклеивают к 5ʹ и 3′ концам каждого кусочка шаблона для создания библиотеки для прочтения. В итоге у каждого шаблона будет два переходника на обоих концах молекулы. У всех молекул ДНК в смеси будут одни и те же два переходника. На поверхности проточной ячейки находятся взаимодополняющие одноцепочечные половинки этих переходников (P5 и P7).

Alignment - Сравнивание. Полученное прочтение сравнивают с эталонным геномом. Эталонный ген будет таким ATTCGGCTGAAATCGGCAT, а машина прочитала и выдала вам такую последовательность TAAATCGGCAT. Ваш кусочек ДНК это конец эталонного гена, но первое основание другое чем в эталонном гене, у вашего образца произошла мутация.

Base - Основание. Азотистые основания: аденин (A), гуанин (G), цитозин (C), и тимин (T) из которых состоит ДНК. Они образует только такие пары: C-G и А-Т.

Base calling - Определение основания. Процесс, с помощью которого во время прочтения определяется порядок оснований в шаблоне.

Cluster - Объединение. Группа, состоящая из клонов шаблона, прикрепленной к поверхности проточной ячейки. Каждое объединение засевается одной нитью шаблонной ДНК и клонируется с помощью наращивания мостиком до тех пор, пока объединение не наберет ~1000 копий. Каждое объединение на ячейке производит одно прочитывание. Например, 10 000 объединений на проточной ячейке дадут 10 000 одиночных прочитываний и 20 000 парных прочитываний.

Cluster generation/bridge amplification - Наращивание объединений/наращивание мостиком. Реакция наращивания шаблона на поверхности проточной ячейки. При изготовлении ячейки ее поверхность покрывается газоном из двух различных олигонуклеотидов, часто называемых "P5" и "P7". На первом этапе наращивания мостиком, в ячейку загружается одноцепочечная библиотека для прочтения, на обоих концах шаблона приклеены переходники. Шаблоны сцепляются переходниками с дополняющими их олигонуклеотидами "P5" и "P7", по мере того, как они "текут" по газону из "P5" и "P7". Когда переходник на конце шаблона прикрепляется к одному из олигонуклеотидов на газоне ячейки, происходит грунтовка. Так как второй из переходников свободно "торчит вверх", то ДНК изгибается и свободный переходник тоже прикрепляется к дополняющей его олигонуклеотидной цепочке на газоне, таким образом образуется полукруглый мостик. Повторяющиеся шаги ПЦР, приводят к местному наращиванию количества одной копии молекулы ДНК на одном участке газона. Наращенная масса и есть объединение.

Color balance - Цветовой баланс. Другое название разнообразия оснований.

Coverage distribution - Распределение покрытия. Процент оснований, прочитанных по всему геному или целевому региону на заданную глубину (например, 95% оснований, покрытых минимум 10× раз). Средняя глубина прочтений сама по себе (например, покрытие 30×) не учитывает процент оснований, прочитанных ниже приемлемых пороговых значений или же тех оснований, которые не были прочитаны вообще. Распределение покрытия на 95 % при минимальном уровне покрытия 10×, означает, что 5 % оснований были ниже порога в 10× или же не были покрыты вовсе.

Coverage level/depth - Уровень покрытия/глубина. Среднее количество прочтений, которые покрывают известный эталонный геном. Например, прочтение всего генома с покрытием 30× означает, что в среднем каждое основание в геноме было прочитано 30 раз. При более высоком уровне покрытия можно с большей степенью уверенности определять основания.

Flow cell - Проточная ячейка. Нечто наподобие предметного стекла с одной, двумя или восемью физически разделенными дорожками, используемая в качестве расходного материала в приборах для ПСП. Короткие цепочки ДНК - P5 и P7 закреплены на ячейке. Они предназначены для облегчения доступа шаблона к ферментам, которые этот шаблон будут размножать. Наращивание объединений создает до 1000 идентичных копий каждой отдельной молекулы шаблона в непосредственной близости друг от друга. Достигается плотность порядка десяти миллионов объединений на квадратный сантиметр.

Indexes/barcodes/tags - Указатели/штрих-коды/метки. Указатели указывают на то из какого образца то или иное прочтение. Уникальная короткая последовательность ДНК, добавляемая к каждому шаблону во время подготовки библиотеки. Обычно шаблону из одного образца дают одни и те же указатели. Например, исследуют микробиоту во орту у Васи и Пети. У них взяли образцы слюны изо рта. Выделили ДНК и получили смесь ДНК разной длины из всех живущих во рту микробов. ДНК в обоих образцах разбивают на кусочки поменьше. В получившийся шаблон Пети добавляют указатели 1 и 2, в шаблон Васи указатели 1 и 4. Оба шаблона имеют уникальные указатели. Теперь образцы можно смешать в одну смесь - библиотеку и прочитать одновременно на приборе ПСП. Все микробы изо рта Васи будут с указателями 1 и 4, а миркобы (книги) Пети с 1 и 2. Перед окончательным анализом данных прочтений из объединенной библиотеки определяются и сортируются шаблоны вычислительным путем на основе их указателей. Смешивание библиотек с использованием указателей позволяет экспоненциально увеличить количество образцов, анализируемых за один раз, без резкого увеличения стоимости и времени анализа.

Index hopping - Прыгающие указатели. Когда шаблон помечен указателями например 1 и 2, но прочтение зачисляют на счет указателей 1 и 4.

Insert - Вставка. В процессе подготовки библиотеки шаблон разбивается на части, и кусочки определенного размера (обычно 200–500 пар оснований, но могут быть и больше) склеиваются или "вставляются" между двумя переходниками. Исходные кусочки шаблона также называются "вставками".

Library - Библиотека. Набор кусочков ДНК, подготовленных для прочтения.

Library preparation - Подготовка библиотеки. Молекулярно-биологический процесс, который превращает шаблон в библиотеку, путем смешения в одну смесь разных шаблонов из разных образцов. Смесь затем можно прочитать на приборе ПСП. Из разных образцов (воды, земли, фекалий, вагинальный мазков, слюны, и т. д.) достают ДНК, которая теперь зовется шаблоном. Первым шагом в создании библиотеки является разбивание шаблонов на случайные кусочки, за которой следует приклеивание 5ʹ и 3′ переходников к каждому кусочку.

Massive parallel sequencing - Массивное параллельное прочтение ДНК. Другое название ПСП.

Multiplexing - Смешивание. Прочитывание нескольких указателей одновременно. Процесс, при котором к каждому кусочку шаблона в процессе подготовки библиотеки добавляются уникальные короткие последовательности ДНК - "указатели". Указатель указывает на ДНК из одного и того же образца. Указатели позволяют объединить множество шаблонов и проводить прочтение одновременно. Смешивание - полезная методика при работе с небольшими геномами или нацеливании на интересующие геномные регионы.

Next-generation sequencing (NGS) - Прочтение Следующего Поколения (ПСП). Определение порядка оснований (ATGCCGAAGGTT или ACCCATGGTGCCTA и т.д.) в целых геномах или целевых участках ДНК или РНК.

Nucleobase - Нуклеотид. Другое название основания. Длину прочитанных участков ДНК или всего генома указывают в парах нуклеотидов ( п.н.).

Nucleotide diversity - Разнообразие оснований. Равномерное распределение оснований A, C, G и T во всех кусочках ДНК в библиотеке. Цветовой баланс необходим для эффективного анализа изображений на системах прочтениях Illumina. Поэтому для подготовки библиотек Illumina включает в себя разбивание больших кусков ДНК на мелкие кусочки. Этим добиваются разнообразия оснований.

Oligonucleotide/oligo - Олигонуклеотид/олиго. Короткая последовательность ДНК или РНК, маленький кусочек ДНК или РНК.

Paired-end sequencing - Парное прочтение. Процесс прочтения с обоих концов кусочка ДНК в одном цикле.

Primer - наводка. Наводки это взаимодополняющие шаблонную ДНК короткие цепочки/последовательности ДНК, которые наводят ДНК-полимеразу на цель.

Priming - Грунтовка, подготовка. Начальный этап процесса прочтения ДНК, на котором короткие последовательности ДНК, известные как наводки, прикрепляются к цели, чтобы начать производство ДНК под действием ДНК-полимеразы.

Quality score/Q-score - Оценка качества. Метрика в NGS, которая предсказывает или оценивает вероятность ошибки при определении базы. Высокая оценка означает, что определение базы было надежно и вероятность ошибки низкая.

Reference genome - Геном-ссылка, эталонный геном. Ранее полностью прочитанный и собранный воедино геном, который служит основой для сравнивания прочтений. Первый шаг анализа данных.

Sensitivity - Чувствительность. Способность обнаружить определенный вариант аллеи в исследуемом образце. Чем реже встречается аллея, тем выше чувствительность, необходимая для его обнаружения. Прочтение нового поколения обеспечивает более высокую чувствительность, чем капиллярный электрофорез, и позволяет выявлять редкие мутации.

Sequencing by synthesis (SBS) - Прочтение путем синтеза (ППС). Технология ППС использует четыре флуоресцентно меченых нуклеотида для одновременного прочтения десятков миллионов объединений на поверхности проточной ячейки. Во время каждого цикла прочтения к цепочке нуклеиновой кислоты добавляется один меченый дезоксинуклеотидтрифосфат (dNTP). Нуклеотидная метка служит "обратимым окончанием" полимеризации: после присоединения dNTP флуоресцентный краситель-метка определяется с помощью лазерного возбуждения и визуализации, а затем ферментативно расщепляется, чтобы обеспечить следующий цикл присоединения. Вызов оснований осуществляется непосредственно на основе измерений интенсивности сигнала во время каждого цикла.

Sequencing primer - Заготовка для прочтения. Маленький кусочек ДНК, короткая последовательность ДНК. Заготовка примыкает к переходнику и является начальной точкой для прочтения ДНК. Фермент ДНК-полимераза связывается с этим участком и встраивает взаимодополняющее основание за основанием в растущую противоположную нить ДНК.

Sequencing reads - Прочтения. Строки данных, состоящие из оснований A, T, C и G, соответствующие каждому кусочку ДНК в библиотеке. В технологии Illumina при прочтении библиотеки каждый кусочек ДНК образует объединение на поверхности проточной ячейки, и каждое объединение производит одно считывание при прочтении. (Например, 1 миллион объединений на проточной ячейке дает 1 миллион одиночных прочтений и 2 миллиона парных прочтений). Длина считывания может меняться от 25 п.н. до 300 п.н. и выше в зависимости от потребностей.

Signal intensity - Мощность сигнала. То как ярко светят флуорофоры, прикрепленных к субстрату. Основания, меченые светящейся краской. При прочтении машина определяет какое основание светится, измеряя мощность сигнала во время каждого цикла ПЦР.

Tagmentation - Размечивание (РАЗдробление/РАЗбивание+поМЕЧИВАНИЕ). Быстрая ферментативная реакция, в ходе которой ДНК одновременно разбивается на кусочки и помечается переходниками Illumina и наводками для ПЦР. Два события в одной реакции.

Target - Цель. Это конкретная область или последовательность в шаблонной ДНК, которую вы хотите приумножить или прочитать. Это может быть ген или любой другой сегмент ДНК, представляющий интерес. В ПЦР наводки предназначены для связывания с целевой последовательностью ДНК, чтобы ее можно было избирательно приумножить. В некоторых обстоятельствах шаблон и цель может быть одним и тем же.

Target size - Размер цели. Средний размер всех целевых участков ДНК для прочтения. Размеры целей в разных заранее разработанных панелях, созданных по индивидуальному заказу, могут различаться. (Например, панель из 22 целевых участков, где каждый целевой участок составляет 100 кб, будет иметь общий размер цели 2200 кб).

Template - Шаблон. Кусок ДНК, который хотят прочитать и узнать последовательность оснований. В ПЦР, например, шаблонная ДНК — это исходная последовательность ДНК, которая служит чертежом для создания новых нитей ДНК. В некоторых обстоятельствах шаблон и цель может быть одним и тем же.

Throughput - Пропускная способность. Количество данных, получаемых с помощью прибора для прочтения ДНК нового поколения. Обычно определяется в мегабазах (Мб) или гигабазах (Гб). 1 мегабаза = 1 000 000 оснований. 1 гигабаза = 1 000 000 000 оснований.

Unique dual indexes - Уникальные двойные указатели. Пары коротких кусочков ДНК, в которых каждый указатель i5 и каждый указатель i7 используются только один раз. С их помощью можно определить и отфильтровать обозначенные прыгающие прочтения, что обеспечивает более высокую достоверность смешанных шаблонов.

Whole-genome sequencing - Полногеномное прочтение. Метод, позволяющий получить представление обо всем геноме, прочитывая основание за основанием всего генома -> ATCCGGAATAACGAT.

Источник: Illumina

Ставя палец вверх и подписываясь, Вы помогаете мне продвигать настоящую науку.

Предыдущая статья: Освещая тайны мозга червя: цветной атлас нейронов.

Общество

14,16 млн интересуются