Цель — собрать и кратко расшифровать используемые в сообществе генетических генеалогов термины и аббревиатуры, а также ресурсы. Если вы знаете дополнительный полезный для генетической генеалогии ресурс или считаете важным раскрыть термин, которого нет в этом глоссарии, напишите об этом в комментариях. Мы будем признательны за вклад в расширение и уточнение материала.
Цель — собрать и кратко расшифровать используемые в сообществе генетических генеалогов термины и аббревиатуры, а также ресурсы. Если вы знаете дополнительный полезный для генетической генеалогии ресурс или считаете важным раскрыть термин, которого нет в этом глоссарии, напишите об этом в комментариях. Мы будем признательны за вклад в расширение и уточнение материала.
...Читать далее
Оглавление
Цель — собрать и кратко расшифровать используемые в сообществе генетических генеалогов термины и аббревиатуры, а также ресурсы.
Глоссарий
Базовые понятия
- Генетическая генеалогия — применение ДНК‑тестов совместно с традиционными источниками для исследования родства.
- ДНК-генеалогия — направление, связывающее данные Y-DNA и мтDNA с историческими реконструкциями, этногенезом и миграциями; термин часто используют для обозначения популяризаторской школы А.А. Клёсовa.
- Генотип / гаплотип — набор наблюдаемых значений генетических параметров в тестируемых локусах. «Гаплотип» чаще употребляется для Y‑STR.
- Гаплогруппа (гг) — группа родственных линий, объединённых общей точечной мутацией (SNP) в конкретной линии наследования (Y или мтДНК).
- Родительская гаплогруппа — более древняя, вышестоящая в дереве гаплогруппа, от которой произошла рассматриваемая (downstream) ветвь; содержит всех потомков до следующего разделения.
- Клейд / клада / ветвь / подветвь — узел и ветвление на филогенетическом дереве (Y‑ или мт‑). В русскоязычной литературе чаще принято употреблять «ветвь/подветвь».
- MRCA (Most Recent Common Ancestor) / ОРА — ближайший общий предок двух (или более) тестируемых.
- TMRCA — время до MRCA, статистическая оценка (лет).
- ybp (years before present) — годы до настоящего времени, стандартная археогенетическая единица измерения времени.
- ВСЕ — «до нашей эры» (BCE, Before Common Era), используется для датировок в исторической и археогенетической хронологии.
- СЕ — «нашей эры» (CE, Common Era), используется для датировок в исторической и археогенетической хронологии.
- Эндогамия — многократные браки внутри ограниченной популяции, увеличивающее количество совпаденцев.
- Предковая редукция / педигри‑коллапс — совпадение предков в генеалогическом дереве из‑за родственных браков. Это уменьшает количество прямых предков. Например, в моей семье линии родителей пересекаются начиная с 8 поколения несколько раз и вместо расчетного 2n на поколение (n) цифра занижается.
- Палиндром — симметричный участок ДНК, последовательность нуклеотидов которого читается одинаково в прямом и обратном направлениях на комплементарных цепях; такие участки могут влиять на стабильность и механизмы репликации.
- Гомеоплазия — одинаковая мутация (SNP, indel) у неродственных линий, возникшая независимо в разных ветвях; может приводить к ошибкам в построении дерева.
- NPE означает «непредполагаемое отцовство» или «непредполагаемое родительское событие». Так называют ситуацию, когда оказывается, что один или оба родителя не являются генетическими родственниками человека.
- MPE синонимично NPE и может означать «неверно определённое отцовство».
- T2T (telomere-to-telomere) — новейшая сборка хромосомы от теломеры до теломеры без промежутков (gapless), самая актуальная для новейших референсных геномов.
- Сборка (assembly) / сборка генома — цифровая реконструкция полной последовательности генома или его части из прочтений (ридов) секвенирования; может быть черновой (draft) или законченной (complete).
- bp (base pair) — пар нуклеотидов/оснований
Типы тестов
- Y‑ДНК (Y-DNA) — по отцовской линии (Y‑хромосома). Бывает STR‑панели (37/67/111 и т.п.) и SNP/NGS (Big Y от компании FTDNA, WGS - полногеном).
- мтДНК (mtDNA) — по материнской линии; полная мт‑генома (FMS/mtFull) или HVR‑области.
- Аутосомная ДНК (auDNA) — все 22 хромосомы, кроме половых; используется для n-юродных совпадений (cM, сегменты), где n может варьироваться в широком диапазоне в зависимости от задачи.
- Х‑хромосома (X‑DNA) — вспомогательно для установления ветви совпадения по схеме наследования X.
- WGS/WES — полногеномное/полноэкзомное секвенирование.
- Big Y / Big Y-700 — коммерческий NGS‑тест Y‑хромосомы (FTDNA), ориентирован на SNP‑дерево.
- Big Y-500 — версия теста Big Y с ~500 STR-маркерами, предшественник Big Y-700; позволяет одновременно анализировать SNP и STR
Y‑ДНК: STR‑термины
- STR — короткие тандемные повторы нуклеотидов (маркер/локус типа DYS390 и др.).
- Аллель (для STR) — число повторов в локусе (например, 12 на DYS393).
- Микровариант — дробное значение STR (например, 14.2), обусловлено вставками/делециями внутри повтора.
- Дубликатные/многокопийные локусы — напр. DYS385a/b, DYS464; значения даются для каждой копии.
- RecLOH — неравный обмен между палиндромными участками Y, приводящий к выравниванию аллелей (псевдо‑конверсия).
- Back‑mutation (обратная мутация) — возврат значения STR к прежнему числу повторов.
- Генетическая дистанция (GD) — суммарное число расхождений по STR между гаплотипами (по заданной модели) тестируемых.
- SMM/TPM — модели изменения STR: пошаговая (Stepwise) и «двухфазная».
- Модальный гаплотип — вычисленная «центральная» STR‑комбинация для кластера/ветви.
Y‑ДНК: SNP/NGS‑термины
- SNP (снип) — бинарная мутация одного нуклеотида; определяет ветвь дерева.
- SNV — единичный нуклеотидный вариант (шире, чем SNP; не всегда фиксирован в популяции).
- Индел (indel) — вставка/делеция нуклеотида в конкретном месте ДНК; у Y тоже используется в филогенетике.
- Эквивалентные SNP — набор снипов в одном «блоке», не разделённых известными ветвлениями.
- Private/Novel SNP — уникальные снип для тестируемого/малой группы; могут стать названием новой подветви.
- Терминальный SNP — самый «нижний» подтверждённый SNP образца.
- Блок (YFull) — группа эквивалентных SNP; для блока указывается formed (возраст формирования) и TMRCA.
- Апстрим/даунстрим — вышестоящие/нижестоящие по дереву ветви.
- Парагруппа — носители базового SNP без подтверждённых downstream‑ветвей (напр., R‑Y2915*).
- Обозначения ветвей —
Y: буква клада + индексы и SNP‑шифры (например, R1a‑Z280 > CTS1211 > YP343).
мт: буква (H, U, J…) + индексы (напр., H1c1a). - Префиксы SNP‑имен — BY, FGC, CTS, Z, PF, L, M, A, Y и др. — по лаборатории/источнику открытия.
- Звёздочка “*” — парагруппа (нет определённых downstream‑SNP).
- Координаты hg19/hg38 — положение варианта в сборках GRCh37/hg19 и GRCh38/hg38.
- BAM/FASTQ/VCF — форматы NGS‑данных (выравнивания, сырые риды, варианты генома).
- Покрытие (coverage, ×) — средняя глубина чтения участка ДНК. Среднее покрытие для всего генома рассчитывают по формуле: N × L / G, где N — число ридов, L — средняя длина рида, G — длина генома. Чем короче риды, тем при прочих равных выше покрытие, но слишком маленькие риды ухудшают качество реконструкции. Часто риды 150 bp.
- MQ/BQ — метрики качества секвенирования:
MQ (Mapping Quality) — числовая оценка вероятности правильного выравнивания рида в референсном геноме; обычно в Phred-формате (чем выше, тем лучше).
BQ (Base Quality) — оценка достоверности определения конкретного нуклеотида в риде, также в Phred-формате; отражает вероятность ошибки определения основания.
Митохондриальная ДНК (мтДНК, mtDNA)
- HVR1/HVR2 — гипервариабельные регионы; тесты ограничивались ими в ранних наборах.
- rCRS/RSRS — референсные последовательности (классическая и реконструированная древняя).
- Гаплогруппы мтДНК — обозначаются буквами A, B, C… с индексами подветвей.
- Гетероплазмия — сосуществование разных митохондриальных вариантов в одном организме. Связано с особенностями эмбрионального развития. В норме в клетке может находиться от 2 до 10 (иногда более) копий митохондриального генома, но при мутациях мтДНК в клетке могут одновременно присутствовать правильные и дефектные генетические копии.
Совпадения на аутосомной ДНК
- Сегмент — непрерывный отрезок совпадения; измеряется в cM (сантиМорганах) и количестве снипов.
- Total cM / Largest cM — суммарная и наибольшая длина совпадающих сегментов.
- IBD/IBS/IBP/IBC — «идентично по происхождению / по состоянию / по популяции / по случайности». По происхождению определяет наибольшую ценность для генеалогии.
- Триангуляция — подтверждение сегмента через взаимное совпадение по тому же участку у 3 и более тестируемых.
- Фазирование (phasing) — разделение аллелей по отцовской/материнской хромосомам (референсом служат родители/дети).
- Хромосомный браузер — инструмент визуализации перекрывающихся участков (FTDNA, MyHeritage, GEDmatch и др.).
Древняя ДНК (дДНК, aDNA)
- Дезаминирование (C→T, G→A) — характерные повреждения на концах ридов древней ДНК. Часто возникает при длительном хранении ДНК в неспецифической среде.
- UDG‑обработка — ферментативное удаление урацилов для снижения повреждений.
- Контаминация — примесь современной/чужой ДНК; оценивается по мт‑ и X‑/Y‑метрикам.
- Capture/Enrichment — таргетное «обогащение» заданных панелей SNP.
- CI (доверительный интервал) — интервал неопределённости оценок датировок.
- Древние совпадения — короткие сегменты (<6–7 cM), часто IBC/IBS.
Проекты, сервисы и базы
- FTDNA (FamilyTreeDNA) — https://www.familytreedna.com — тесты Y-STR, Big Y, mtFull, Family Finder; хостинг и администрирование групповых проектов.
- YFull — https://www.yfull.com — независимая интерпретация Y- и мт-NGS; датировки formed/TMRCA, дерево YTree/mtTree.
- TheYtree (祖源树 / 祖缘树) — международный, преимущественно китайский, онлайн-проект, предлагающий бесплатный интерпретатор Y-ДНК и визуализацию вашей Y-гаплогруппы на общем филогенетическом дереве.
- YSEQ — https://www.yseq.net — лаборатория Y/SNP/панелей, изготовление индивидуальных тестов;
- Atlas — https://atlas.ru — более скромный российский сервис генетических тестов и здоровья.
- MyHeritage DNA — https://www.myheritage.com/dna — аутосомные тесты, поиск совпадений, инструмент Triangulation.
- AncestryDNA — https://www.ancestry.com/dna — крупная база аутосомных тестов, дерево родства.
- 23andMe — https://www.23andme.com — аутосомные тесты, определение Y/мт гаплогрупп, этнические компоненты.
- Living DNA — https://livingdna.com/int/ — генетические тесты.
- GEDmatch — https://www.gedmatch.com — площадка загрузки сырых auDNA-данных; инструменты поиска совпадений и сравнения сегментов.
- DNA Painter — https://dnapainter.com — визуализация сегментов, калькуляторы родства, инструмент Chromosome Mapping.
- Shared cM Tool (DNA Painter) — https://dnapainter.com/tools/sharedcm-double — расчёт вероятных степеней родства.
- ISOGG Wiki — https://isogg.org/wiki — справочник по ГГ и дереву Y-DNA, списки SNP и методология.
- Y-DNA предикторы — predictor от YFull, от nevgen, от hprg, от yourdnaportal — статистические предикторы гаплогруппы по STR-профилю.
- MolGen Forum — https://forum.molgen.org/ — русскоязычное сообщество по генетической генеалогии.
- SNP Tracker и Mygrations (PhyloGeographer) — инструменты визуализации исторического пути, который прошла ваша Y- или mt-DNA линия, от корней к текущему SNP.
- Genotek — https://www.genotek.ru — коммерческая генетическая лаборатория и сервис тестирования в России с самой крупной базой совпаденцев.
- FTDNA Discover — https://discover.familytreedna.com/y-dna/ — интерактивные данные по Y-DNA ветвям и датировкам от FTDNA.
- Sequencing.com — https://get.sequencing.com — маркетплейс генетических приложений.
- MyTrueAncestry — https://mytrueancestry.com/en/ — сопоставление ДНК с древними образцами.
- Genomelink — https://genomelink.io — интерпретация генетических данных по различным признакам.
- DNAgenics — онлайн-платформа, предлагающая расширенный анализ генетических данных (RAW-файлы) с помощью более чем 500 отчётов.
- Genopoisk — https://genopoisk.ru/ — российский проект по поиску родства по ДНК в возможностью тестирования.
- Y-DNA Map славян (Google) — карта распределения Y-гаплогрупп.
- Morley Y-SNP Extractor — извлечение Y-SNP из аутосомных данных и определение субклада. Можно в некоторых случаях добиться более точного определения субклада, чем в сервисе, где тестировались.
- DNAKitStudio v2.8 (Yandex Disk) — https://disk.yandex.ru/d/jW1BqX48dKReRA — программой для конвертации файла .vcf в 23andMe v5. Версия 2.9.
- Ensembl Genome Browser — https://www.ensembl.org — просмотр референсного генома (hg19/hg38), координаты SNP.
- Genotek Statistics — https://t.me/Genotekstatistics — Telegram-канал статистики ожидания результатов тестов от Genotek.
- Telegram-канал Familio | Генетическая генеалогия
Полезные статьи (Дзен)
Если вы знаете дополнительный полезный для генетической генеалогии ресурс или считаете важным раскрыть термин, которого нет в этом глоссарии, напишите об этом в комментариях. Мы будем признательны за вклад в расширение и уточнение материала.