Найти в Дзене
Vladimir Taisin

Глоссарий и ресурсы генетических генеалогов

Цель — собрать и кратко расшифровать используемые в сообществе генетических генеалогов термины и аббревиатуры, а также ресурсы. Если вы знаете дополнительный полезный для генетической генеалогии ресурс или считаете важным раскрыть термин, которого нет в этом глоссарии, напишите об этом в комментариях. Мы будем признательны за вклад в расширение и уточнение материала.
Оглавление

Цель — собрать и кратко расшифровать используемые в сообществе генетических генеалогов термины и аббревиатуры, а также ресурсы.

Глоссарий

Базовые понятия

  • Генетическая генеалогия — применение ДНК‑тестов совместно с традиционными источниками для исследования родства.
  • ДНК-генеалогия — направление, связывающее данные Y-DNA и мтDNA с историческими реконструкциями, этногенезом и миграциями; термин часто используют для обозначения популяризаторской школы А.А. Клёсовa.
  • Генотип / гаплотип — набор наблюдаемых значений генетических параметров в тестируемых локусах. «Гаплотип» чаще употребляется для Y‑STR.
  • Гаплогруппа (гг) — группа родственных линий, объединённых общей точечной мутацией (SNP) в конкретной линии наследования (Y или мтДНК).
  • Родительская гаплогруппа — более древняя, вышестоящая в дереве гаплогруппа, от которой произошла рассматриваемая (downstream) ветвь; содержит всех потомков до следующего разделения.
  • Клейд / клада / ветвь / подветвь — узел и ветвление на филогенетическом дереве (Y‑ или мт‑). В русскоязычной литературе чаще принято употреблять «ветвь/подветвь».
  • MRCA (Most Recent Common Ancestor) / ОРА — ближайший общий предок двух (или более) тестируемых.
  • TMRCA — время до MRCA, статистическая оценка (лет).
  • ybp (years before present) — годы до настоящего времени, стандартная археогенетическая единица измерения времени.
  • ВСЕ — «до нашей эры» (BCE, Before Common Era), используется для датировок в исторической и археогенетической хронологии.
  • СЕ — «нашей эры» (CE, Common Era), используется для датировок в исторической и археогенетической хронологии.
  • Эндогамия — многократные браки внутри ограниченной популяции, увеличивающее количество совпаденцев.
  • Предковая редукция / педигри‑коллапс — совпадение предков в генеалогическом дереве из‑за родственных браков. Это уменьшает количество прямых предков. Например, в моей семье линии родителей пересекаются начиная с 8 поколения несколько раз и вместо расчетного 2n на поколение (n) цифра занижается.
  • Палиндром — симметричный участок ДНК, последовательность нуклеотидов которого читается одинаково в прямом и обратном направлениях на комплементарных цепях; такие участки могут влиять на стабильность и механизмы репликации.
  • Гомеоплазия — одинаковая мутация (SNP, indel) у неродственных линий, возникшая независимо в разных ветвях; может приводить к ошибкам в построении дерева.
  • NPE означает «непредполагаемое отцовство» или «непредполагаемое родительское событие». Так называют ситуацию, когда оказывается, что один или оба родителя не являются генетическими родственниками человека.
  • MPE синонимично NPE и может означать «неверно определённое отцовство».
  • T2T (telomere-to-telomere) — новейшая сборка хромосомы от теломеры до теломеры без промежутков (gapless), самая актуальная для новейших референсных геномов.
  • Сборка (assembly) / сборка генома — цифровая реконструкция полной последовательности генома или его части из прочтений (ридов) секвенирования; может быть черновой (draft) или законченной (complete).
  • bp (base pair) — пар нуклеотидов/оснований

Типы тестов

  • Y‑ДНК (Y-DNA) — по отцовской линии (Y‑хромосома). Бывает STR‑панели (37/67/111 и т.п.) и SNP/NGS (Big Y от компании FTDNA, WGS - полногеном).
  • мтДНК (mtDNA) — по материнской линии; полная мт‑генома (FMS/mtFull) или HVR‑области.
  • Аутосомная ДНК (auDNA) — все 22 хромосомы, кроме половых; используется для n-юродных совпадений (cM, сегменты), где n может варьироваться в широком диапазоне в зависимости от задачи.
  • Х‑хромосома (X‑DNA) — вспомогательно для установления ветви совпадения по схеме наследования X.
  • WGS/WES — полногеномное/полноэкзомное секвенирование.
  • Big Y / Big Y-700 — коммерческий NGS‑тест Y‑хромосомы (FTDNA), ориентирован на SNP‑дерево.
  • Big Y-500 — версия теста Big Y с ~500 STR-маркерами, предшественник Big Y-700; позволяет одновременно анализировать SNP и STR

Y‑ДНК: STR‑термины

  • STR — короткие тандемные повторы нуклеотидов (маркер/локус типа DYS390 и др.).
  • Аллель (для STR) — число повторов в локусе (например, 12 на DYS393).
  • Микровариант — дробное значение STR (например, 14.2), обусловлено вставками/делециями внутри повтора.
  • Дубликатные/многокопийные локусы — напр. DYS385a/b, DYS464; значения даются для каждой копии.
  • RecLOH — неравный обмен между палиндромными участками Y, приводящий к выравниванию аллелей (псевдо‑конверсия).
  • Back‑mutation (обратная мутация) — возврат значения STR к прежнему числу повторов.
  • Генетическая дистанция (GD) — суммарное число расхождений по STR между гаплотипами (по заданной модели) тестируемых.
  • SMM/TPM — модели изменения STR: пошаговая (Stepwise) и «двухфазная».
  • Модальный гаплотип — вычисленная «центральная» STR‑комбинация для кластера/ветви.

Y‑ДНК: SNP/NGS‑термины

  • SNP (снип) — бинарная мутация одного нуклеотида; определяет ветвь дерева.
  • SNV — единичный нуклеотидный вариант (шире, чем SNP; не всегда фиксирован в популяции).
  • Индел (indel) — вставка/делеция нуклеотида в конкретном месте ДНК; у Y тоже используется в филогенетике.
  • Эквивалентные SNP — набор снипов в одном «блоке», не разделённых известными ветвлениями.
  • Private/Novel SNP — уникальные снип для тестируемого/малой группы; могут стать названием новой подветви.
  • Терминальный SNP — самый «нижний» подтверждённый SNP образца.
  • Блок (YFull) — группа эквивалентных SNP; для блока указывается formed (возраст формирования) и TMRCA.
  • Апстрим/даунстрим — вышестоящие/нижестоящие по дереву ветви.
  • Парагруппа — носители базового SNP без подтверждённых downstream‑ветвей (напр., R‑Y2915*).
  • Обозначения ветвей
    Y: буква клада + индексы и SNP‑шифры (например, R1a‑Z280 > CTS1211 > YP343).
    мт: буква (H, U, J…) + индексы (напр., H1c1a).
  • Префиксы SNP‑имен — BY, FGC, CTS, Z, PF, L, M, A, Y и др. — по лаборатории/источнику открытия.
  • Звёздочка “*” — парагруппа (нет определённых downstream‑SNP).
  • Координаты hg19/hg38 — положение варианта в сборках GRCh37/hg19 и GRCh38/hg38.
  • BAM/FASTQ/VCF — форматы NGS‑данных (выравнивания, сырые риды, варианты генома).
  • Покрытие (coverage, ×) — средняя глубина чтения участка ДНК. Среднее покрытие для всего генома рассчитывают по формуле: N × L / G, где N — число ридов, L — средняя длина рида, G — длина генома. Чем короче риды, тем при прочих равных выше покрытие, но слишком маленькие риды ухудшают качество реконструкции. Часто риды 150 bp.
  • MQ/BQ — метрики качества секвенирования:
    MQ (Mapping Quality) — числовая оценка вероятности правильного выравнивания рида в референсном геноме; обычно в Phred-формате (чем выше, тем лучше).
    BQ (Base Quality) — оценка достоверности определения конкретного нуклеотида в риде, также в Phred-формате; отражает вероятность ошибки определения основания.

Митохондриальная ДНК (мтДНК, mtDNA)

  • HVR1/HVR2 — гипервариабельные регионы; тесты ограничивались ими в ранних наборах.
  • rCRS/RSRS — референсные последовательности (классическая и реконструированная древняя).
  • Гаплогруппы мтДНК — обозначаются буквами A, B, C… с индексами подветвей.
  • Гетероплазмия — сосуществование разных митохондриальных вариантов в одном организме. Связано с особенностями эмбрионального развития. В норме в клетке может находиться от 2 до 10 (иногда более) копий митохондриального генома, но при мутациях мтДНК в клетке могут одновременно присутствовать правильные и дефектные генетические копии.

Совпадения на аутосомной ДНК

  • Сегмент — непрерывный отрезок совпадения; измеряется в cM (сантиМорганах) и количестве снипов.
  • Total cM / Largest cM — суммарная и наибольшая длина совпадающих сегментов.
  • IBD/IBS/IBP/IBC — «идентично по происхождению / по состоянию / по популяции / по случайности». По происхождению определяет наибольшую ценность для генеалогии.
  • Триангуляция — подтверждение сегмента через взаимное совпадение по тому же участку у 3 и более тестируемых.
  • Фазирование (phasing) — разделение аллелей по отцовской/материнской хромосомам (референсом служат родители/дети).
  • Хромосомный браузер — инструмент визуализации перекрывающихся участков (FTDNA, MyHeritage, GEDmatch и др.).

Древняя ДНК (дДНК, aDNA)

  • Дезаминирование (C→T, G→A) — характерные повреждения на концах ридов древней ДНК. Часто возникает при длительном хранении ДНК в неспецифической среде.
  • UDG‑обработка — ферментативное удаление урацилов для снижения повреждений.
  • Контаминация — примесь современной/чужой ДНК; оценивается по мт‑ и X‑/Y‑метрикам.
  • Capture/Enrichment — таргетное «обогащение» заданных панелей SNP.
  • CI (доверительный интервал) — интервал неопределённости оценок датировок.
  • Древние совпадения — короткие сегменты (<6–7 cM), часто IBC/IBS.

Проекты, сервисы и базы

  • FTDNA (FamilyTreeDNA) — https://www.familytreedna.com — тесты Y-STR, Big Y, mtFull, Family Finder; хостинг и администрирование групповых проектов.
  • YFull — https://www.yfull.com — независимая интерпретация Y- и мт-NGS; датировки formed/TMRCA, дерево YTree/mtTree.
  • TheYtree (祖源树 / 祖缘树) — международный, преимущественно китайский, онлайн-проект, предлагающий бесплатный интерпретатор Y-ДНК и визуализацию вашей Y-гаплогруппы на общем филогенетическом дереве.
  • YSEQ — https://www.yseq.net — лаборатория Y/SNP/панелей, изготовление индивидуальных тестов;
  • Atlas — https://atlas.ru — более скромный российский сервис генетических тестов и здоровья.
  • MyHeritage DNA — https://www.myheritage.com/dna — аутосомные тесты, поиск совпадений, инструмент Triangulation.
  • AncestryDNA — https://www.ancestry.com/dna — крупная база аутосомных тестов, дерево родства.
  • 23andMe — https://www.23andme.com — аутосомные тесты, определение Y/мт гаплогрупп, этнические компоненты.
  • Living DNA — https://livingdna.com/int/ — генетические тесты.
  • YBrowse — https://www.ybrowse.org — онлайн-база SNP с координатами и связями в дереве.
  • GEDmatch — https://www.gedmatch.com — площадка загрузки сырых auDNA-данных; инструменты поиска совпадений и сравнения сегментов.
Как использовать GEDmatch - Полное руководство [JULY 2020]

  • DNA Painter — https://dnapainter.com — визуализация сегментов, калькуляторы родства, инструмент Chromosome Mapping.
  • Shared cM Tool (DNA Painter) — https://dnapainter.com/tools/sharedcm-double — расчёт вероятных степеней родства.
  • ISOGG Wiki — https://isogg.org/wiki — справочник по ГГ и дереву Y-DNA, списки SNP и методология.
  • Y-DNA предикторы predictor от YFull, от nevgen, от hprg, от yourdnaportal — статистические предикторы гаплогруппы по STR-профилю.
  • MolGen Forum — https://forum.molgen.org/ — русскоязычное сообщество по генетической генеалогии.
  • SNP Tracker и Mygrations (PhyloGeographer) — инструменты визуализации исторического пути, который прошла ваша Y- или mt-DNA линия, от корней к текущему SNP.
  • Genotek — https://www.genotek.ru — коммерческая генетическая лаборатория и сервис тестирования в России с самой крупной базой совпаденцев.
  • Geni — https://www.geni.com/ — платформа построения общих генеалогических деревьев.
  • FTDNA Discover — https://discover.familytreedna.com/y-dna/ — интерактивные данные по Y-DNA ветвям и датировкам от FTDNA.
  • Sequencing.com — https://get.sequencing.com — маркетплейс генетических приложений.
  • MyTrueAncestry — https://mytrueancestry.com/en/ — сопоставление ДНК с древними образцами.
  • Genomelink — https://genomelink.io — интерпретация генетических данных по различным признакам.
  • DNAgenics — онлайн-платформа, предлагающая расширенный анализ генетических данных (RAW-файлы) с помощью более чем 500 отчётов.
  • Genopoisk — https://genopoisk.ru/ — российский проект по поиску родства по ДНК в возможностью тестирования.
  • Y-DNA Map славян (Google) — карта распределения Y-гаплогрупп.
  • Morley Y-SNP Extractor — извлечение Y-SNP из аутосомных данных и определение субклада. Можно в некоторых случаях добиться более точного определения субклада, чем в сервисе, где тестировались.
  • DNAKitStudio v2.8 (Yandex Disk) — https://disk.yandex.ru/d/jW1BqX48dKReRA — программой для конвертации файла .vcf в 23andMe v5. Версия 2.9.
  • Ensembl Genome Browser — https://www.ensembl.org — просмотр референсного генома (hg19/hg38), координаты SNP.
  • UCSC Genome Browser — https://genome.ucsc.edu — аналог Ensembl; гибкая настройка треков и данных.
  • Genotek Statistics — https://t.me/Genotekstatistics — Telegram-канал статистики ожидания результатов тестов от Genotek.
  • Telegram-канал Familio | Генетическая генеалогия

Полезные статьи (Дзен)

Если вы знаете дополнительный полезный для генетической генеалогии ресурс или считаете важным раскрыть термин, которого нет в этом глоссарии, напишите об этом в комментариях. Мы будем признательны за вклад в расширение и уточнение материала.