Генетический анализ выглядит как работа с точными буквами A, C, G, T. На практике между биологической реальностью и отчётом есть цепочка шагов, и каждый может добавить ошибку. Большинство ошибок типовые, их умеют контролировать, но понимать их полезно любому, кто читает результаты. Ошибки до секвенирования: образец и выделение ДНК
Качество начинается с пробирки. Гемолиз, бактериальное загрязнение, долгое хранение при неправильной температуре, недостаток ДНК или сильная фрагментация ухудшают точность. Для плазмы и cfDNA критичны сроки центрифугирования и условия хранения, иначе растёт доля ДНК из лизирующихся клеток крови. Библиотека и чтение: где рождаются артефакты
При подготовке библиотек возникают смещения. ПЦР может неравномерно усиливать участки генома, часть регионов читается хуже. Трудные зоны это высокий GC, повторы, псевдогены, сегментные дупликации. Там риды плохо выравниваются, алгоритм может ошибочно увидеть мутацию или пропустить реальную. Выравнивание и вариант-коллинг: