Эти размышления призваны дать читателям представления, по каким ухабам и загогулинам идет продвижение геномных исследований, особенно перевод их на коммерческие рельсы, для потребления заинтересованной общественностью. Как грибы плодятся коммерческие «сервисы» с продажей «сертификатов» о том, сколько в каждом из нас доли неандертальцев, или американских индейцев, или «средиземноморцев», «угро-финнов», «юго-восточных азиатов» и прочих. Сейчас на подходе расчеты доли «снежного человека» в каждом из нас. Я – совершенно серьезно, ажиотаж уже раскручивается. А поскольку эти подходы совершенно ненаучны, то параллельно с этим валом идут попытки дискредитировать научные подходы, чтобы не мешали оболванивать «население». А то ведь выбивают почву из-под ног у шарлатанов, показывают, что их, шарлатанов, акробатика никуда не годится, клиентуру отпугивают. И в основе этой акробатики – опять, увы, «популяционная генетика человека» в своем наихудшем виде. Попробуем разобраться.
Для начала – несколько вводных положений. Первое – изучение генома человека чрезвычайно важно как для развития биомедицины, главным образом – «персонализованной медицины», так и для изучения происхождения человека, его эволюции, для ДНК-генеалогических исследований как популяций, так и конкретных семей, их генеалогических линий.
Второе – изучение генома в значительной степени базируется на мутациях в хромосомах ДНК (а также в митохондриальных ДНК, которые тоже часть общего генома). Третье – изучение генома по мутациям в ДНК может проводиться на разных уровнях приближений, а именно на разных фрагментах ДНК – от малых (например, фрагментах Y-хромосомы или любых других хромосом), так и по всему полному геному человека как индивидуально, так и популяций человека, вплоть до всего (в далекой перспективе) населения Земли.
Это все важные положения, и не о них мое ироническое, если не сказать саркастическое название этого постановочного полемического рассказа. Любое грандиозное по важности исследование, любой передовой подход можно свести на уровень профанации, если не следовать вполне общепринятым научным принципам. К сожалению, эта профанация наблюдается, причем широким фронтом, в «популяционной генетике» человека. Почему именно в этом направлении, вполне, казалось бы, безобидном и ориентированным на конкретные исследования современных популяций? Что плохого в том, что популяционные генетики изучают определенные популяции, этносы, наследственные линии, и выявляют в них генетические аберрации, свойственные одним популяциям и совсем несвойственные другим?
Ничего плохого в этом нет – это, напротив, замечательно. Правда, плохое там может появиться, когда имеет место утечка информации персонального характера, и страховые компании отказывают в страховке, или поднимают цену для конкретных людей, потому что они находятся в группе «повышенного риска». Хотя и в этом некоторые находят правильную позицию страховщиков – повышенный риск должен повышенно оплачиваться, тем более когда рискующие знали, на что идут, выходя замуж или женясь на человеке из той же группы повышенного риска, возводя риск в квадрат. Ведь страховка профессиональных спортсменов намного выше, чем «обычных» людей, и страховка гоночных автомобилей намного выше, чем обычных. Как бы там ни было, а популяционные генетики делают хорошее и важное дело, выявляя связь генотипа и фенотипа, в общей формулировке. Собственно, это и есть главная задача популяционной генетики.
Проблема начинается тогда, когда популяционные генетики берутся не за свое дело, и выходят за пределы своей профессиональной компетентности. Например, когда берутся за ДНК-генеалогию с ее количественным математическим аппаратом, по сложности превышающем обычный уровень популяционных генетиков. Они, конечно, могут попытаться научиться, но не хотят. Не хотят принципиально. В итоге получаются не только сплошные конфузы, но и полная дискредитация своей науки. Критический уровень этой дискредитации уже давно зашкаливает.
Сначала, в конце 1990-х – начале 2000-х, это были «датировки», которые брались «по понятиям», а на самом деле совершенно «с потолка», без всяких обоснований. Соответствующие цитаты я уже давал предостаточно в академических статьях, где это обсуждал. Могу только напомнить про «R1b в Европе 30 тысяч лет назад», про «украинскую гаплогруппу R1a, которая спасалась в украинском же убежище в ходе ледникового периода», про «выход современого человека из Африки 70 тысяч лет назад», и так далее. Никаких расчетов на самом деле не проводилось, да их и быть не могло. Это – стиль популяционной генетики. Потом, в середине 2000-х, взял свое начало «метод Животовского» с его «популяционными скоростями», которые совершенно некритично принимались в любом случае, для любых гаплотипов, для любых маркеров, в любом временном интервале.
Самое прискорбное – никто из «популяционных генетиков» и вопросов не задавал, применяли совершенно не думая и не осознавая. В итоге обычное завышение результатов расчетов на 200-400% (!). Откуда это, в чем причины? Причины – в полном отсутствии нормальной научной школы, в которой эти несуразицы вскрываются на первом же научном семинаре. Причины – в полном контроле «популяционными генетиками» профильных научных журналов. В подборе рецензентов, которые тоже полностью контролируются, а потом привыкают. Или привыкли с самого начала.
Шокирующих примеров слишком много, чтобы все публиковать. Один из краеугольных камней «попгенетиков», которые устремляются в «исторические науки» – это исходить из статической картины гаплогрупп: то, что наблюдается в настоящее время – то же якобы было всегда. Оттуда и возникли те самые R1b давностью в Европе 30 тысяч лет – они же есть в Европе сейчас, значит, были всегда. Ну а 30 тысяч лет – из вежливости, сверху уже неандертальцы подпирают. Так и сейчас, уже в 2013 году, нашли R1b-L51 в центре Европы – значит, там и образовались. Нашли R1b в Анатолии – значит, там и образовались, оттуда и пришли. О том, что они и в Сибири есть – авторы во внимание не принимают, хотя карты R1b известны. Популяционная генетика.
Нашли стоянки в Турции давностью 10 тысяч лет назад – значит R1b, как будто других гаплогрупп нет, например, G, E, J, R1a, F, К и так далее. Разделились христиане и мусульмане на Ближнем Востоке и на юге Европы в 7-м веке, 1300 лет назад, а попгенетики применили «популяционную скорость Животовского», и «нашли», что христиане и мусульмане уже разделились 3900 лет назад, за 2000 лет до начала христианства и еще больше – до мусульманства, и не моргнув глазом опубликовали столь замечательный вывод в ведущем «академическом журнале» European J. Human Genetics. Вот такая популяционная генетика.
Еще один показательный пример – некто Диенекес Понтикос, ведущий свой собственный «блог по антропологии», решил, что констант скоростей мутаций ДНК нет, точнее, что они невоспроизводимы и меняются от системы к системе. Почем он так решил? Да потому что в них не разбирается. И объявил о запрете рассмотрения их на своем блоге. Так и объявил – ввожу «бан» на скорости мутаций. История забавная.
И вот тот же Д. Понтикос сейчас занялся геномом, точнее, сериями мутаций в нем. И в соответствии с ментальностью многих попгенетиков, стал применять принцип – «что вижу, то и пою». То есть беру картину мутаций в Польше – назваю ее «польской картиной». Неважно, что она такая же, как в Беларуси или в Литве – пусть будет «польской». Вижу картину у американских индейцев, неважно, что они пришли из Сибири со своей сибирской гаплогруппой Q, пусть будет каноническая картина «американских индейцев». Причем американских индейцев в Сибири. Или американских индейцев во Франции. Или в Ирландии. Или в России. Отныне они все будут в своей части «американские индейцы». Узнаете «популяционную генетику»? Что вижу, то и пою.
И вот такие люди закладывают основы новой дисциплины, при полном попустительстве остальных. И эти остальные чешут голову и гадают – откуда в Ирландии американские индейцы? Но раз Понтикос сказал, значит, так оно и есть. Доктор сказал в морг – значит в морг. Возвращаемся к началу нашего повествования.
Уже довольно давно я с определенным подозрением слежу за упражнениями Д. Понтикоса по мутациям – сначала в Y-хромосоме, а потом и по всему геному. Понтикос, по своему незнанию, сначала объявлял, что огромные погрешности в расчетах времен до общих предков делают расчеты по мутациям в ДНК бессмысленными. Но оказалось, что он в этих расчетах ничего не понимает. Мне препираться с ним надоело, и я задал ему конкретный вопрос – есть сто 67-маркерных гаплотипов, в которых суммарно 2000 мутаций. Когда жил общий предок этих ста гаплотипов, и с какой погрешностью определяется эта величина? Понтикос не ответил и предпочел ретироваться. Больше со мной он этот вопрос не поднимал.
Ответ на самом деле очень прост – 5000 лет назад с погрешностью плюс-минус 510 лет. При этом нужно оговорить два условия – что все эти гаплотипы происходят от одного общего предка, и константа скорости мутации определена с точностью плюс-минус 10%. Если первое условие не выполняется, гаплотипы делятся на ветви с помощью дерева гаплотипов, нет проблем. Второе условие обычно завышено, и погрешность на самом деле часто оказывается меньшей, ну да ладно, пусть будет для страховки. Лучше погрешность завышать, чем уменьшать.
Но Понтикос не успокоился, и вскоре объявил о том, что расчеты времен до общего предка не имеют смысла, потому что зависят от того, какие маркеры используют для расчетов. Его в этом отношении окрылила статья Busby et al (2011), которая оказалась предельно безграмотной (или запредельно безграмотной), хотя и опубликована в журнале Английского Королевского общества. Busby и соавторы взяли несколько «скоростей мутации» для отдельных маркеров, и нашли, что для разных маркеров получаются разные времена для общих предков. Эти «скорости мутаций» они взяли из сопоставления величин аллелей в примерно 1750 парах отец-сын. При этом английские авторы оказались настолько далекими от понимания простых вещей, что не поняли, что эти «скорости мутации» просто нельзя рассматривать для подобных расчетов. Например, в 1750 парах DYS393 мутировал три раза, а DYS390 – два раза. То есть DYS393 оказался более «быстрым», чем DYS390 (!). И авторы английской статьи, а вслед за ними и Понтикос, так и посчитали, что скорость 393-го былее высокая, чем 390-го. И это использовали в расчетах! Между тем, любой, кто хоть однажды видел серии гаплотипов, видел, что 393-й мутирует крайне редко, а 390-й строчит как из пулемета. То есть и английские авторы, и Понтикос не имеют о таких вещах ни малейшего представления. Они не имеют понятия и о том, что 2 и 3 мутации в 1750 парах отец-сын – это никакая не статистика, там могла легко быть и 1 мутация, и 4-5 мутаций. Нельзя на таком уровне частоты событий вообще что-то рассчитывать. Это все равно, что бросить монету три раза, и на этом основании рассчитывать вероятность выпадения орла или решки. Но точно так же и английские авторы, и Понтикос делают выводы, что по мутациям ничего считать нельзя! Более того, Понтикос объявил на своем сайте, как я уже упомянул выше, что отныне он делает «бан» на расчеты ДНК-генеалогии и больше ничего на эту тему не помещает.
Между нами прошла объемная дискуссия, которую я целиком, на 60 страницах, опубликовал на английском языке в Вестнике Академии ДНК-генеалогии (сентябрь 2011 года, том 4, № 9, стр. 1831-1892). Статья называлась – в переводе на русский – «Недавняя провалившаяся попытка дискредитировать константы скорости мутаций в антропологическом блоге Диенекеса Понтикоса». Понтикос после этого еще немного позлобствовал в своем блоге, но ни одного конкретного примера расчетов не привел. Популяционная генетика.
Следующим действием было его увлечение расчетами возраста гаплогрупп на основании числа снип-мутаций (SNP) в гаплогруппах и субкладах по данным проекта «1000 геномов». Как он считал – он поначалу не показал, и просто опубликовал список «возрастов» по гаплогруппам. Три четверти из них совпадали с нашими датировками, опубликованными совместно с И.Л. Рожанским в нашей статье про Африку в Advances in Anthropology за полгода до того. Ссылки на нас он, понятное дело, не дал, но отметил, что считать по гаплотипам – это неправильно, надо считать по снипам. Я выступил на англоязычном форуме RootsWeb, и задал ему вопрос – если он получает такие же цифры, как у нас, более того, подозрительно такие же, как он может говорить, что по снипам считать – правильно, а по гаплотипам – неправильно? Он начал скандалить, что это у нас неправильно, и стал приводить цифры по той четверти случаев, в чем у нас разница. Там, где совпадало, он умолчал. Но это было неудивительно, его натуру я уже знал.
Но произошла неожиданность – выступил другой человек, и сказал, что он использовал те же снипы из проекта «1000 геномов», и тот же в принципе метод расчета, и получил совершенно другие данные, чем у Понтикоса. В частности, как видно, Понтикос не делил полученные датировки на 2, то есть он получал не возрасты гаплогрупп, а расстояния между ними. Понтикос опять ретировался и замолчал. Тут уже вышел я и потребовал объяснений. Он же до того объявил, что мы считаем неправильно, а он – правильно. Мое требование пришлось повторять трижды, Понтикос молчал. Потом он вышел и повинился, что на 2 он действительно не делил, но во всем виноват проект «1000 геномов», потому что они выдают неправильные данные, и вообще данных недостаточно для подобных замечательных расчетов, какие делает Понтикос. Короче, он дезавуирует, то есть снимает свои данные как действительно неправильные, потому что по снипам получается что угодно. Извинения мне он, конечно, не принес.
К чему я это все описываю? А для того, чтобы показать, что объявления и расчеты Понтикоса гроша ломаного не стоят. И это уже переходит в новое увлечение Понтикоса, под названием ADMIXTURE. По-русски – примерно «расшифровка природы примесей в геноме». Это очередной бум по части одурачивания населения, в котором рекламным агентом выступает Понтикос.
И вот началась эта следующая эпопея – популяционные генетики добрались до данных генома, и стали сравнивать сотни тысяч снипов по популяциям. И Понтикос там занял одну из ведущих ролей. Но как истый популяционный генетик по духу, он не понял всей сложности картины. Дело в том, что считают по геномам как мужчин, так и женщин, совместно, не разделяя. Все это образует, естественно, облака снипов, которые только условно могут быть приписаны конкретным регионам, и там они пересекаются, накладываются поперек регионов. Но Понтикос сразу же стал приписывать этим облакам этнические названия, чисто в попгенетическом духе. Более того, даже там, где он приписывал этим облакам (которые он усредняет до якобы точек) названия континентов, или популяциям континентов, эти названия настолько упрощены, что стали ошибочными. На форуме «Родство» польский визитер уже сообщал, что у него 95.6% «польских снипов». То, что польские, литовские, белорусские, да и русские дают примерно такую же картину, он не знал. Иначе говоря, это почти все равно, что назвать «польской» гаплогруппу R1а, и продолжать писать, что у уйгуров, например, 30% польского генома. Что из этого получается – можно сказать коротко. Профанация.
Вот – конкретный пример, который имел место совсем недавно. Мой знакомый-соавтор ирландец выставил сообщение на RootsWeb с недоуменным вопросом. Он скачал программу, которую составил Понтикос на своем сайте, вставил свои (и родителей) данные по геному, и с удивлением обнаружил, что он и его родители почти на 10% – американские индейцы. Он выставил свои данные и с удивлением заметил, что его родители и он сам – «коренные ирландцы» из Ирландии, и никаких индейцев у них в роду отродясь не было. Вот что он выставил:
«Здесь мои родители и я – все ирландцы, никаких предков среди американских индейцев.
Я:
92.02% Европейцы
0.00% Азиаты
0.11% Африканцы
7.87% Американские индейцы
Отец:
91.95% Европейцы
0.00% Азиаты
0.07% Африканцы
7.98% Американские индейцы
Мать:
92.13% Европейцы
0.00% Азиаты
0.00% Африканцы
7.87% Американские индейцы
Есть здесь еще с предками от американских индейцев?
Paul»
Поднялась дискуссия, в которой обнаружилось, что у всех заметное присутствие доли американских индейцев, если расчитывать «по Понтикосу».
Кстати, никто не обратил внимания, что в геноме матери африканцев вообще нет, а у самого Поля почему-то их больше, чем у отца. На самом деле это все на уровне «шума». Нет в нас мутаций африканцев, не выходили наши предки из Африки. Из общего предка с шимпанзе – масса мутаций, а от африканцев – нет.
Некоторые подняли вопрос, что в программе с американскими индейцами что-то не так. Другие защищали, что раз Понтикос сказал, то так тому и быть (напоминаю – доктор сказал в морг, значит в морг), и стали придумывать гипотезы одни фантастичнее других, и абсурднее третьих. А ларчик на самом деле просто открывался. Понтикос в своем попгенетическом рвении, вместо того, чтобы обозначить определенные закономерности цифрами или индексами, назвал их так, просто с потолка:
Перевод: четыре предковых популяции появились на этом уровне разрешения, которые я назвал: европейская, азиатская, африканская, америндская. Имена не важны, и вы можете заменить их какими хотите.
Мой комментарий: если имена не важны, то какого дьявола их вообще называть так? Три дня эти чудаки на RootsWeb спорили о том, откуда у них в предках американские индейцы, а это вообще, судя по всему, сводная гаплогруппа Р. Она дала гаплогруппы Q, R → R1 → R1a + R1b, а ирландцы – это и есть гаплогрупа R1b на 90+%, и наш Paul – R1b-M222. Q ушла в Америку, и ее имеют многие американские индейцы. Вот и вся разгадка. У них общие древние мутации от времен, когда американских индейцев и в проекте не было. Если геном имеет массу снипов от общего предка с шимпанзе 6 миллионов лет назад, то как же ему не иметь снипов от гаплогруппы Р, всего 40 тысяч лет назад? Они, эти снипы, и ушли как в Америку, к индейцам, так и в Ирландию, как и ко всем R1b, так и в Восточную Европу (и не только), ко всем R1a.
И действительно, у русских примерно столько же вклада «американских индейцев», о чем Понтикос старательно (и глупо) доложил:
Украинцы – 8.5% америндов
Поляки – 8.2% америндов
Литовцы – 9.1% америндов
Русские – 11.7% америндов
Славяне в целом – 9.1% америндов
Понтикос так и пишет: For example, HGDP Russians have 11.7% of Amerindian component. То есть то, что это понятие «америнды» он ввел число условно – уже не вспоминает. Раз подхватили, зачем менять, не так ли?
Надеюсь, понятнее теперь, что эти цифры и этносы у Понтикоса на самом деле никакой смысловой нагрузки не несут? Цифры есть, а этноса нет. 40-60 тысяч лет назад этносов не было в том виде, как мы этносы сейчас понимаем и называем. Ущербность этого подхода, повторяю, и в том, что все эти облака усредняются до точки в каждом случае, и эти точки и приводятся с точностью до долей процента.
На самом деле эти данные, если их обрабатывать правильно, несут вполне ценную информацию. Обычно рассматривают сотни тысяч снипов у каждого человека, и они, ясное дело, есть объективная реальность. В эти снипы входят снипы и шимпанзе, точнее, общего предка шимпанзе и человека (но их осталось и в шимпанзе и в нас более 90%), и все снипы наших гаплогрупп и субкладов Y-хромосомы (которых у женщин нет, но всё усредняется между полами), и снипы наших отцов и матерей, что отражает причудливую картину их взаимного выбора, а поскольку часто мужчины в этносах выбирают женщин из того же этноса, и наоборот, то картины в целом по этносам расходятся.
Примерно так: если взять группу русских (мужчин и женщин) и группу монголов-монголок, то у них будут – у тех и у других масса снипов шимпанзе, снипы альфа-гаплогруппы, снипы бета-гаплогруппы (пока все примерно одно и то же), но потом пошла разница – у монголов в немалой степени гаплогруппы С, Q, R1a у мужчин (R1a как древние, так и недавние вливания во времена России и СССР), и соответствующие мтДНК от женщин, которых у монголок весь иконостас, и у русских R1a, I1, I2, N1c1, и еще куча более минорных снипов, плюс гаплогруппа Н (преимущественно) от женщин, плюс вся палитра других женских гаплогрупп, причем у русских это варьируется по всему горизонту. И вот эта чудовищная каша усредняется «попгенетиками» и «геногеографами» в одну точку! И это называется «русский геном» и «могольский геном», и вот они-то сравниваются с точностью до долей процента.
Все это, конечно, полная чушь. Это я – о точке и о долях процента. На самом деле этот «русский геном» пересекается со всей восточной Европой, и его не в точку нужно стягивать, а найти другой характер представления. А именно, в виде соответствующих облаков, растянутых неравномерно в разные стороны.
Но и в этом случае различия все равно будут между русскими и монголами. Качественно и как-то полуколичественно его можно рассматривать, но не в виде профанации, как это делает Понтикос. Более того, это рассмотрение – если правильно – надо проводить не на выбранных маленьких фрагментах, а действительно по всему геному. На маленьких фрагментах будут вылезать отдельные особенности – то присущие в основном, например, гаплогруппам Y-I2 и мтДНК-Н, то кому-то еще. И это еще будет зависеть от разрешения, которые и обозначают индексами К=4, К=8 и другими. То есть берут маленький фрагмент генома, да еще с малым (или бóльшим) разрешением, стягивают в точку, и все равно получают в целом ерунду. Но для коммерции годится. Годятся для коммерции и вот такие, в частности, «открытия» того же Понтикоса:
Перевод: Интересно то, что европейская популяция показывает присутствие американских индейцев, что показывает и f-статистика, и она же показывает присутствие компонента с Сардинией.
Как видим, Понтикос уже забыл, что названия им придуманы как попало, и уже придает им абсолютные значения.
Про Сардинию Понтикос уже вошел в состояние экзальтации. Он придает Сардинии некую пра-европейскую значимость, на основании, конечно, этой ерунды с «геномом», который анализирует как хочет. Пример – он трубил по всему свету, что Отци, «ледовый человек», имел геном «Сардинии». Однако только что опубликована статья о том, что Отци – никакая не Сардиния, а типичная Центральная Европа. Ну, и что делать будем?
Понтикос, с его страстным желанием сенсаций, каждый раз наступает на одни и те же грабли. Впрочем, фарс продолжается. Теперь тем же занялся некто российский Веренич, а именно тоже насчитывает «польскую компоненту», пользуясь подходом своего гуру-Понтикоса.
Я не проводил детальный разбор все этих admixture подходов, но беглое их рассмотрение показывает, что – как ни странно – картина в первую очередь диктуется мужскими гаплогруппами (Y-хромосомы), а женские гаплогруппы (мтДНК) практически не имеют значения. На первый взгляд, это абсурд, так как примерно половина участников в расчете этих admixtures – это женщины. У них мужской хромосомы нет. Но если подумать, то описанный феномен не исключен. Я уже об этом писал в свое время. Женские гаплогруппы хаотичны, они не образуют четкой картины, и они накладываются на значительно более упорядоченные мужские гаплогруппы. Более того, они часто образуют пары с мужскими гаплогруппами. В итоге имееем корреляции между частью мужских и женских гаплогрупп, и хаотичность женских у остальных. Женских гаплогрупп зачастую не видно, они прозрачны в своей размазанности, как прозрачен винт самолета при его вращении. А дело в том, что женщины тысячелетиями приходили в мужские рода, племена из самых разных мест, приходили сами и их привозили, похищали, захватывали, порой из дальних военных походов. Потому и нет никакой более-менее разумной корреляции между видом мужских Y-хромосом (то есть их гаплогруппами и гаплотипами) и женских митохондриальных ДНК (их гаплогруппами и гаплотипами), о чем каждый исследователь ДНК знает. Но там не только корреляции нет, а практически нет и никакого систематического вклада женских мтДНК в общую картин генома при рассматривании закономерностей по этносам.
На эту мысль меня навело беглое рассмотрение картин мутаций в геноме при 50:50 наличии мужчин и женщин. Оказалось, что на вид эти раскрашенные картинки геномов практически совпадают с картиной мужских гаплогрупп. У русских – половина одного цвета (это R), который одинаков с поляками, как и должно быть, и он совпадает с тремя четвертями у французов и 90% англичан и ирландцев, у которых столь и есть R. При том разрешении R1a и R1b не разделяются. Далее, у русских примерно 1/6 другого цвета, которого три четверти у финнов. Это, ясно, гаплогруппа N. Очень мало желтого цвета, который захлестывает монголов. Это – С или Q, надо разбираться. Совсем нет черного цвета, которого полно в Африке. Сейчас мы увидели (см. выше), что у ирландцев, русских и прочих европейцев около 10% чего-то, что доминирует у америндов. Это явно связано с гаплогруппами Р, R и Q.
В общем, в этом нужно разбираться, и странно, что никто из тех, кто упражняется в admixture, это не заметил. Я призываю тех, кому это может быть интересно, заняться этими подходами, и посмотреть, насколько это действительно контролируется мужскими гаплогруппами. В принципе, данные по геному – объективные данные, дело в интерпретации.
Ниже – мои слова и призывы, обращенные к молодым специалистам и любителям на сайте «Родство» при обсуждение данных по геному:
Там много в чем надо разбираться, но от этого никуда не деться. Формируется новый и мощный подход в генетике, основанный на объективных данных по набору мутаций в хромосомах и во всем геноме. Вопрос – как эти данные трансформировать в хронологические показатели, причем выявить их отношение к регионам, древним миграциям и провести параллели-корреляции с гаплогруппами- гаплотипами и их хронологией.
При этом либо наши данные нужно будет подправлять на основании полного (или частичного) генома, но в этом надо будет надежно убедиться (наука есть наука, и такая вероятность всегда есть), либо, напротив, геном полностью подтвердит наши подходы и данные. Тогда это будет сильным козырем, против которого не возразить. Если мы этого не сделаем, мы отстанем, чего допустить никак нельзя.
Проблема в том, что в это уже полезли попгенетики, и как им генетически присуще, начинают это дело портить, превращать в обычную для них свалку. Так что опять, к сожалению, прогрессивно формируется новое поле для схватки, для битвы, для борьбы науки с нахрапистым гаданием и жонглированием. Это у попгенетиков системное. Поэтому принцип все тот же – если не мы, то кто же? Мы это видим в ДНК-генеалогии гаплотипов, придется увидеть и в ДНК-генеалогии генома. Это та же ДНК-генеалогия.
Так что у меня призыв к коллегам, особенно к коллегам молодым (но не только) – засучить рукава и разобраться в новом направлении. Базы данных по геному прогрессивно растут, они доступны, программы по анализу этих данных уже есть и тоже их число нарастает. Надо понять суть работы этих программ и получаемых данных, убрать эту этничность, с которой носятся попгенетики, забыть про все эти «польские компоненты», которые здесь ни к селу ни к городу и имеют плохой коммерческий привкус (или откровенное шарлатанство, чем сейчас и занимается Веренич, судя по описаниям канадского гостя), и посмотреть, насколько это привязывается к гаплогруппам и cубкладам Y-хромосомы.
Дело не в том, входят ли в сотни тысяч снипов в данном подходе конкретные снипы гаплогрупп. Эти конкретные несколько снипов все равно растворятся в сотнях тысяч других. Дело в том, что эти несколько снипов гаплогруппы формируют те самыe сотни тысяч анализируемых снипов, или десятки тысяч в них. Все это в целом образует общую картину, в которой корни популяции давностью десятки тысяч лет тащат за собой всё остальное, включая и женскую половину.
А женскую – потому, что мы женимся в основном не на негритянках и не на австралийских аборигенках, и не на монголках, поэтому их мутаций в нашем геноме мало. Иначе говоря, это не статистическая каша, а весьма структурированный набор снипов в геноме. Фон, естественно, есть, и сильный, от тех же предков с шимпанзе, но его либо отфильтровывают при анализе, либо учитывают другим образом. Именно потому должна быть корреляция с гаплогруппами Y-хромосомы, или, если ее нет, то это надо четко показать. Думаю, что она будет. Вопрос, в какой степени.
Классическая задача популяционной генетики – это нахождение связи (корреляции) между генотипом и фенотипом. Это опять не имеет отношения к ДНК-генеалогии. Поэтому я все время и повторяю, что попгенетики лезут не в свое дело, причем при полном отсутствии знаний и квалификации в этом не своем деле.
Опять же классический вопрос попгенетики – это выявление набора генов, являющихся причиной наследственных заболеваний. Опять к ДНК-генеалогии это не имеет отношения. Вопрос важный, и любимым объектом у попгенетиков являются, например, евреи с их букетом характерных наследственных болезней. А у киргизов, например, таких нет. Вот описание этого и есть поле попгенетики. Оттого и их любимые графики F, в которых все гаплогруппы смешиваются в кучу, и вообще не рассматриваются. Потому что они в генетике (попгенетике) не нужны. Похоже, этот же подход сейчас используют при анализе генома. И слава Богу, пусть используют, в медицине это важно. Только это опять же не ДНК-генеалогия.
Но я о другом. Эти данные и коллективный анализ мутаций можно явно рассматривать и применять в ДНК-генеалогии. И это – очень интересное поле науки. Просто нужно по-другому смотреть на те же вещи.
Вот еще пример, в котором ясно проглядываются гаплогруппы. Это – из дискуссии на англоязычном форуме, в которой опять рассматривают мутации в геноме, но гаплогруппы не замечают, и описывают некий «атлантически-средиземноморский типаж» в геноме.
На самом деле этат «типаж», или «компонента» – в значительной степени гаплогруппа R1b. Этот геномный типаж доминирует у басков, сардинцев, французов и англичан, и довольно высок у немцев. Затем значительно падает у поляков и становится совсем малым у литовцев и финнов. Именно так проявляется гаплогруппа R1b. Ну, и где здесь независимый вклад мтДНК, и в чем это выражается?
Далее то, что называют «северно-европейский» геномный типаж – это явно в основном гаплогруппа N (N1c1), возможно, в комбинации с I1. Этот типаж отсутствует в Сардинии, его совсем немного у французских басков, увеличивается при движении от Франции в Британию и Германию, достигает значительных величин у поляков, и доминирует в Литве и Финляндии.
Ясно, что мужские гаплогруппы в целом могут определять картину снип-мутаций в геноме, вопрос только, в какой степени и в каких ситуациях. Непредвзятые исследования это покажут.
А пока – вот что недавно появилось в связи с новой системой тестирования Geno 2.0. Система исключительно маркертирована, и, хочется надеяться, что-то хорошее принесет для идентификации снипов. И вот пошли первые результаты. Оказывается, в проект уже влезли «геногеографы» и началось то, о чем я писал выше. Они подразделили ожидаемые данные по регионам, и стали приписывать, кто к какому региону принадлежит, в процентах.
Вот, например, «портрет русского» по их данным:
На 51% «северные европейцы»
На 18% юго-западные азиаты
На 25% средиземноморцы
На 4% северо-восточные азиаты.
Кто-либо что понял?
Ну так вот, «портрет финна»:
На 57% «северные европейцы»
На 17% юго-западные азиаты
На 17% средиземноморцы
На 7% северо-восточные азиаты.
Если не все еще поняли, то мы – это финны. Но откуда финны на 17% средиземноморцы – это тоже на трезвую голову не понять.
Немного проясняет вопрос то, что это все вычислялось по «референсной выборке» геномов из русских и финнов. Откуда эти «референсные выборки» геномов брались, например, у русских – тоже надо разбираться, как и с тем, сколько в этой «референсной выборке» было геномов. Не исключено, что было совсем немного, причем с финно-угорской территории где-нибудь севернее Пскова, где N1c1 более 30%.
Вспоминается, что на Форуме еще давно негодовали, что российские попгенетики представили в международный консорциум в качестве «русских» представителей угро-финнов из какого-то карельского региона, и теперь это идет как «стандартная русская выборка». Если это действительно так, то пиши пропало. Никакие Geno 2.0 не помогут. Попгенетика продолжает маршировать… До поры, до времени.
Анатолий А. Клёсов