Одна из крупнейших в мире баз данных целых геномов стала еще больше. Британское медицинское исследование, известное как UK Biobank, в конце ноября 2023 года предоставило ученым для анализа полные генетические последовательности почти 500 тыс. человек, что более чем в два раза превышает размер предыдущего набора данных. По словам организаторов, в сочетании с долгосрочными данными о состоянии здоровья участников эти данные способны изменить биомедицинскую науку.
Генетики с воодушевлением восприняли эту новость. Такой большой набор последовательностей представляет собой уникальный ресурс для изучения биологических основ здоровья и болезней человека, сообщил директор Института трансляционной геномики Гельмгольца в Мюнхене Элефтерия Зеггини.
С момента своего основания в 2006 году Биобанк Великобритании собрал биологические образцы, снимки всего тела и данные о здоровье и образе жизни полумиллиона добровольцев среднего и пожилого возраста. С согласия участников организация также отслеживала заболеваемость этих людей раком, слабоумием и другими болезнями по записям, которые вела Национальная служба здравоохранения страны.
С 2012 года платформа периодически выпускает партии этих анонимизированных медицинских данных вместе с генетической информацией об участниках, включая сканирование ДНК-маркеров и последовательности экзома (которые составляют около 2% человеческой ДНК, кодирующей белки). Лаборатории по всему миру могут подать заявку на доступ к этим массивам данных. По данным Биобанка Великобритании, на ноябрь 2023 года заявки получили более 30 тыс. исследователей из 90 стран. На основе этих данных было опубликовано более 9 тыс. рецензируемых научных статей о генах, влияющих на самые разные процессы - от риска развития болезни Альцгеймера и сердечных заболеваний до черт характера и, что весьма спорно, сексуальной ориентации.
Британский Биобанк выпустил предварительную партию из примерно 200 тыс. целых геномов - всей генетической последовательности участников - в 2021 году. Сегодняшний релиз, финансируемый правительством Великобритании, Wellcome Trust и четырьмя фармацевтическими компаниями в размере £200 млн, состоит из новых и улучшенных данных секвенирования 491 554 участников.
В отличие от экзомов, целые геномы позволяют исследователям искать связь между признаками и редкими генетическими вариантами как в белково-кодирующих, так и в некодирующих областях генома. Хотя известно, что некодирующие регионы участвуют в регуляции активности генов, а также выполняют другие функции, многое остается неизвестным о том, какой вклад они вносят в биологию человека. По словам кардиолога и генетика из Массачусетской больницы общего профиля и Гарвардской медицинской школы Прадипа Натараджана, который широко использует Биобанк Великобритании в своей работе, увеличение массива данных должно привести к существенным достижениям.
С 30 ноября 2023 года утвержденные исследователи могут получить доступ к данным через облачную платформу анализа, хотя четыре компании, участвующие в проекте - Amgen, AstraZeneca, GSK и Johnson & Johnson - уже получили 9 месяцев эксклюзивного доступа в обмен на финансирование в размере £25 млн каждая. Некоторые из них уже начали делиться предварительными анализами на встречах и в препринтах. Консультант компании AstraZeneca и генетик из Медицинского колледжа Бэйлор Райан Дхиндса, который представил анализ некоторых типов редких вариантов в новом наборе данных на встрече Американского общества генетики человека в ноябре 2023 года, говорит, что он приветствует улучшенное разрешение и статистическую мощность, которые обеспечивает последняя версия.
Несмотря на несравнимые размеры и обширные данные о здравоохранении, Биобанк Великобритании имеет ряд заметных ограничений. Например, участники, как правило, более здоровые и обеспеченные, чем население Соединенного Королевства в целом, и большинство из них - люди европейского происхождения: Только около 10 тыс. участников имеют африканское происхождение, а еще 10 тыс. - южноазиатское. Для сравнения, около половины из более чем 725 тыс. участников проекта Биобанка Национального института здравоохранения США «Все мы» относятся к группам расовых или этнических меньшинств, хотя эта платформа опубликовала только около 250 тыс. целых геномных последовательностей и пока доступна только исследователям из Соединенных Штатов.
Со слов генетик из Института генетики Университетского колледжа Лондона Дэвида Кертиса, на ноябрь 2023 года Биобанк Великобритании остается очень уникальным ресурсом. Он на голову и плечи выше всех остальных... Кертис думает, что во всем мире найдутся исследователи, которые займутся этим данными и сделают фантастические открытия.