Исследователи из России, США и Европы разработали алгоритм, позволяющий в 2,5-5 раз повысить качество работы систем, отвечающих за расшифровку внутриклеточных вариаций различных молекул РНК. Этот инструмент ускорит изучение ранее неизвестных функций генов, пишут исследователи в статье в журнале Nature.
"Разработанный нами алгоритм IsoQuant позволяет уменьшить число ложных позитивных срабатываний при прочтении различных изоформ РНК при помощи Оксфордской системы секвенирования примерно в 2,5 раза при наличии эталонных образцов, а также в пять раз при их отсутствии. Аналогичным образом он способен улучшить работу и других систем", - пишут исследователи.
Как объясняют ученые, гены человека и всех других многоклеточных живых существ могут содержать "инструкции" по синтезу не одной, а сразу нескольких белковых молекул. Это возможно благодаря тому, что ядро клетки может особым образом менять структуру молекулы РНК, которая представляет собой копию того или иного гена, путем вырезания из цепочки нуклеотидов различных "ненужных" частей.
Этот процесс, который ученые называют "альтернативным сплайсингом", радикально меняет то, как и где будет работать молекула белка, которую кодирует один и тот же участок ДНК. Подобное перепрофилирование работы генов играет критическую роль в жизнедеятельности многих тканей тела, в том числе и мозга, и нарушения в его работе приводят к самым тяжелым последствиям для индивида.
Ускоренные поиски и изучение молекул РНК
Группа исследователей под руководством Андрея Пржибельского, научного сотрудника Санкт-Петербургского государственного университета, разработала подход, который позволит значительно ускорить поиски и изучение различных вариаций молекул РНК, которые возникают в клетках в результате "альтернативного сплайсинга". Их изучение осложнено большим числом ложно-позитивных срабатываний, возникающих при каталогизации и изучении структуры данных нитей РНК.
Пржибельский и его коллеги разработали алгоритм IsoQuant, позволяющий значительно снизить число подобных ошибок. Он опирается в своей работе на так называемые "деревья графов", математические абстракции, которые состоят из наборов объектов, попарно связанных друг с другом. Их роль играют так называемые интроны, вставки из "мусорной" ДНК, которые удаляются из генов при их считывании и формировании их РНК копий.
Работу IsoQuant ученые проверили на нескольких наборах нитей РНК, в том числе извлеченных из клеток тела людей и мозга мышей. Проведенные исследователями замеры показали, что созданный ими алгоритм примерно в 2,5-5 раз уменьшил число ложных позитивных срабатываний, а также выявил значительно больше ранее неизвестных вариаций РНК, чем уже другие алгоритмы, применяемые при анализе данных с систем расшифровки РНК.
Как надеются исследователи, разработанный ими подход ускорит изучение богатства РНК-молекул, присутствующих в живых клетках, в том числе в нейронах носителей различных нейрофизиологических нарушений и нейродегенеративных болезней. Это критически важно для создания терапий, предотвращающих развитие данных заболеваний, подытожили исследователи.