Найти тему
Rosetta@home

Как вычисление протеинов помогает человечеству

Оглавление

Вот вы присоединились к проекту Rosetta@home, и ваш компьютер начал что-то считать. Информация о том, как абстрактные гигафлопсы конвертируются в практические результаты, можно получить из названия задания (workunit в BOINC-терминологии).

0. Выцепляем информацию из задачи

Если вы не считаете протеины, то можете сразу перейти к разделу 1

Скорее всего, интерфейс BOINC установлен в упрощённый вид. Тогда потребуется показать графику:

Видите длинную строку?

foldit_2008899_0002_00_asym_dock_SAVE_ALL_OUT_900522_2373

Это и есть имя задания.

В полном виде его видно как один из столбцов в списке задач:

-2

Также свои задания можно посмотреть в личном кабинете:

-3

А теперь собственно к их разновидностям!

1. RosettaDesign

Как определить: содержит слово design в названии задачи

-4

Этот проект решает основную для Института дизайна протеинов задачу — ищет аминокислотные последовательности с наименьшей энергией для заданных белковых структур.

То есть вместо того, чтобы предсказывать свойства белков по их аминокислотным последовательностям, мы можем создавать протеины с заданными свойствами, аналогов которым в природе не существует!

💊 Уже создан «с нуля» протеин, обладающий противоопухолевыми свойствами (аналог IL-2 с гораздо меньшими побочными эффектами).

☣️ Разработаны 20 000 пептидов с потенциальным противовирусным (как от обычной простуды, так и от вызывающего рак вируса Эпштейна-Барра) и противотоксинным действием.

🧠 Были определены участки протеинов, ответственные за образование амилоидных бляшки при болезни Альцгеймера.

💉 Получена потенциальная вакцина от респираторно-синцитиального вируса, которым переболевает каждый ребёнок в возрасте до 3 лет.

Ценители биоинженерии могут найти множество других восхитительных протеинов, созданных с помощью Rosetta@home. А те, кто имеют соответствующие навыки, могут загрузить своё задание на находящийся в свободном доступе сервер RosettaDesign!

Больше про задачи, которые может решить проект, сказано в видео TED (есть русские субтитры):

⚠️ Обратите внимание на задания, имеющие COVID-19 в своём названии: выполняя их, вы помогаете в борьбе с коронавирусом. Около 35 учёных учёных из Института дизайна протеинов работают над созданием вакцины, лекарства и средств диагностики, а также над разработкой методологии.

2. Foldit

Как определить: содержит слово foldit в названии задачи

Играя в Foldit, волонтёры не только сворачивают уже существующие белки, но и разрабатывают новые многообещающие протеины!

Но чтобы понять, есть ли смысл синтезировать новый белок, его сначала проверяют с помощью Rosetta@home. Если он сворачивается так же, как и предсказал игрок, его произведут и протестируют в Институте дизайна протеинов.

💊 Команда Foldit отобрала 99 перспективных дизайнов белков, способных связываться с S-протеином вируса SARS-CoV-2. Их протестируют вместе с теми, которые были разработаны с помощью RosettaDesign, чтобы создать противовирусное лекарство.

А в 2011 году игроки смогли вычислить структуру фермента, который ВИЧ использует для репликации. При этом спектр задач проекта не ограничивается медициной: игроки могут решать биоинженерные задачи совершенно разного назначения.

Стоит отметить, что проект Foldit гораздо более публичный, чем Rosetta@home и, наверное, даже Folding@home: их команда регулярно публикует отчёты о сделанном в Twitter и своём блоге, а также проводит сессии вопросов-ответов на Reddit и в Discord.

3. RosettaDock

Как определить: содержит слово dock в названии задачи

-5

В рамках этого проекта рассчитывается взаимодействие комплекса протеин-протеин, что очень важно для создания лекарства от рака:

Некоторые белки часто находят в аномально больших количествах на поверхности раковых клеток. Мы начали моделировать маленькие протеины, которые потенциально способны прочно связываться с такими маркерами опухолей. Если мы добьёмся успеха, наши партнёры проверят созданные протеины на способность наводить противораковые средства прямо к опухоли.
— Дэвид Бейкер, директор Института дизайна протеинов

Другое применение докинга — "наноклетки", которые могут быть использованы для доставки лекарств и производства биотоплива.

Метод RosettaDock уже применялся для моделирования взаимодействия между протеинами токсина сибирской язвы и антител с белками вируса герпеса HSV-1.

Точность этого метода достаточно высокая, так как при расчёте учитывается влияние каждого атома.

4. Robetta (Rosetta Beta)

Как определить: содержит слово robetta или префикс rb_ в названии задачи

-6

Робетта — это общедоступный сервер, позволяющий любому желающему определить трёхмерную структуру белка, имея лишь последовательность аминокислот.

Согласно данным CAMEO, предсказания точны на 69%, а ждать их приходится в среднем полтора дня, при этом исследователь имеет доступ к тонкой настройке процесса фолдинга.

Robetta использует три подхода:

  1. AB (ab initio) — протеин сворачивается с нуля. Метод не подходит для белков длиннее 150 аминокислотных оснований.
  2. CM (comparative modeling) — если в банке данных протеинов имеется белок, который похож на вычисляемый, то он берётся за основу. Это позволяет получать более точные предсказания за меньшее время.
  3. Predict domains — протеин разбивается на фрагменты, каждый из которых вычисляется отдельно. Этот метод является наиболее затратным в плане времени и вычислительных ресурсов.

😷 Именно с помощью Robetta были посчитаны коронавирусные протеины задолго до того, как их структуру стало возможным определить экспериментальным путём.

Заключение

Вот и всё, что касается каких-то специфических заданий Rosetta@home. Остальные задания сводятся к сворачиванию протеинов самого широкого профиля. Чтобы представить сложность этой задачи, обратимся к комиксу xkcd:

— Чем ты занимаешься?
— Я создают ПО, которое предсказывает, как происходит фолдинг протеинов.
— Это трудная проблема?
— Ну, наверное, кто-нибудь когда-нибудь и сможет найти задачу посложнее.
— И почему же это так трудно?
— Ты когда-нибудь делал бумажных журавликов оригами?
— Ну да.
— А теперь представь, что тебе нужно определить такую последовательность сгибов, чтобы сделать живого журавля.
— ... только сгибая? Или я могу делать надрезы?
— Только если ты сможешь свернуть фермент протеазу.
— Чем ты занимаешься? — Я создают ПО, которое предсказывает, как происходит фолдинг протеинов. — Это трудная проблема? — Ну, наверное, кто-нибудь когда-нибудь и сможет найти задачу посложнее. — И почему же это так трудно? — Ты когда-нибудь делал бумажных журавликов оригами? — Ну да. — А теперь представь, что тебе нужно определить такую последовательность сгибов, чтобы сделать живого журавля. — ... только сгибая? Или я могу делать надрезы? — Только если ты сможешь свернуть фермент протеазу.

Помните: вклад даже со слабых устройств очень ценен для науки! Чем больше вычислительных мощностей будут иметь проекты, тем больше продвинутся наука и технологии, и тем лучше будет для человечества.

Наука
7 млн интересуются