Большие данные, полученные за десятилетия исследований, ввели в компьютерную языковую модель, чтобы посмотреть, сможет ли искусственный интеллект сделать более крупные открытия, чем люди.
Ученые из колледжа Святого Иоанна Кембриджского университета обнаружили, что технология машинного обучения может расшифровать «биологический язык» рака, болезни Альцгеймера и других нейродегенеративных заболеваний.
Результаты их новой работы были опубликованы в научном журнале PNAS 8 апреля 2021 года и в будущем их можно будет использовать для «исправления грамматических ошибок внутри клеток, вызывающих заболевания».
Профессор Туомас Ноулз, ведущий автор статьи и научный сотрудник Колледжа Святого Иоанна, говорит: «Использование технологии машинного обучения в исследованиях нейродегенеративных заболеваний и рака кардинально меняет правила игры. В конечном итоге цель будет заключаться в том, чтобы использовать искусственный интеллект для разработки таргетных препаратов, для резкого облегчения симптомов или вообще предотвращения деменции».
Каждый раз, когда Netflix рекомендует посмотреть очередной сериал или Facebook предлагает с кем-то подружиться, платформы используют мощные алгоритмы машинного обучения и делают обоснованные предположения о дальнейших действиях человека. Голосовые помощники, такие как Алекса и Сири, могут даже распознавать отдельных людей и быстро «разговаривать» с вами.
Доктор Кади Лиис Саар, первый автор статьи и научный сотрудник в колледже Святого Иоанна, использовала аналогичную технологию для обучения крупномасштабной языковой модели, чтобы посмотреть, что происходит, когда с белками внутри тела что-то идет не так и начинается болезнь.
Она сказала: «Человеческое тело содержит тысячи и тысячи белков, и функций многих из них ученые еще не знают. Мы специально попросили языковую модель на основе нейронной сети выучить язык изменяющих форму биомолекулярных конденсатов - капель белков, обнаруженных в клетках, - который ученым действительно необходимо понять, чтобы взломать язык биологической функции и сбоев, которые вызывают рак и нейродегенеративные заболевания, такие как болезнь Альцгеймера. Мы обнаружили, что он без явных подсказок смог узнать то, что ученые выяснили о языке белков за десятилетия исследований».
Белки - это большие сложные молекулы, которые играют важную роль в организме. Они выполняют большую часть работы в клетках и необходимы для структуры, функции и регулирования тканей и органов организма. Например, антитела - это белки, которые защищают организм.
Болезни Альцгеймера, Паркинсона и Хантингтона - три наиболее распространенных нейродегенеративных заболевания, но ученые считают, что их несколько сотен.
При болезни Альцгеймера, которой страдают 50 миллионов человек во всем мире, белки не работают, образуют сгустки и убивают здоровые нервные клетки. Здоровый мозг имеет систему контроля качества, которая эффективно избавляется от потенциально опасных масс белков, известных как агрегаты.
Ученые теперь думают, что некоторые неупорядоченные белки также образуют жидкие капли, называемые конденсатами, которые не имеют мембран и свободно сливаются друг с другом. В отличие от плотных белковых агрегатов, белковые конденсаты могут образовываться и распадаться, и их часто сравнивают с каплями воска, меняющими форму, в лавовых лампах.
Профессор Ноулз говорит: «В последнее время в научном мире белковые конденсаты привлекают большое внимание, потому что они контролируют ключевые события в клетке, такие как экспрессия генов - превращение ДНК в белки - и синтез белка - производство белков в клетках. Любые дефекты, связанные с этими капельками белка, могут привести к таким заболеваниям, как рак. Вот почему использование технологии обработки естественного языка в исследованиях молекулярного происхождения нарушения функции белка жизненно важно, если мы хотим исправлять вызывающие болезнь грамматические ошибки внутри клеток.»
Доктор Саар рассказывает: «Мы передали алгоритму все данные, хранящиеся на известных белках, чтобы он мог изучать и предсказывать язык белков так же, как он учит человеческий язык и как WhatsApp предлагает вам слова. Затем мы смогли спросить его о конкретной грамматике, которая заставляет образовывать конденсаты внутри клеток только некоторые белки. Это очень сложная проблема, и ее решение поможет нам изучить правила языка болезни».
Технология машинного обучения быстро развивается из-за растущей доступности данных, увеличения вычислительной мощности и технических достижений, которые приводят к созданию более мощных алгоритмов. Дальнейшее использование машинного обучения может изменить будущее исследований рака и нейродегенеративных заболеваний. Можно сделать открытия, выходящие за рамки того, что ученые в настоящее время уже знают и предполагают о заболеваниях, и, возможно, даже за пределами того, что человеческий мозг может осмыслить без помощи машинного обучения.
Доктор Саар объясняет: «Машинное обучение можно освободить от ограничений, которые исследователи считают целями своих научных исследований, и это будет означать, что мы обнаружим новые взаимосвязи, о которых мы еще даже не задумывались. Это действительно очень интересно».
Разработанная сеть уже бесплатно предоставлена исследователям по всему миру, что позволяет большему количеству ученых достигать новых высот в науке.