Самообучающиеся системы могут обнаруживать скрытые закономерности в огромных наборах данных, превосходя то, что люди когда-либо могли найти самостоятельно.
Научные достижения за последние несколько веков не только привели к большему пониманию вселенной; они подняли уровень жизни для многих людей по всему миру. Тем не менее, есть все еще огромные проблемы, с которыми мы плохо подготовлены, о чем свидетельствуют изменение климата и пандемия COVID-19, которые показали, что нам еще предстоит понять всю сложность природы. Для решения масштабов проблем, стоящих сегодня перед человечеством, необходимы радикальные решения, и научные достижения будут иметь ключевое значение для этого процесса. Искусственный интеллект обещает ускорить фундаментальные открытия, углубляя природу вопросов, которые могут задать исследователи.
В своем дальновидном эссе « Как мы можем думать », опубликованном в 1945 году, американский инженер и защитник науки Ванневар Буш предсказал, что людям скоро понадобится полагаться на внешние устройства для расширения своего разума. Уже тогда он видел, что скорость научных открытий была настолько велика, что потребность хранить, обрабатывать и понимать информацию уже превышала биологический потенциал людей.
Его дальновидные наблюдения звучат правдивее, чем когда-либо: одна из задач современной науки состоит в том, чтобы разобраться в огромном количестве информации, которую мы собрали о мире. Учитывая масштаб данных, полученных наукой - от Большого адронного коллайдера до масштабных проектов генома - ни один человек не может проанализировать все это. AI помогает нам превратить это изобилие информации в понимание, позволяя нам задавать вопросы, которые было бы трудно решить отдельным людям.
Ученые давно используют компьютерные технологии для развития науки, применяя компьютерные программы для моделирования и симуляции природных систем для объяснения и понимания научных явлений. Этот подход был невероятно плодотворным для науки и способствовал достижениям, начиная от моделирования атомов до моделей вселенной. Тем не менее, эта классическая парадигма ограничена своей зависимостью от программистов-людей, которые должны сначала извлечь правила из теорий и наблюдений, а затем использовать эти правила для кодирования поведения программы. Мы надеемся использовать системы ИИ, чтобы выводить такие правила непосредственно из данных или опыта, и потенциально выходить за рамки того, что могут расшифровать отдельные исследователи. Самообучающиеся системы могут исследовать потенциальные решения и стратегии, обнаруживая скрытые свойства базовой структуры огромных наборов данных, и, следовательно, могут дополнять.
Таким образом, ключевым моментом является нахождение правильных проблем для этих систем. Несмотря на то, что проводится большая работа по применению ИИ в науке, нет необходимости в том, чтобы прямое применение этих технологий привело (или должно) привести к прорыву в каждой научной проблеме. Наиболее эффективные достижения будут получены в результате применения методов искусственного интеллекта к вопросам, которые действительно важны для общества и для которых требуются сложные способности к рассуждению и анализу. Большая часть искусства решения проблемы заключается в том, чтобы в первую очередь выбрать правильный вопрос. Таким образом, ключевым моментом является поиск правильных проблем, которые эти системы должны исследовать.
Например, одним из наиболее важных открытых вопросов в биологии является понимание того, как белки принимают свою форму. Белки необходимы для здоровой работы организма и действуют как миниатюрные механизмы в клетках для выполнения многих жизненных задач. Форма белка определяет его функцию, поэтому так много исследовательских групп посвящены изучению структуры различных белков; Как только форма белка станет известна, исследователи смогут лучше понять, как он работает, и найти лекарства, которые взаимодействуют с ним при сбоях при заболеваниях. Случилось так, что это идеальное приложение для ИИ, потому что у нас есть относительно большие наборы данных известных структур белка для обучения систем, и это проблема, для которой мы можем количественно оценить прогресс.
Ученые могут потратить годы на разработку формы отдельного белка, используя трудоемкие экспериментальные методы, такие как кристаллография. Вместо того, чтобы определять форму одного белка за раз, что, если бы мы могли использовать существующие данные, чтобы научить систему ИИ предсказывать форму любого встречающегося в природе или даже теоретически возможного белка только из описания его аминокислотной последовательности. Основанная на методах обучения, вдохновленных нейробиологией, наша недавно опубликованная модель AlphaFold может обучаться на больших наборах данных известных белковых структур, чтобы предсказать, как одномерная цепочка аминокислот складывается в трехмерную форму.
Используя эту систему, мы недавно создали прогнозы для форм шести белков, включающих SARS-CoV-2, вирус, который вызывает COVID-19. Хотя структуры, предсказанные с помощью нашего метода, не приводят непосредственно к излечению, они могут дать полезные советы исследователям, работающим над лекарственными средствами и антителами, которые могут действовать против вируса, и могут улучшить наше понимание этой глобальной угрозы для здоровья.
Многие академические группы в течение многих лет добивались устойчивого прогресса в проблеме свертывания, о чем свидетельствует повышение точности CASP, соревнования по прогнозированию сворачивания белка раз в два года. В 2018 году AlphaFold получил высшую награду на CASP13, что на 40 процентов повысило точность по сравнению с лучшей моделью предыдущего соревнования. В будущем этот подход может помочь ученым сосредоточиться на наиболее перспективных направлениях, экономя время и деньги, например, в общеизвестно дорогостоящем процессе разработки лекарств. С помощью ИИ-моделирования можно создать новые протеины in silico, а затем протестировать их в реальном мире, что поможет исследователям более эффективно направлять исследовательские усилия и финансирование.
В этом прелесть ИИ: он позволяет абстрагироваться от частного к общему, выводя из опыта принципы объединения. Это углубляет природу вопросов, которые могут задать ученые: не просто «какова форма белка X?» но, что более важно, «что диктует форму любого белка?» Ответ на вопрос, подобный этому, дает не один ответ, а множество, открывая новые поля для исследований.
Если мы сможем добиться достаточного прогресса в прогнозировании того, как белки принимают свою форму, мы могли бы упростить разработку новых лекарств, ферментов и универсальных вакцин, что приведет к бесчисленным социальным выгодам. Точно так же, если мы сможем использовать ИИ для точного моделирования коллекций атомов, возможно, будет возможно рационально разработать новые материалы для батарей, технологии солнечной энергии, улавливания углерода и многого другого. При правильном вопросе, правильных данных обучения и способности количественно оценить обучение, системы искусственного интеллекта способны углубить наше научное понимание и ускорить новые технологические прорывы. ИИ - это гораздо больше, чем автоматизация классификации изображений или рационализация цепочек поставок. Мы хотим использовать это, чтобы открыть новые знания о вселенной, и использовать это понимание, чтобы улучшить мир.
Предыдущая статья: Согласно новому отчету, в настоящее время готовится следующая крупная игра «Grand Theft Auto».