Найти тему
Season Passed

Нейросеть сделала научные открытия при помощи языкового анализа 3 миллионов старых научных работ

Оглавление

Ученые из Национальной лаборатории Лоуренса Беркли использовали ИИ для выявления новых научных знаний, скрытых в старых научных работах. Алгоритм не знал определения «термоэлектрика». Он также не получил никакого обучения в области материаловедения.

Artificial Intelligence & AI & Machine Learning
Artificial Intelligence & AI & Machine Learning

Согласно исследованию, опубликованному в Nature 3 июля, ученые использовали алгоритм под названием Word2Vec, чтобы просеять старые научные статьи на предмет связей, которые не заметили люди. Нейросеть представила на основе языкового анализа список термоэлектрических материалов, которые могут быть эффективнее, чем те, что мы используем в настоящее время.

«Word2Vec может читать любую статью по материаловедению, поэтому может устанавливать связи, которые не смог обнаружить ни один ученый. Иногда алгоритм делает то, что делает исследователь; в других случаях он создает междисциплинарные ассоциации», — сказал исследователь Анубав Джэйн.

Для обучения исследователи «скормили» алгоритму 3,3 миллиона научных работ, связанных с материаловедением. Словарь нейросети в результате составил около 500 000 слов

«Принцип работы алгоритма Word2vec состоит в том, что вы обучаете нейронную сеть удалять каждое слово и предсказывать, какими должны быть слова, находящиеся рядом с удаленным словом», — говорит Джейн. «Тренируя нейронную сеть таким образом, вы получаете представления о словах, которые действительно способны дать знания».

Используя только слова, найденные в научных рефератах, алгоритм смог дать определения таким понятиям, как «периодическая таблица» и «химическая структура молекул». Алгоритм связывал слова, находящиеся близко друг к другу, затем он создавал векторы связанных слов, которые помогли ему определить эти понятия. Отсюда и название алгоритма — «Word2vec» или «Слово в вектор».

После того как ИИ продемонстрировал способность открывать материалы будущего, исследователи решили виртуально вернуться в прошлое

Для этого ученые протестировали алгоритм на старых научных работах, чтобы выяснить, может ли он предсказать открытия до того, как они произошли. Алгоритм справился.

В ходе эксперимента исследователи проанализировали статьи, опубликованные до 2009 года, и смогли предсказать один из лучших современных термоэлектрических материалов фактически за четыре года до его открытия в 2012 году.

Такое применение машинного обучения выходит за рамки материаловедения и термоэлектрики. Поскольку алгоритм может быть обучен лингвистическому анализу любого научного набора данных.

Вы можете легко применить его в других дисциплинах. Для этого нужно переобучить его на литературе по предмету, который вас интересует. Ведущий автор исследования, говорит, что другие ученые уже обратились к ним, желая узнать о работе данной нейросети побольше.

Фото: Mike MacKenzie.
Источник:
https://www.vpnsrus.com/
По лицензии:
(CC BY 2.0)

Источники информации: AI Trained on Old Scientific Papers Makes Discoveries Humans Missed

Unsupervised word embeddings capture latent knowledge from materials science literature

-2
Наука
7 млн интересуются