Современные технологии искусственного интеллекта не только помогают нам автоматизировать процессы и улучшать нашу жизнь, но и находят свое применение в научных и медицинских исследованиях. В частности, использование ИИ в биологических и медицинских процессах может значительно улучшить результаты и упростить процедуры. В этой статье мы рассмотрим, несколько примеров нейросетей которые помогают лучше понимать и помочь биологическим процессам.
DeepCrop
Урожайность может быть максимизирована при использовании лучшего генетического разнообразия и наиболее эффективных методов управления культурой. Ученые разработали различные модели машинного обучения для прогнозирования факторов, которые производят наибольший урожай определенных культурных растений. Однако традиционные модели не могут учитывать высокий уровень вариации в параметрах или большие объемы входных данных, что может привести к сбоям моделей в определенных условиях.
Для преодоления этого ограничения исследователи из Кореи под руководством профессора Чжун Эок Сон из Национального университета Сеула создали новую модель глубокого обучения для гидропонных сладких перцев, известную как "DeepCrop". Модель может учитывать несколько переменных ввода и имеет меньше ограничений на объем обрабатываемых данных, что позволяет ее применять в большинстве условий и расширять на подобные приложения.
DeepCrop - это модель, основанная на процессах, которая может моделировать рост культур в ответ на различные факторы и условия окружающей среды. Модель может быть масштабирована для включения множества типов ввода или большего объема данных. Одной из причин высокой универсальности DeepCrop является то, что она построена исключительно на нейронных сетях.
Для проверки предсказаний DeepCrop команда выращивала сладкий перец в течение двух лет в теплицах, и результаты были опубликованы в Plant Phenomics 1 марта 2023 года. Сравнение предсказанных и фактических паттернов роста растений показало, что DeepCrop превзошел другие существующие модели культурных растений на основе процессов, что подтверждается ее эффективностью моделирования.
Вместе с тем, модель может быть улучшена, и исследователи считают, что DeepCrop может улучшить доступность моделей культурных растений и смягчить проблемы фрагментации в исследованиях моделей культурных растений.
EmbryoNet
Сложные многоклеточные организмы могут возникнуть только из оплодотворенных яиц, поскольку эмбриональное развитие биологически точно контролируется. В этом контексте ключевую роль играет межклеточная коммуникация через сигнальные пути. Если деятельность сигнальных путей нарушена, эмбрион будет иметь характерные дефекты развития.
В новом исследовании, опубликованном в журнале Nature Methods, исследователи под руководством профессора биологии развития Патрика Мюллера из Университета Констанца представляют свое бесплатное программное обеспечение EmbryoNet. Автоматизированное программное обеспечение для анализа изображений обнаруживает и классифицирует дефекты, возникающие во время развития эмбрионов рыб. Классификацию можно использовать для вывода, какой сигнальный путь был нарушен в этих эмбрионах. В высокопроизводительных приложениях скорость и точность программного обеспечения позволяют исследовать, например, механизмы действия лекарств.
До сих пор для идентификации основных сигнальных механизмов на основе видимых дефектов развития были необходимы эксперты, которые должны были микроскопически исследовать большое количество эмбрионов. Этот затратный по времени метод скучен и также склонен к отличающейся, частично субъективной оценке из-за отсутствия стандартизации.
"С EmbryoNet мы используем подход на основе машинного обучения, где нейронная сеть, обученная на более чем 2 миллионах представительных изображений эмбрионов зебры, делает объективную классификацию", сообщает Матвей Сафрошкин, один из программистов EmbryoNet, вместе с Хернаном Моралес-Наверрете. В дополнение к данным изображений, которые нужно классифицировать, EmbryoNet также принимает во внимание временную информацию о развитии эмбриона и связь между дефектом развития и соответствующим сигнальным путем.
Ученые проверили производительность своего программного обеспечения в прямом сравнении с людьми. Задача: соотнести ранее не классифицированные изображения эмбрионов зебры с возможными дефектами развития. Не только опытные эксперты в области биологии развития конкурировали с EmbryoNet, но и группы студентов в рамках бакалаврского практического курса.
"Данные студентов были включены в наше исследование и являются хорошей демонстрацией того, как современные исследования и университетское обучение могут быть полезны друг для друга", - говорит Мюллер. Результаты исследования показывают, что EmbryoNet может надежно идентифицировать различные мутанты сигнальных путей в зебрах. Более того, программное обеспечение было намного быстрее и даже более чувствительно, чем его человеческие коллеги, включая экспертов.
Исследователи также продемонстрировали, что EmbryoNet может быть применен не только к зебрам - популярной модели в биологии развития, но и к другим видам позвоночных. "С относительно небольшими усилиями мы смогли переобучить EmbryoNet для классификации других видов, которые эволюционно отделились от зебры сотни миллионов лет назад", - объясняет Дэниел Чапек, биолог развития и один из авторов исследования.
Таким образом, программное обеспечение с открытым исходным кодом, которое можно свободно использовать и модифицировать, имеет потенциал ускорить характеристику мутантов развития в различных видах.
PeSTo
Ученые из EPFL разработали модель искусственного интеллекта PeSTo, которая с высокой уверенностью может предсказывать места связывания белков с другими белками, нуклеиновыми кислотами, липидами, ионами и малыми молекулами. Низкая вычислительная стоимость модели позволяет обрабатывать большие объемы структурных данных, открывая возможности для новых биологических открытий. Исследование опубликовано в журнале Nature Communications.
Ученые группы Маттео Даль Пераро в EPFL разработали новый инструмент под названием PeSTo (сокращенно от Protein Structure Transformer), который может предсказывать конкретные области на поверхности белка, которые могут взаимодействовать с другими белками, нуклеиновыми кислотами, липидами, ионами и малыми молекулами. Эти интерфейсы являются ключевыми для формирования супрамолекулярных комплексов и изменения их функции.
PeSTo основан на нейронной сети на основе технологии трансформатора. В контексте машинного обучения трансформатор является типом нейронной сети, разработанной для обработки последовательных данных, таких как естественный язык, используя механизмы само-внимания для оценки важности разных частей входной последовательности и делать прогнозы. Технология была представлена Google Brain в 2017 году и теперь является основой многих современных инструментов искусственного интеллекта.
PeSTo может делать предсказания, основанные только на позиции в пространстве и типе атомов, не нуждаясь в описании физики и химии интерфейса белка с использованием дополнительных внешних методов. Это устраняет "накладные расходы" на предварительное вычисление молекулярных поверхностей и дополнительных свойств, делая его намного быстрее, надежнее и более общим, чем текущие методы.
PeSTo превосходит другие методы предсказания интерфейсов взаимодействия белков и может предсказывать взаимодействия с нуклеиновыми кислотами, липидами, лигандами, ионами и малыми молекулами с высокой уверенностью. Низкая вычислительная стоимость модели делает ее ценным инструментом для научного сообщества.
Ученые использовали PeSTo на базе данных человеческого фолдома, проанализировав взаимодействия, которые у человеческих белков есть с другими молекулами, и предоставили подробную информацию о "интерфейсоме" человека - общей сумме всех интерфейсов взаимодействия белков в человеческом организме.