Биоинформатика для перфекциониста

Все подборки

Мы открываем новую магистратуру для биотеха. Если вам интересно разбираться в современных методах биоинженерии, и вы хотите развивать биотехнологии в реальном производстве, программа магистратуры «Промышленная биотехнология» в Университете «Сириус» — отличный способ стать востребованным специалистом для ведущих российских биотехнологических компаний! Эта программа сочетает фундаментальную научную подготовку с реальными задачами индустрии. Ещё во время обучения вы: • сможете участвовать в создании...

1 год назад

2. Библиотека OpenCV

OpenCV (Open Source Computer Vision Library) — это библиотека с открытым исходным кодом для работы с компьютерным зрением. Изначально она была написана на C++, но адаптирована для использования на Python, С, Java и MATLAB. В OpenCV есть встроенные алгоритмы компьютерного зрения на основе машинного обучения в виде отдельных модулей с разной функциональностью. Вот некоторые из них: Скачать библиотеку можно с помощью инструментов вашей IDE или с помощью командной строки: можно импортировать модуль и приступать к работе: import cv2 Библиотека работает с изображениями как с NumPy-массивами...

1 год назад

4. Языковые модели - большие и не очень

Языковая модель — это алгоритм, который анализирует текст, понимает его контекст, обрабатывает и генерирует новые тексты. В его основе лежат нелинейные и вероятностные функции, с помощью которых модель предсказывает, какое слово может быть следующим, — рассчитывает вероятность для каждого из возможных слов. В основе языковых моделей, как правило, лежат нейронные сети, обученные на большом количестве текстовой информации. Главная задача языковой модели — «понимать» текст по закономерностям в данных и генерировать осмысленный ответ...

1 год назад

3. pytorch vs tensorflow vs keras

PyTorch, TensorFlow и Keras — фреймворки для создания моделей глубокого обучения. У них есть свои особенности и области применения. Выбор между PyTorch, TensorFlow и Keras зависит от конкретных задач и предпочтений разработчика. PyTorch делает акцент на гибкости и простоте использования. Фреймворк использует динамические графы, позволяющие изменять структуру сети «на лету». PyTorch следует «питоническому» стилю программирования и тесно интегрирован с основными конструкциями Python. Поддерживает Python, C++, и Java...

1 год назад

2. Библиотеки для обработки естественного языка: HuggingFace, nltk, SpaCy, Natasha

Платформа Hugging Face Hub позволяет пользователям обмениваться моделями машинного обучения и наборами данных. Там есть и российские разработки. На платформе Hugging Face можно: Hugging Face, Inc. — американская компания основана в 2016 году Клеманом Делангом, Жюльеном Шомоном и Томасом Вольфом. Компания известна также своей библиотекой Transformers. NLTK — пакет библиотек и программ для символьной и статистической обработки естественного языка, написанных на языке программирования Python. Библиотека...

1 год назад

Другие языки биоинформатики

На мой взгляд, в биомедтехе за пределами питона и биопитона, наиболее часто используются для статистики R и для некоторых приложений Java, Javascript и вариации SQL для таблиц. Однако, существуют языки специально написанные для биоинформатики и, кроме BioSQL, Biopython, - это это язык программирования с закрытым исходным кодом, разработанный Гастоном Гонне и его коллегами из ETH Zurich. Серверная часть языка состоит из ядра, отвечающего за выполнение простых математических вычислений, транспортировку...

1 год назад

1. Введение в компьютерное зрение

Компьютерное зрение — это область искусственного интеллекта, связанная с анализом изображений и видео. Она включает в себя набор методов, которые наделяют компьютер способностью «видеть» и извлекать информацию из увиденного. Включает в себя классические алгоритмы компьютерного зрения Open CV и использование глубоких нейронных сетей PyTorch, TensorFlow, наилучший результат дают свёрточные...

1 год назад

10. Cлучайный лес

Случайный лес (Random Forest) — алгоритм машинного обучения с учителем, который состоит из множества отдельных независимых «решающих деревьев». Чтобы повысить качество предсказаний, в машинном обучении используют ансамбли — алгоритмы, сочетающие сразу несколько моделей. Метод случайного леса предложен Лео Брейманом и Адель Катлер. Алгоритм применяется для задач классификации (предсказание класса, например, к какому семейству принадлежит растение), регрессии (предсказание непрерывной величины — на сколько градусов повысится средняя температура зимой) и кластеризации...

1 год назад

9. Деревья решений

Дерево принятия решений — средство поддержки принятия решений, использующееся в машинном обучении, анализе данных и статистике, используют, чтобы разделить большой объём входных данных на относительно небольшие группы и прогнозировать наступление события в зависимости от определённых условий. Решающие деревья (decision trees) — это семейство моделей машинного обучения, которые предсказывают значение целевой переменной с помощью применения последовательности простых решающих правил (предикатов). Этот процесс в некотором смысле согласуется с естественным для человека процессом принятия решений...

1 год назад

8. Метод k-ближайших соседей

Метод K-ближайших соседей (K-Nearest Neighbors, KNN) — алгоритм классификации и регрессии, основанный на гипотезе компактности. Она предполагает, что расположенные близко друг к другу объекты в пространстве признаков имеют схожие значения целевой переменной или принадлежат к одному классу. Преимущества метода K-ближайших соседей: простота, отсутствие необходимости в обучении модели, гибкость. Недостатки: высокие вычислительные затраты при работе с большими наборами данных, чувствительность к шуму и выбросам в данных...

1 год назад

7. Логистическая регрессия или, как решить задачу классификации в МО

Классификация в математике — это распределение предметов на группы (классы) по каким-нибудь отличительным признакам. Да, и в других дисциплинах тоже. Логистическая функция в математике — это общая сигмоидальная (S-образная) кривая. Она моделирует кривую роста вероятности некоего события по мере изменения управляющих параметров (факторов риска). Простейшая логистическая функция может быть описана формулой P(t) = 1 / (1 + e^{-t}), где переменную P можно рассматривать как численность населения, а переменную t — как время...

1 год назад

6. "Нелинейная регрессия"

Регре́ссия (лат. regressio — обратное движение, отход) в теории вероятностей и математической статистике — односторонняя стохастическая зависимость (случайная, недетерминированная), устанавливающая соответствие между случайными переменными, то есть математическое выражение, отражающее связь между зависимой переменной у и независимыми переменными х при условии, что это выражение будет иметь статистическую значимость. В отличие от чисто функциональной зависимости y=f(x), когда каждому значению независимой...

1 год назад