На мой взгляд, в биомедтехе за пределами питона и биопитона, наиболее часто используются для статистики R и для некоторых приложений Java, Javascript и вариации SQL для таблиц. Однако, существуют языки специально написанные для биоинформатики и, кроме BioSQL, Biopython, - это
Darwin
это язык программирования с закрытым исходным кодом, разработанный Гастоном Гонне и его коллегами из ETH Zurich. Серверная часть языка состоит из ядра, отвечающего за выполнение простых математических вычислений, транспортировку и хранение данных, а также интерпретацию команд пользователя, и библиотеки, представляющей собой набор программ, которые могут выполнять более сложные вычисления. Целевой аудиторией языка являются биологические науки, таким образом, библиотека состояла из таких процедур, как вычисление попарных выравниваний, филогенетических деревьев, множественных выравниваний последовательностей и предсказание вторичной структуры.
BioPerl
Он сыграл важную роль в проекте "Геном человека". BioPerl - это активный проект по разработке программного обеспечения с открытым исходным кодом, поддерживаемый Фондом открытой биоинформатики. Первый набор Perl-кодов BioPerl был создан Тимом Хаббардом и Джонгом Бхаком в Центре MRC в Кембридже, где Фредом Сэнгером было проведено первое секвенирование генома. Центр MRC был одним из центров и колыбелей современной биоинформатики, поскольку располагал большим количеством последовательностей ДНК и трехмерных белковых структур. Хаббард использовал th_lib.pl Библиотека Perl, содержащая множество полезных Perl-подпрограмм для биоинформатики. Бхак, первый аспирант Хаббарда, создал jong_lib.pl. Компания Bhak объединила две библиотеки подпрограмм Perl в Bio.pl. Название BioPerl было придумано совместно компанией Bhak и Стивеном Бреннером из Центра белковой инженерии (CPE). В 1995 году Бреннер организовал сессию BioPerl на конференции Intelligent Systems for Molecular Biology, проходившей в Кембридже. В ближайшие месяцы у BioPerl появилось несколько пользователей, в том числе Георг Фюллен, который организовал учебный курс в Германии. Коллеги и студенты Фюллена значительно расширили возможности BioPerl; в дальнейшем они были расширены другими разработчиками, включая Стива Червица, который активно разрабатывал Perl-коды для своей базы данных по геному дрожжей.
BioJava
Этот язык использует много проектов и для самых разных целей. BioJava - это программный проект с открытым исходным кодом, предназначенный для предоставления Java-инструментов для обработки биологических данных. BioJava поддерживает широкий спектр данных, начиная от ДНК и белковых последовательностей и заканчивая уровнем трехмерных белковых структур.
BioJS
это проект с открытым исходным кодом для биоинформатических данных в Интернете. Его целью является разработка библиотеки компонентов JavaScript с открытым исходным кодом для визуализации биологических данных. BioJS разрабатывает и поддерживает небольшие строительные блоки (компоненты), которые могут быть повторно использованы другими пользователями.
Первая версия BioJS была выпущена в 2012 году Джоном Гомесом Карвахалом. Она была разработана как библиотека веб-компонентов на JavaScript для представления биологических данных в веб-приложениях. Версия 2.0 включала в себя полный редизайн библиотеки и была выпущена в 2014 году в рамках проекта Google Summer of Code под руководством Мануэля Корпаса и разработанного Дэвидом Дао и Себастьяном Вильцбахом. С тех пор более 100 человек приняли участие в проекте. В настоящее время в реестре BioJS доступно более 150 компонентов.
BioRuby
BioRuby - это набор кода на Ruby с открытым исходным кодом, содержащий классы для вычислительной молекулярной биологии и биоинформатики. Он содержит классы для анализа последовательностей ДНК и белков, выравнивания последовательностей, анализа биологических баз данных, структурной биологии и других задач биоинформатики. BioRuby выпущен под лицензией GNU GPL версии 2 или Ruby и является одним из ряда проектов Bio*, направленных на сокращение дублирования кода.
В 2011 году проект BioRuby представил систему плагинов для программного обеспечения Biogeme, в которую ежемесячно добавлялось два или три новых плагина. Управление BioRuby осуществляется через веб-сайт BioRuby и репозиторий GitHub.
BioPHP
BioPHP - это набор PHP-кода с открытым исходным кодом, содержащий классы для анализа последовательностей ДНК и белков, выравнивания, анализа баз данных и других инструментов биоинформатики. BioRuby выпущен под лицензией GNU GPL версии 2 и является одним из ряда проектов Bio*, направленных на сокращение дублирования кода. Как проект в области биоинформатики с открытым исходным кодом, BioPHP связан с Фондом открытой биоинформатики. Проект BioPHP вырос из GenePHP, который был запущен Сержем Грегорио в 2003 году. GenePHP был задуман как реализация на PHP аналогичных биоинформатических пакетов, таких как BioPerl, BioPython и BioRuby. BioPHP был разработан в декабре 2005 года Джозебой Биканди в Университете Страны Басков, Испания, как продолжение GenePHP. GenePHP - один из четырех проектов, которые в настоящее время формируют BioPHP. Проекты BioPHP разделен на четыре "проекта". Проект GenePHP имеет структуру, аналогичную структуре других проектов Bio*, с рядом классов, представляющих (среди прочего) последовательности ДНК и белков, а также выравнивание последовательностей. Каждый класс разработан таким образом, чтобы быть достаточно общим для использования в ряде проектов BioPHP. Аналогичным образом, проект Functions нацелен на создание ряда функций для выполнения задач над объектами класса и уменьшения дублирования кода между проектами. Проекты Minitools и Tools направлены на создание набора PHP-скриптов для небольших, повторяющихся задач; к скриптам в проекте Tools обычно предъявляются особые требования, такие как взаимодействие со скриптами, отличными от PHP, и/или кодом (написанным, например, на Perl или C).
Bioconductor
Bioconductor - это бесплатное программное обеспечение с открытым исходным кодом для анализа геномных данных. Основан на языке программирования statistical R, но содержит материалы и на других языках программирования. Ежегодно он выходит в двух версиях, которые следуют за полугодовыми выпусками R. В любой момент времени существует релизная версия, которая соответствует выпущенной версии R, и версия для разработки, которая соответствует версии для разработчиков R.
Существует множество пакетов для аннотирования генома, которые в основном, но не исключительно, ориентированы на различные типы микрочипов. Проект был начат осенью 2001 года и осуществляется под руководством основной команды Bioconductor, базирующейся в основном в онкологическом исследовательском центре Фреда Хатчинсона, а также других сотрудников из международных учреждений. Пакеты Большинство компонентов Bioconductor распространяются в виде пакетов R, которые являются дополнительными модулями для R. Изначально большинство программных пакетов Bioconductor были ориентированы на анализ одноканальных Affymetrix и двух или более канальных кДНК/олиго-микрочипов. По мере развития проекта функциональные возможности программных пакетов расширялись, включая анализ всех типов геномных данных, таких как SAGE, sequence или SNP-данные.
Общие цели этих проектов заключаются в том, чтобы:
1. Обеспечить широкий доступ к широкому спектру мощных статистических и графических методов анализа геномных данных.
2. Облегчить включение биологических метаданных в анализ геномных данных, например, литературных данных из PubMed, данных аннотаций из LocusLink/Entrez.
3. Обеспечить общую программную платформу, которая позволяет быстро разрабатывать и внедрять подключаемое, масштабируемое и интероперабельное программное обеспечение.
Каждый пакет Bioconductor содержит текстовые описания функциональных возможностей пакета, ориентированное на конкретные задачи. Многие из них представляют собой простые инструкции, призванные продемонстрировать, как можно выполнить конкретную задачу с помощью программного обеспечения этого пакета. Другие предоставляют более подробный обзор пакета или даже могут обсуждать общие вопросы, связанные с пакетом.
Цель проекта Bioconductor - предоставить доступ к широкому спектру мощных статистических и графических методов для анализа геномных данных. Доступны пакеты анализа для: предварительной обработки данных Affymetrix и Illumina, массива кДНК; идентификации дифференциально экспрессируемых генов; теоретического анализа графиков; построения графиков геномных данных. Кроме того, сама система R package обеспечивает реализацию широкого спектра современных статистических и графических методов, включая линейное и нелинейное моделирование, кластерный анализ, прогнозирование, повторную выборку, анализ выживаемости и анализ временных рядов. Аннотация генома.
Проект Bioconductor предоставляет программное обеспечение для сопоставления микрочипов и других геномных данных в режиме реального времени с биологическими метаданными из веб-баз данных, таких как GenBank, LocusLink и PubMed (пакет аннотирования). Также предусмотрены функции для включения результатов статистического анализа в HTML-отчеты со ссылками на WWW-ресурсы с аннотациями. С помощью пакета AnnotationDbi доступны программные средства для сбора и обработки данных геномных аннотаций из таких баз данных, как GenBank, консорциум Gene Ontology, LocusLink, UniGene, проект UCSC Human Genome Project и других. Пакеты данных распространяются для обеспечения сопоставления между различными идентификаторами зондов (например, идентификаторами Affy, LocusLink, PubMed).
Этот проект также содержит несколько функций для геномного и филогенетического анализа (например, пакеты ggtree, phytools ..). Открытый исходный код. Проект Bioconductor полностью придерживается принципов открытого исходного кода и распространяется через платформу, подобную SourceForge.net.
Существует множество причин, по которым программное обеспечение с открытым исходным кодом полезно для анализа данных микрочипов и вычислительной биологии в целом. Среди них - обеспечение полного доступа к алгоритмам и их реализации, содействие улучшению программного обеспечения за счет исправления ошибок и подключаемых модулей, способствовать проведению воспроизводимых исследований путем предоставления открытых и доступных инструментов для их проведения (воспроизводимые исследования отличаются от независимой проверки)
Открытая разработка. Пользователям предлагается стать разработчиками, либо предоставив пакеты, совместимые с Bioconductor, либо документацию. Кроме того, Bioconductor предоставляет механизм для объединения различных групп с общими целями для содействия сотрудничеству в разработке программного обеспечения, возможно, на уровне совместной разработки.
Bioclipse
Bioclipse - это основанная на Java визуальная платформа с открытым исходным кодом для хемо- и биоинформатики, основанная на платформе Eclipse Rich Client Platform (RCP). В 2009 году Biclipse получил функцию создания сценариев, а в 2021 году - версию для командной строки.
Как и любое приложение RCP, Bioclipse использует архитектуру плагинов, которая наследует базовые функциональные возможности и визуальные интерфейсы от Eclipse, такие как справочная система, обновления программного обеспечения, настройки, кроссплатформенное развертывание и т.д.
Первый стабильный выпуск Bioclipse включает в себя плагин Chemistry Development Kit (CDK) для обеспечения хемоинформатического интерфейса, плагин Jmol для 3D-визуализации молекул и плагин BioJava для анализа последовательностей. Недавно были добавлены платформа R, использующая StateT и OpenTox. Разработан в сотрудничестве между группой кафедры фармацевтических биологических наук Университета Уппсалы, Швеция, Группой Кристофа Стейнбека из Европейского института биоинформатики и кафедрой аналитической химии Лейденского университета, но также включает в себя расширения, разработанные в других академических институтах, включая Каролинский институт и Маастрихтский университет.
Язык сценариев Bioclipse Bioclipse Scripting Language (BSL) - это среда разработки сценариев, в настоящее время основанная на JavaScript и Groovy. Она расширяет язык сценариев с помощью менеджеров, которые реализуют функциональность сторонних библиотек, как упоминалось выше. Таким образом, эти скрипты предоставляют средства для совместного использования результатов анализа в Bioclipse, например, на MyExperiment.org. Bioclipse определяет ряд основных типов данных, поддерживаемых менеджерами, что позволяет этим менеджерам обмениваться информацией.
Ну и в заключении скажу о:
Open Bioinformatics Foundation
Фонд открытой биоинформатики (Open Bioinformatics Foundation) - это некоммерческая, управляемая волонтерами организация, специализирующаяся на поддержке программирования с открытым исходным кодом в области биоинформатики. Миссия фонда заключается в поддержке разработки инструментов с открытым исходным кодом для биоинформатики, организации хакатонов, ориентированных на разработчиков, и в целом содействии разработке и продвижению программного обеспечения с открытым исходным кодом в области наук о жизни.
Фонд также организует и проводит ежегодную конференцию по биоинформатике с открытым исходным кодом, которая является дополнением к конференции "Интеллектуальные системы для молекулярной биологии". Фонд участвует в Google Summer of Code, выступая в качестве головной организации для отдельных проектов, связанных с биоинформатикой.
Фонд был создан в 2001 году на основе проектов BioJava, BioPerl и BioPython. Официальное членство в фонде было создано в 2005 году. В октябре 2012 года фонд основал ассоциацию с Software in the Public Interest (SPI), некоммерческой организацией, базирующейся в США, которая помогает другим организациям в создании и распространении бесплатного программного обеспечения с открытым исходным кодом. Сотрудничество с SPI позволяет делать финансовые пожертвования фонду (в США они не облагаются налогом по статье 501(c)3). Фондом управляет совет директоров, представляющий различные проекты Bio*. С 2019 года президентом OBF является Питер Кок (BioPython). Предыдущими президентами OBF были Юэн Бирни и Хилмар Лапп (NESCent), предыдущими членами правления - Стивен Э. Бреннер.
Проекты Фонд размещает серверы для списков рассылки, веб-сайтов и хранилищ кода для ряда связанных с биоинформатикой проектов с открытым исходным кодом, включая:
BioJava – Java toolkit
BioMOBY – Данные и выполнение приложений с помощью веб-сервисов.
BioPerl – Набор инструментов Perl
BioPython – набор инструментов Python
BioRuby – набор инструментов Ruby
BioPHP
EMBOSS – Набор инструментов для анализа последовательности.