Ученые НГУ и Института цитологии и генетики СО РАН разработали новый подход для сбора, хранения и анализа информации о колосьях пшеницы. Теперь для того, чтобы измерить параметры колоска необходимо только сделать снимок. Дальше информационная система с помощью цифрового зрения определит до сотни различных параметров пшеницы.
Для селекционеров и генетиков большое значение имеют такие параметры, как число зерен в колосе, масса тысячи зерен и другие. Эти характеристики тесно связаны с продуктивностью растений. Полезным селекционным признаком является форма зерновки и такие характеристики колоса, как его тип, длина, профиль, наличие или отсутствие остей, число плодоносных и стерильных колосков (то есть озерненность), ломкость колоса, свойства колосковой чешуи. Собирать и описывать эти признаки вручную — процесс трудоемкий и длительный.
«Научные сотрудники нашей лаборатории давно занимаются решением важной задачи, направленной на то, чтобы заменить измерительные способы генетиков и селекционеров с линейки на компьютер или мобильный телефон. Мы хотели бы сделать так, чтобы ученым больше не надо было бы вручную измерять параметры растений, а просто сделать фотоснимок колоса пшеницы, соблюдая при этом ряд технических условий, и затем получить интересующую их информацию, загрузив это фото в нашу базу данных. Создавая ее, мы работали с обычным анализом изображений, то есть с цифровым зрением, и применили глубокое машинное обучение в части распознавания изображений с помощью нейросетей, выделения отдельных признаков и классификации, — рассказал ведущий научный сотрудник Лаборатории эволюционной информатики и теоретической генетики Института цитологии и генетики СО РАН, сотрудник кафедры информационной биологии Факультета естественных наук Новосибирского государственного университета Дмитрий Афонников.
Активное участие в работе по созданию системы SpikeDroidDB приняли студенты Механико-математического факультета НГУ, Факультета информационных технологий НГУ, а также Математического центра в Академгородке. Они провели оцифровку и аннотацию коллекции колосьев гибридов F2 от скрещивания австралийского сорта мягкой пшеницы Triple Dirk с образцом KU506 китайской пшеницы Triticum yunnanense. Был также проведен анализ изменчивости колосьев по форме, длине и ширине.
Как говорят ученые, сложность работы исследователей состояла в том, что в ее основу были заложены цифровые изображения колосьев. Именно они служат исходными данными при применении методов автоматического фенотипирования. В своей базе данных они собрали более 10 тысяч цифровых изображений колосьев и описали их структуру и свойства. Это нужно для того, чтобы ученые-генетики могли по фотографии получить все необходимые им данные – размеры колоса, его толщину, ширину, наличие остей, цвет колосьев и прочее, фактически заменив привычные измерения на анализ изображений. «Мы получаем в итоге больше характеристик, к тому же они отличаются большей точностью. В данном случае у автоматизированной системы возможностей больше, чем у человека. Если некоторые параметры человек определяет «на глаз», то компьютерное зрение фиксирует их более точно и продуктивно. С помощью компьютерного анализа цифровых изображений мы можем определять сотни параметров колосьев – как основных, так и их производных, и далее использовать их для разработки методов и классификаций, а также оценки продуктивности. Такие технологии обеспечивают высокую степень автоматизации сбора информации, ее хранение в базах данных, интеграцию с данными о генотипе и параметрах окружающей среды, создают основу для интеллектуального анализа полученной информации. Имеется и еще одно важное преимущество: цифровое описание колоса и его изображение будут храниться в базе данных сколь угодно долго, тогда как высушенный колос, помещенный в бумажный конверт, может рассыпаться, сменить цвет или испортиться, и образец будет утрачен, — пояснил Дмитрий Афонников.
В системе SpikeDroidDB с каждым колосом можно соотнести несколько изображений. Для каждого из них указывается протокол, с помощью которого оно было получено. Для съемки разработчики использовали два протокола получения цифровых изображений зрелых колосьев. Они выбрали синий фон, как наиболее контрастный к цвету колосьев и позволяющий легко отделить объект от фона. Съемка колосьев проводилась в двух вариантах: в первом колос располагается вертикально перед синим фоном, второй вариант съемки предусматривает горизонтальное положение колосьев на стекле над синим фоном.
Дмитрий Афонников рассказывает, что селекционеры и генетики, занимающиеся выведением новых сортов пшеницы, проявляют большой интерес к данной разработке и высказывают заинтересованность в работе с ней, чтобы автоматизировать кропотливые и длительные рутинные процессы, требующие точности и концентрации внимания. Кроме того, система SpikeDroidDB позволит избежать субъективных оценок, ошибок и неточностей при фенотипировании образцов колосьев.