Инновации чаще взлетают в стартапах: те не скованы операционной рутиной, иерархией коммуникаций, которые так мешают развивать продукт. Но на одной разработке не въедешь на рынок: стартапам часто не хватает связей с инвесторами и партнёрами, опыта управления проектами и умения защищать бизнес-идеи. Заполнить такие пробелы помогают акселерационные программы — онлайн-интенсив по искусственному интеллекту и анализу данных Архипелаг 20.35 в их числе.
Под катом пять ИИ- и ML-стартапов рассказывают о себе и о том, что их привело на Архипелаг 20.35. Кстати, приём заявок на участие в интенсиве ещё не окончен. Вы можете успеть поучаствовать в отборе до 27 октября 2020 года.
Распознавание COVID-19 на КТ — Z-Union
Роберт Васильев
CEO
Мы, Z-Union, — инженеры, прикладные учёные из МФТИ, МГУ, ВШЭ и других университетов — занимаемся заказной разработкой в области машинного обучения, глубокого обучения и машинного зрения. Мы создаём алгоритмы для распознавания текста, изображений, строим предсказательные модели и т. п. Одна из наших основных задач — распознавание паттернов COVID-19 на снимках КТ.
Модель, обученная на КТ-снимках больных COVID-19, не просто выявляет затронутые болезнью области, но и рассчитывает степень поражения лёгких. Фактически она ускоряет процесс постановки диагноза.
Разработку этой модели мы начали весной 2020 года — вместе с распространением заболевания. Но появился проект не на пустом месте. В течение двух лет до этого мы работали над выявлением на маммографии паттернов рака молочной железы. В основу модели распознавания COVID-19 были заложены те же принципы, точнее, тот же путь проектирования алгоритма обучения. А вот сам алгоритм для работы с КТ лёгких пришлось перестроить практически с нуля.
На тот момент, когда мы начали работать, медицинские системы разных стран находились в процессе изучения болезни — не было единого подхода ни к диагностике, ни тем более к лечению. Мы следовали методологии диагностики нашего партнёра — НМИЦ онкологии им. Н. Н. Блохина (он использует методологию, принятую в России), а значит, не могли использовать зарубежные исследования в качестве основы. Нам необходимо было разработать свою модель.
Для подбора и разметки снимков для корректного обучения модели мы пригласили действующих врачей и ординаторов. Они отобрали порядка 150 исследований, в каждом из которых было около 400 срезов, — в общей сложности почти 60 тысяч снимков.
Обученная модель получает на вход КТ лёгких и распознаёт поражённые области с погрешностью 5−10%. При этом наибольшая погрешность пока проявляется при диагностике в плевральной области, и сейчас мы исправляем это через дообучение модели на новых снимках.
Сегодня модель существует в формате дополнительного модуля к медицинской информационной системе производства «Юсар+». Сейчас мы активно набираем партнёров для клинических испытаний и первых пилотов. Но мы — инженеры, нам интересно развивать и разрабатывать. Мы выходим в бизнес со своим решением, и здесь мы ждём поддержки Архипелага.
Я верю, что мы работаем в очень перспективном направлении. COVID-19 — это лишь первый шаг.
Есть гораздо более тяжёлые заболевания, которые можно диагностировать при помощи тех же подходов, — например туберкулёз.
Хотя это заболевание известно давно, медицине нужны инструменты его более точной диагностики. Так что здесь есть куда развивать алгоритмы.