Основная причина смерти у женщин - рак молочной железы. Его также трудно диагностировать. Почти каждый десятый случай рака диагностируется как нераковый, что означает, что пациент может потерять критическое время на лечение. С другой стороны, чем больше у женщины маммограмм, тем больше вероятность того, что она увидит ложноположительный результат. После 10 лет ежегодной маммографии, примерно двум из трех пациентов, у которых нет рака, скажут, что у них есть и они подвергаются инвазивному вмешательству, скорее всего, биопсии.
Ультразвуковая эластография груди является новой методикой визуализации, которая предоставляет информацию о потенциальном поражении груди путем оценки ее жесткости неинвазивным способом.
Однако суть этой процедуры заключается в том, что она представляет собой сложную вычислительную задачу, решение которой может быть трудоемким. Но что, если вместо этого мы будем полагаться на руководство алгоритма?
Асад Оберай, профессор кафедры аэрокосмической и машиностроительной техники Университета Витерби, задал именно этот вопрос в исследовательской работе "Обход решения обратных задач в механике посредством глубокого обучения: применение к визуализации эластичности". Вместе с группой исследователей, включая аспиранта Университета Витерби Дхрува Пателя, Оберай специально рассмотрел следующие вопросы: Можете ли вы обучить машину интерпретации реальных изображений с использованием синтетических данных и упростить шаги к диагностике? Ответ, говорит Оберай, скорее всего, да.
В случае ультразвуковой эластографии молочной железы, как только делается изображение пораженного участка, изображение анализируется для определения смещений внутри ткани. Используя эти данные и физические законы механики, определяется пространственное распределение механических свойств - как и его жесткость. После этого необходимо определить и количественно оценить соответствующие особенности распределения, что в конечном итоге приведет к классификации опухоли как злокачественной или доброкачественной. Проблема состоит в том, что последние два этапа являются сложными с вычислительной точки зрения и по своей природе.
В ходе исследования Оберай стремился определить, могут ли они полностью пропустить самые сложные этапы этого рабочего процесса.
Раковая ткань молочной железы имеет два ключевых свойства: неоднородность, что означает, что некоторые области мягкие и твердые, и нелинейная эластичность, что означает, что волокна обладают большим сопротивлением при вытягивании, а не первоначальным давлением, которое ассоциируется с доброкачественными опухолями. Зная это, Оберай создал физические модели, которые показали различные уровни этих ключевых свойств. Затем он использовал тысячи вводов данных, полученных с помощью этих моделей, для обучения алгоритма машинного обучения.
Синтетические данные против данных реального мира.
Но зачем использовать синтетические данные для обучения алгоритма? Разве настоящие данные не были бы лучше?
Оберай и его команда использовали около 12 000 синтетических изображений для обучения алгоритма машинного обучения. Этот процесс во многом похож на то, как работает программное обеспечение для идентификации фотографий, учась через многократные вводы данных, как распознать конкретного человека на изображении, или как наш мозг учится классифицировать кошку против собаки. Благодаря достаточному количеству примеров, алгоритм способен выявить различные особенности, присущие доброкачественной опухоли в сравнении со злокачественной опухолью, и сделать правильное определение.
Оберай и его команда достигли почти 100-процентной точности классификации на других синтетических изображениях. После того, как алгоритм был обучен, они протестировали его на реальных изображениях, чтобы определить, насколько точным он может быть в предоставлении диагноза, измеряя эти результаты в сравнении с биопсией подтвержденных диагнозов, связанных с этими изображениями.
"У нас была примерно 80-процентная точность. Далее мы продолжаем совершенствовать алгоритм, используя в качестве входных данных больше реальных изображений", - сказал Оберай.
Изменение способа постановки диагноза
Существуют два преобладающих момента, которые делают машинное обучение важным инструментом в продвижении ландшафта для обнаружения и диагностики рака. Во-первых, алгоритмы машинного обучения могут обнаружить закономерности, которые могут быть непрозрачными для человека. Путем манипулирования многими такими шаблонами алгоритм может дать точный диагноз. Во-вторых, машинное обучение дает возможность уменьшить количество ошибок при взаимодействии оператора с оператором.
Значит, это заменит роль рентгенолога в определении диагноза? Определенно нет. Оберай не предвидит алгоритм, который служит единственным арбитром в диагностике рака, а вместо этого, инструмент, который помогает направить врачей-рентгенологов к более точным выводам.
Адаптация алгоритма для других видов рака
Поскольку рак вызывает различные типы изменений в ткани, на которые он воздействует, наличие рака в ткани может в конечном итоге привести к изменению ее физических свойств, например, к изменению плотности или пористости. Эти изменения можно распознать как сигнал в медицинских образах. Роль алгоритма машинного обучения заключается в том, чтобы выделить этот сигнал и использовать его для определения того, является ли данная ткань, которую визуализируют, раковой.
Используя эти идеи, Оберай и его команда работают с Винеем Даддалваром, профессором клинической радиологии в Школе медицины Кека при Университете Южной Калифорнии, чтобы лучше диагностировать рак почек с помощью контрастных усовершенствованных изображений КТ. Используя принципы, определенные при обучении алгоритма машинного обучения диагностике рака молочной железы, они стремятся обучить алгоритм другим особенностям, которые могут быть заметны в случаях рака почек, таким как изменения в тканях, которые отражают специфические для рака изменения в микрососудах пациента, сеть микрососудов, которые помогают распределить кровь по тканям.