Искусственный интеллект (ИИ) служит передовым инструментом для решения задачи контроля качества. Сети анализа изображений на основе ИИ, такие как сверточные нейронные сети (CNN), легко интегрируются в лечение бесплодия, поскольку визуализация играет решающую роль в принятии решений. CNN произвело революцию в компьютерном зрении благодаря его способности достигать исключительной согласованности, исключая человеческую субъективность при оценке эмбрионов. Кроме того, новые данные подтверждают эффективность ИИ в прогнозировании развития эмбриона и результатов имплантации. В этом исследовании авторы стремились использовать инструменты на основе ИИ в качестве мер контроля качества для оценки эффективности лечащего врача (MD) и эмбриологов в различных процедурах, включая перенос, витрификацию эмбрионов, разморозку эмбрионов и биопсию трофэктодермы.
Модели искусственного интеллекта использовались для прогнозирования имплантационного потенциала эмбрионов, и эти прогнозы сравнивались с фактическими результатами имплантации. Таким образом, авторы стремились объективно учитывать качество эмбрионов, чтобы изолированно оценить работу операторов.
Материалы и методы
- В исследование ретроспективно проанализированы результаты переносов эмбрионов, проведенных в одном академическом центре в Бостоне, штат Массачусетс.
- Развитие эмбриона регистрировали с помощью визуализации в EmbryoScope (Vitrolife, Швеция). Система визуализации на базе Leica 20x со светом от одного 635-мм светодиода использовалась для захвата изображений каждые 10 минут. Все изображения были оценены эмбриологами с опытом работы не менее 5 лет.
- Эмбрионы, включенные в это исследование, состояли как из непроверенных, так и из проверенных с помощью ПГТ-А эуплоидных эмбрионов.
- Разработанные CNN использовали архитектуру Xception и были обучены как контролируемый двоичный классификатор для прогнозирования результатов имплантации с использованием изображений эмбрионов, собранных с частотой 113 л/с. Эта система ИИ была точна примерно на 75,3% в прогнозировании имплантации эмбриона при оценке когорты эуплоидных эмбрионов
- Качество бластоцисты выше 3CC рассматривалось как критерий криоконсервации и биопсии трофэктодермы.
- Восемь врачей (A–H) выполнили по 20 последовательных переносов бластоцисты на 5-й день в одной и той же академической практике по лечению бесплодия (n=160). Восемь эмбриологов (A–H) выполняли по 20 эмбриотрансферов (n=160), по 20 криоконсерваций (n= 160) и 20 по разморозок эмбрионов (n=160), а шесть эмбриологов (A–F) выполнили по 20 биопсий трофэктодермы (n=120).
Результаты
- Эмбриотрансфер, выполненный врачом: почти во всех случаях (87,5%, 7/8 врачей) фактическая частота имплантации после переноса существенно не отличалась (p > 0,05) от прогноза имплантации на основе ИИ (рис. 1).Фактическая частота имплантации после эмбриотрансфера, выполненным одним оператором: «H» была значительно ниже, чем прогнозировалось AI (20% против 61%, p = 0,001).
- Прогноз модели ИИ был абсолютно точным для производительности для врача G (прогноз ИИ: 50% по сравнению с фактическим: 50%, p = 0,985). Кроме того, фактическая частота имплантации после эмбриотрансфера, выполненного большинством операторов (62,5%, 5/8 операторов), находилась в пределах 1 стандартного отклонения (СО) от прогноза ИИ.
- Эмбриотрансфер, выполненный эмбриологом: частота имплантации после эмбриотрансфера, не отличался от прогноза ИИ, кроме одного эмбриолога (87,5%, 7/8 эмбриологов) (рис. 2). Прогноз AI значительно отличался от фактической частоты имплантации в случае эмбриолога H (прогноз AI: 60% по сравнению с фактическим: 30%, p = 0,011). Средние прогнозы ИИ имплантации после эмбриотрансфера, выполненных эмбриологами, показали меньшую вариативность по сравнению с врачами. (57–64% против 50–68%).
- Витрификация эмбрионов: Предсказанная AI частота имплантации существенно не отличалась (p > 0,05) от фактической частоты, наблюдаемой после криоконсервации для любого из эмбриологов (100%, 8/8 эмбриологов) (рис. 3). Наибольшее расхождение между прогнозом AI и фактической частотой имплантации было после криоконсервации, выполненного эмбриологом G (прогноз AI 63% против фактического 45%), хотя оно не достигло статистической значимости (p = 0,076).
- Разморозка эмбриона: Для большинства эмбриологов, выполняющих разморозку эмбрионов (87,5%, 7/8), фактическая частота имплантации существенно не отличалась (p > 0,05) от прогнозируемой ИИ (рис. 4). Эмбрионы, размороженные эмбриологом «H», имели более низкую частоту имплантации по сравнению с прогнозом AI (25% против 60%, p = 0,004). У всех остальных эмбриологов (87,5%, 7/8) фактическая частота имплантации была в пределах 1 стандартного отклонения от прогноза ИИ.
- Биопсия трофэктодермы: частота имплантации эмбрионов после биопсии трофэктодермы у 6 разных эмбриологов (A–F) существенно не отличалась от прогноза ИИ. Кроме того, прогнозы ИИ находились в пределах 1 стандартного отклонения от фактической частоты имплантации эмбрионов. Наибольшая разница, наблюдаемая между прогнозом ИИ и фактической частотой имплантации, была у эмбрионов, биопсированных эмбриологом D (прогнозируемый ИИ 61% против фактических 50%), но разница не была статистически значимой (p = 0,154). Среди эмбрионов, биопсированных эмбриологом B, модели ИИ смогли точно предсказать частоту имплантации (предсказываемые ИИ 65% против фактических 65%).
Дискуссия:
Прогноз ИИ может служить эталоном эффективности со значительным отклонением, потенциально указывающим на необходимость улучшения техники операторов, выступая в качестве предупреждающего сигнала о потенциально неблагоприятных событиях. С помощью ИИ можно было бы стандартизировать инструменты контроля качества, которые позволяли бы вносить коррективы в режиме реального времени и решать проблемы с качеством, которые могут повлиять на практику ВРТ.
Сильные стороны этого исследования включают надежность алгоритма ИИ и большое количество операторов медицинских услуг, были включены как врачи так и эмбриологи. Была продемонстрирована вариативность среди практикующих врачей. Кроме того, все циклы проводились в одном учреждении, что позволяло жестко контролировать протоколы стимуляции, условия культивирования и управление практикой. Слабые стороны исследования заключаются в том, что все CNN были разработаны на основе только изображений Embryoscope, без изображений с других платформ, включенных в наши обучающие, проверочные или тестовые наборы.
Более того, даже несмотря на то, что модели на основе ИИ смогли выявить отклонения в производительности человека всего с 20 процедурами, будущие исследования могут реализовать эти процессы с использованием большего количества процедур и в течение более длительного периода времени. Будущие исследования должны включать больший размер выборки для обучения, проверки и тестирования, так же должны учитывать характеристики цикла или стимуляции, чтобы обеспечить более точные прогнозы. Помимо качества эмбрионов и производительности оператора, существуют факторы пациента, цикла и переноса, которые можно рассматривать для дальнейшего повышения полезности индикаторов.
Выводы Инструменты обеспечения качества на основе ИИ могут обеспечить точный, воспроизводимый и эффективный мониторинг эффективности персонала в практике ВРТ.