В свежем номере Nature опубликована работа команды Стэнфорда о модели Merlin — первом в своём классе 3D визуально‑языковом (3D VLM) решении, которое нативно обрабатывает объёмные медицинские исследования (CT) и обучается без дорогостоящей ручной разметки. Результаты обещают не просто инструмент помощи радиологам, а изменение парадигмы: автоматизация рутины, ранняя детекция биомаркеров и масштабируемая аналитика рисков пациентов. Статья Nature с подробностями исследования: Nature article Что такое Merlin и чем он отличается В обучающем корпусе: 15 331 исследований CT, более 6 млн изображений (срезов), ~1.8 млн диагностических кодов и ~6 млн текстовых токенов/меток из отчётов. Такой объём «естественных» клинических сигналов позволил модели выучить сопоставления между 3D‑структурами и клиническими понятиями без ручной разметки. Merlin проверяли по 6 большим задачам и 752 подзадачам. В zero‑shot классификации модель распознавала 30 распространённых абдоминальных находок (внутренний F1 = 0.