В начале октября стартует приём заявок школьников на пятый сезон программы «Сириус.Лето». Школьники снова объединятся в команды и будут работать над проектами, связанными с актуальными проблемами науки и бизнеса.
В ожидании старта вспоминаем самые интересные задачи, которые стояли перед ребятами в прошлых сезонах. Десятиклассник Дмитрий Шевелёв из Красноярского края вместе с участниками команды разработал чат-бот для группы компаний МЕДСИ, который понимает естественный язык и позволяет найти релевантные тексты в научных источниках для врачей и специалистов.
В чём суть решения
Разработанная система поддержки врачебных решений может понадобиться во время приёма пациента и сбора анамнеза. Специалисту необходимо быстро и точно оценить симптомы и историю болезни, а система помогает минимизировать риск ошибок, обеспечивая доступ к актуальной информации — перечню статей по теме на сайте МЕДСИ, проверенных самими врачами. Это особенно ценно в условиях ограниченного времени и высокой нагрузки. Также система может быть полезна при разборе учебных кейсов, когда врачи-стажёры учатся принимать решения на основе реальных данных.
Как обучали модель
Для обучения модели нам предоставили датасет с 400 тысячами записей обращений пациентов, которые для удобства были разбиты на несколько столбцов: код обращения, жалобы, перенесённые заболевания, выписанные препараты, специальность врача и диагноз.
Мы научили модель предлагать врачам релевантные статьи. В рекомендациях чат-бот опирается на показания к медицинским услугам, которые семантически связаны с темой текстов и схожи с жалобами и диагнозами пациентов.
Я написал мини-программу, которая анализировала, насколько разумно наш алгоритм предлагает тексты в ответ на запросы, учитывая контекст и семантические связи. Программа оценила рекомендации на качество, и в результате мы получили точность модели 0,78 (по шкале от 0 до 1).
О самом интересном этапе
В проектах, связанных с обработкой естественного языка, самый рутинный и нудный этап — подготовка модели, а самый интересный — корректировка её работы.
Мы потратили около 80% времени на то, чтобы отфильтровать и обработать данные, выбрать архитектуру модели и обучить её. После этого начался финальный этап корректировок.
Мы смотрели, в каких конкретных случаях модель выдавала непонятные ответы, и анализировали, почему так происходит. Например, на запрос «Боли в области справа под лёгкими» она предлагала ответ «МРТ мозга». Чтобы решить проблему, я провёл более корректную разметку обучающей выборки.
О мотивации
У меня уже был небольшой опыт проектной деятельности в области компьютерного зрения, но хотелось попробовать себя в другой сфере. Из рассылки Образовательного центра узнал о существовании программы «Сириус.Лето», позвал друга, вместе мы выбрали проект от МЕДСИ. Если бы не программа, я, наверное, никогда не погрузился бы в область NLP (от англ. Natural Language Processing — «обработка естественного языка») и не поработал бы под руководством опытного наставника.
Совет будущим участникам программы
Надо настраиваться на то, что не всегда всё будет легко, тем более если выбрать сферу NLP. Но не волнуйтесь: наставник поможет разобраться, без поддержки на программе точно не оставят.
Советую соблюдать режим сна, это влияет на количество энергии в течение дня, а также на способность запоминать и усваивать. Не бойтесь пробовать, даже если не уверены, что всё получится с первого или второго раза. По-настоящему хороший результат требует большого количества попыток. Упорно трудитесь, и это точно продвинет ваш проект вперёд!
Изучить теорию, необходимую для участия в проектных программах, школьники могут на Сириус.Курсах. На странице «Навигатора “Сириуса” по искусственному интеллекту» ребята выстраивают собственную траекторию обучения и проходят 19 бесплатных онлайн-курсов, которые позволяют им погрузиться в мир ИИ, получить востребованные знания и навыки.
Читайте по теме:
Как создать ассистента с эмоциональным интеллектом? Опыт школьника из Балашихи