Найти тему

Лингвисты ТГУ получили премию «Гравитация» за проект в сфере ИИ и Big Data

ТГУ и IT-компания IPST разрабатывают универсальные цифровые платформы для экспериментов и оптимизации онлайн-обучения

Магистранты и преподаватели программы «Компьютерная и когнитивная лингвистика» Томского государственного университета получили премию «Гравитация» в области искусственного интеллекта и больших данных в номинации «Повышение качества и доступности данных». Наградой отмечены проекты по созданию универсальных цифровых платформ для проведения когнитивных исследований и для эффективной организации учебного онлайн-процесса. Вместе с партнером ТГУ – IT-компанией IPST (Томск) – лингвисты разрабатывают информационные системы на основе методов машинного обучения и ИИ, обеспечивающие сбор, хранение, обработку и визуализацию данных в образовательной и исследовательской междисциплинарной среде.

Сегодня ежегодный прирост онлайн-образования на мировом рынке составляет от 5 до15%, что повышает востребованность образовательных продуктов на основе технологий ИИ и анализа больших данных. Универсальные цифровые продукты, разработанные компьютерными лингвистами ТГУ вместе с сетевым партнером – IT-компанией IPST, помогут оптимизировать образовательный процесс и укрепить технологический суверенитет страны в образовательной сфере. Проект ТГУ и IPST «Сбор и разметка данных для совершенствования алгоритмов автопроверки заданий студентов и генерации вопросно-ответных структур в образовательном и исследовательских междисциплинарных проектах» получил международную университетскую премию «Гравитация» в номинации «Повышение качества и доступности данных».

Разработку универсальной цифровой платформы для проведения нейролингвистических экспериментов компания IPST начала в 2021 году. Работы велись по заданию лаборатории лингвистической антропологии ТГУ и совместно с учеными Томского госуниверситета в рамках магистерской программы «Компьютерная и когнитивная лингвистика» и совместного проекта, поддержанного федеральной программой «Приоритет 2030». В этом году компания запустит созданный программный продукт в повседневную практику научных исследований.

На цифровой платформе можно создавать нейролингвистические эксперименты и настраивать их параметры; выгружать, обрабатывать, хранить и анализировать данные о проведенных исследованиях; формировать статистику на основе методов когнитивной лингвистики. И все это без использования экспериментаторами алгоритмических языков программирования и сторонних программных средств. Технологии ИИ позволяют автоматизировать процесс обработки и визуализации результатов и сформировать единую экспериментальную базу в области когнитивной лингвистики.

По словам руководителя проекта, заведующей кафедрой общей, компьютерной и когнитивной лингвистики ФилФ ТГУ Зои Резановой, к необходимости создания отечественного программного обеспечения для проведения онлайн-экспериментов привели произошедшие в последние годы социальные потрясения.

– Если раньше эксперименты по большей части проводились в лабораторных условиях, то во время пандемии всем пришлось выйти в онлайн-пространство. Мировое сообщество начало тестировать легитимность проведения экспериментов, когда испытуемый и исследователь взаимодействуют онлайн, – поясняет Зоя Ивановна. – В мире появились платформы для проведения экспериментов, но сейчас в связи с геополитическими событиями они все для нас закрылись, и остро встала задача создания собственного продукта.
Команда проекта: Валерия Владимирова, Алексей Бочаров, Зоя Резанова и Анна Сергина
Команда проекта: Валерия Владимирова, Алексей Бочаров, Зоя Резанова и Анна Сергина

Универсальная платформа экспериментов будет удобна респондентам и полезна, прежде всего, ученым исследовательских лабораторий, которые создают эксперименты в области когнитивной лингвистики, психолингвистики, нейробиологии, экспериментальной психологии и других смежных областях, отмечает младший научный сотрудник лаборатории лингвистической антропологии ТГУ Валерия Владимирова.

Базовые эксперименты уже разработаны, и теперь ученые собираются масштабировать платформу для апробации новых типов экспериментов и расширения спектра их возможных дизайнов. Летом платформу протестируют российские и зарубежные вузы – Ургенчский государственный университет (Узбекистан), Российско-Таджикский (Славянский) университет (Таджикистан), НИУ Высшая школа экономики, Алтайский государственный гуманитарно-педагогический университет имени В.М. Шукшина и другие; осенью участники проекта обработают и проанализируют результаты. Договоренности с вузами были достигнуты на международном конгрессе «Язык, культура и технологические транзиты: новые грани человеческого» в 2022 году в ТГУ.

Для оптимизации взаимодействия студентов и преподавателя гуманитарии ТГУ вместе с разработчиками IPST развивают еще один программный проект – универсальную образовательную цифровую среду «Новая платформа». Этот продукт 5 июля 2023 года был включен в Российский реестр программного обеспечения.

– Суть разработки в том, чтобы проводить аудиторные онлайн-занятия с помощью выстраивания интерактивных блоков, где пользователь выполняет разные задания – тестовые, с видео, с картинками, – рассказывает сотрудник IPST, магистрантка программы «Компьютерная и когнитивная лингвистика» ТГУ Даниэль Буйницкая. – Сначала мы реализовали модуль автопроверки заданий студентов для определения семантического сходства между двумя короткими определениями термина. Например, преподаватель создает упражнение: описывает, что такое медицина, и дает системе идеальный ответ, который мы считаем эталонным. Когда студент дает развернутый ответ, мы по разным метрикам сравниваем семантику между двумя определениями и определяем, насколько оно точное.

Второй реализованный модуль – генерация вопросно-ответных структур на основании методического материала: на основе размещенного на платформе текста система генерирует вопросы по тексту с заведомо верным ответом. Сейчас автогенерация работает по двум тематикам – информационные системы и электроэнергетика. В дальнейшем разработчики проведут пользовательское тестирование большой аудитории, выделят и разместят на платформе актуальные темы, обработку которых затем автоматизируют.

После продвижения платформы и полноценного нагрузочного тестирования авторы планируют внедрить нейронные сети, которые будут подстраивать автопроверку заданий и генерацию вопросно-ответных структур под конкретного преподавателя, добавляет магистрантка ТГУ.

– Целевая аудитория «Новой платформы» – это, во-первых, преподаватели и методисты различных образовательных учреждений и других организаций, которым необходимо единое рабочее пространство для создания, редактирования, классификации, хранения и эффективного использования методического материала в работе с учащимися. Во-вторых, это студенты – им тоже важно иметь возможность выполнять задания и взаимодействовать с преподавателем в простой и удобной форме, – дополняет Валерия.

В междисциплинарную команду проекта вошли: заведующая кафедрой общей, компьютерной и когнитивной лингвистики ТГУ, профессор Зоя Резанова (руководитель), доцент кафедры, кандидат исторических наук Алексей Бочаров, студентка магистратуры «Компьютерная и когнитивная лингвистика» ТГУ и старший программист Даниэль Буйницкая, старший программист IPST Анна Сергина, младший научный сотрудник лаборатории лингвистической антропологии ТГУ Валерия Владимирова.

Международная университетская премия «Гравитация»
Международная университетская премия «Гравитация»

Для справки. Первая международная университетская премия в области больших данных и искусственного интеллекта «Гравитация – 2023» учреждена в 2023 году ТГУ и РАНХиГС при поддержке Университетского консорциума исследователей больших данных. Организаторами премии также выступают МГУ имени М.В. Ломоносова, МФТИ и МГТУ им. Баумана.

Премия поддерживает университетские команды, работающие в области больших данных и искусственного интеллекта, и разработчиков программных решений для сферы образования. Инициатором ее учреждения выступил Томский государственный университет как один из лидеров по созданию и внедрению технологий в области искусственного интеллекта и больших данных в различных отраслях экономики, социальной сферы и государственном управлении.