Зачем вузы готовят цифровых филологов для IT-сферы
Сразу три новые профессии — менеджер искусственного интеллекта (ИИ), тренер ИИ и нейроиллюстратор — второй год осваивают студенты Института русского языка РУДН им. Патриса Лумумбы в Москве.
Текст: Владимир Емельяненко
Это не просто филологи, а цифровые лингвисты для разных отраслей экономики по междисциплинарной программе бакалавриата РУДН "Прикладная цифровая филология". Менеджер будет учить искусственный интеллект работать со словарями русского языка и терминологией, тренер — писать программы для нейросети, а нейроиллюстратор учить ИИ создавать и подбирать "картинки" для звукового ряда и письма. И хотя выпуска специалистов еще не было, а первых бакалавров цифровой лингвистики подготовят через два года, спрос на них столь высок, что со следующего учебного года в РУДН запускается еще одна программа бакалавриата, "Кибертехнологии и анализ данных в гуманитарной сфере", по двум специальностям — цифровой киберфилолог и аналитик ИИ. И вот они будут работать уже не только в гуманитарной, но и в технической и IT-среде, связанной с ИИ. Таков ответ вузовского лингвистического сообщества на вызовы электронного рынка труда.
ВИРТУАЛЬНОЕ ЗАВТРА НАСТУПИЛО ВЧЕРА
Эти вызовы не всегда осознаются не только обывателями, но даже работодателями, признает академик Академии инженерных наук им. А.М. Прохорова Анатолий Царегородцев. Так, Академия инженерных наук, разработав компьютер для обработки документов в системе здравоохранения, сначала не могла убедить местный Минздрав и клиники Екатеринбурга в разумности их использования в поликлиниках и больницах. Хотя те задыхались от очередей и "бумажной" перегруженности врачей. Отказ звучал стандартно: "Кто со всем этим будет управляться"? Ответ "Вы сами" никого не убеждает. Спас инженеров опыт создания и внедрения нейросети "Умный город" в Екатеринбурге. Инженеры на пальцах объяснили, что люди уже пользуются плодами ИИ, не всегда осознавая это: логистика и транспорт Екатеринбурга выстроены не только на навигаторах, но и на "умных" светофорах, остановках, электробусах, которыми управляет ИИ. При этом затраты на подготовку специалистов окупились. Проблема лишь в том, что специалистов катастрофически не хватает.
И хотя ученые и футурологи предупреждали о том, что ИИ захватит реальную жизнь, но, даже по самым оптимистическим прогнозам, его воцарение ожидалось к 2030–2040 годам. Однако жизнь показала, что скорость развития ИИ значительно быстрее. Оды голосовым помощникам, это, как и создание чат-ботов или пользование поисковыми системами, приятные мелочи прошлого вчера.
Теперь основное требование к голосовым помощникам — понимая речь, информировать и взаимодействовать с пользователем. По такому принципу в системе Минздрава РФ в ряде пилотных проектов работают смарт-часы. Они устанавливаются больным и сами могут вызывать скорую помощь, сообщая параметры нездоровья пациента.
Другое дело, что пилотные проекты рискуют остаться экспериментальными. Для их повсеместного внедрения нужны разработчики программ и специалисты-настройщики. С первым IT-сфера худо-бедно справляется, даже набирает обороты. Например, лидерами по разработке технологий искусственного интеллекта в России сегодня выступают МГТУ им. Н.Э. Баумана, МФТИ, ИТМО. А вот со специалистами-настройщиками — проблема.
"Я бы эту проблему сформулировала так, — делится директор Института русского языка РУДН, член Совета при Президенте России по русскому языку Анжела Должикова, — есть программа классической филологии, на нее студенты идут с пониманием того, кем они будут в будущем. А есть стык вечного спора физиков и лириков — цифровая лингвистика. И вот тут, чтобы ответить на вопрос, хочу ли я учить говорить смарт-часы или учить ИИ обращаться с "Национальным корпусом русского языка", порталом "Грамота.ру" или со словарем Ожегова, нужно выйти из зоны комфорта. Тот, кто за первых два года учебы научился, тот сегодня по заказу IT-компаний тренирует искусственный интеллект и занимается нейроиллюстрациями. Мы уже внедрили это в практику. Пока на поток не поставили, но все впереди".
Должикова особо расставляет акценты в разнице двух вузовских программ. Программа по прикладной цифровой филологии — попытка научить гуманитариев жить в цифровом обществе. Вторая программа, по кибертехнологиям и анализу данных в гуманитарной сфере, имеет обратную направленность: специалисты должны научить технарей ставить наукоемкие задачи гуманитариям, взаимодействовать с гуманитарным сообществом и обывателями, часто далекими от владения цифрой.
ЧЕЛОВЕЧЕСКИЙ ФАКТОР ИИ
Пока это взаимодействие больше похоже на популярный в IT-среде анекдот.
Девушка приходит устраиваться на работу. "Какая у вас скорость набора на клавиатуре?" — спрашивают ее. "6 тысяч знаков в минуту. Правда, такая ерунда получается".
Примерно то же самое поначалу выходит и у студентов-филологов, когда они получают первый конкретный кейс задач написать техническое задание машине.
"Научить машину выбирать между электронными "Национальным корпусом русского языка" и порталом "Грамота.ру" это дело творческое и кропотливое, но оно ближе по духу ИИ, поскольку это все же онлайн-корпус русскоязычных текстов, — говорит доцент кафедры русского языка и лингвокультурологии Института русского языка РУДН Алексей Овчаренко. — А вот научить ИИ читать словарь Ожегова и другие академические словники это задача иного рода. Она сродни той, когда иностранец объясняет, зачем он учит русский: "Хочу читать Толстого в оригинале". Понимаете? Это как просто говорить и говорить в микрофон. Как микрофон усиливает голос, так владение ИИ богатством словарей поднимает искусственный разум до высот технического и гуманитарного знания. В общем, задача цифровых лингвистов: "мы рождены, чтоб цифру сделать жизнью".
Так лингвистика начинает играть заметную роль в развитии искусственного интеллекта, поскольку помогает компьютерам понимать естественные языки. Правда, как признают в Институте русского языка РУДН, даже нейросеть делает грамматические ошибки.
"ИИ владеет всеми языками, — говорит заведующий кафедрой прикладной информатики и интеллектуальных систем в гуманитарной сфере Института русского языка РУДН Станислав Страшнов. — Но есть пятерка мировых языков, куда входит и русский. ИИ отдает предпочтение английскому. Набирает обороты частоты используемости китайский, не отстает русский. Будущим цифровым лингвистам все это надо учитывать. Я, например, начал учить китайский".
На вопрос зачем, Страшнов отвечает неожиданно: "Чтобы не читать будущую классику цифры в переводе". И поясняет: есть природа ошибок ИИ в родном языке, когда грамматические ошибки — следствие уровня написанного человеком технического задания машине. А есть ошибки не грамматические, а смысловые, когда человек "так понял перевод". "Как обучишь нейросеть, — говорит Страшнов, — так она и напишет. Тут роль тренера, как в спорте, определяет победу, ничью или поражение".
Спрос на лингвистов, управляющихся с ИИ, будет только расти, убеждена Анжела Должикова. По данным Института русского языка РУДН, только на оцифровку фондов Российской государственной библиотеки или знаменитой Ленинки понадобится около 2 тысяч лет, если темпы развития ИИ и цифровой лингвистики останутся прежними.
"Конечно, мы будем ускоряться, — убеждена Анжела Должикова. — Система ИИ дает и еще даст огромные возможности. Мир меняется стремительно, и наша задача — быть впереди изменений. То есть учитывать как темпы развития ИИ, так и его риски. Для лингвистов важно сопрягать скорость развития искусственного интеллекта со скоростью развития "перевода" высоких технологий на язык, доступный для человека".