Сто лет назад фантасты писали, что компьютер научится понимать мысли и сможет стать человеку полноценным собеседником. Сегодня мы привычно болтаем с «Алисой», загружаем тексты в Google-переводчик, просим помощи у чат-ботов. Современные машины «поумнели» благодаря цифровым лингвистам. Редакция Synergy Times разбиралась, чем занимается специалист, который учит роботов говорить, как им стать и почему это профессия будущего.
Два в одном: гуманитарий и математик
По традиции профессии принято делить на технические и гуманитарные. Но с каждым годом такая классификация теряет актуальность: современные специальности часто соединяют обе характеристики. Цифровой лингвист — один из ярких примеров специалистов с межотраслевым образованием.
Компьютерная лингвистика как наука сложилась на пересечении лингвистики, математики, информатики и изучения искусственного интеллекта. Поэтому цифровой лингвист (он же компьютерный лингвист, лингвист-аналитик, исследователь алгоритмов) обладает навыками программирования и языковедения одновременно.
Чем занимается цифровой лингвист
Вот лишь малая часть того, что умеет создавать компьютерный лингвист:
- редакторы текста;
- голосовые помощники;
- программы, распознающие живую речь;
- сервисы автоперевода и реферирования;
- приложения по автоматической корректировке ошибок в тексте;
- опросники;
- электронные словари;
- программы для людей с ограниченными возможностями здоровья.
Цифровой лингвист может выполнять разнообразные задачи. Например, специалист разрабатывает усовершенствованную программу автоматического перевода текстов. Он даёт компьютеру проанализировать большие объёмы текстов, внедряет правила перевода разных слов и словосочетаний, учит алгоритм находить ошибки, выделяет правильные и неправильные варианты использования слов. Для этого цифровой лингвист использует CAT-программы и технологии Translation Memory, которые помогают компьютеру сохранить в памяти исходный и переведённый тексты и при последующих загрузках найти совпадения для автоматического перевода.
После того как лингвист-аналитик провёл глубокий анализ, внёс и скорректировал данные, к работе подключаются разработчик и data scientist, которые завершают работу с уже размеченными данными. В результате машина может распознавать человеческий язык, переводить тексты с одного языка на другой, находить ошибки.
Что надо знать и уметь цифровому лингвисту
Важно иметь способности к изучению языков, математике, информатике.
К основным профессиональным навыкам (hard skills) специалиста относятся:
- знание принципов работы искусственного интеллекта и основ программирования;
- умение работать с фреймворками, нейросетями и разметкой данных.
Среди необходимых гибких навыков (soft skills) можно выделить:
- внимание к деталям и аккуратность;
- трудолюбие и терпение — умение сосредоточиться на выполнении одной задачи, даже если она занимает несколько дней, и проявлять упорство при устранении ошибок.
Сколько зарабатывает цифровой лингвист
Благодаря высокому спросу на специалистов, даже начинающий компьютерный лингвист может рассчитывать на хорошую зарплату. Но многое зависит от статуса работодателя. В среднем компании готовы предложить работу соискателям с опытом работы от одного года, при этом зарплата, как правило, выше 100 тысяч рублей.
Плюсы и минусы профессии
По данным исследования «РБК Тренды», цифровая лингвистика входит в список профессий будущего. Футурологи подтверждают, что специальность будет одной из самых востребованных в ближайшие 30 лет.
Поэтому плюсы очевидны: большой спрос на компьютерных лингвистов, растущий с каждым годом; низкая конкуренция, поскольку профессия только начала развиваться; перспективы карьерного роста.
Компьютерный лингвист имеет возможность работать практически в любой отрасли, где необходимо использование информационных технологий с лингвистическими данными: в крупных IT-компаниях, банковском деле, медицине, науке, торговле и др.
При всех преимуществах новой профессии можно отметить и несколько недостатков: малоподвижный образ жизни, зрительное напряжение, монотонная работа с техникой, требующая терпения, постоянное совершенствование навыков, занимающее много личного времени.
Перспективы профессии
В области компьютерной лингвистики ещё много сложных задач. Кто знает, может, уже в ближайшем будущем искусственный интеллект будет не хуже человека писать объёмные информационные и аналитические статьи, репортажи, делать синхронный перевод видео, сочинять детские сказки. На данный момент алгоритмы могут генерировать простые тексты по шаблонам. Их, например, используют СМИ для создания сводок, спортивных новостей, прогнозов погоды. При этом они далеки от совершенства.
Вероятно, в будущем будет решена основная проблема машинных алгоритмов: работа со смыслом текста. Тогда компьютер начнёт искромётно шутить, передавать иронию и сарказм. Возможно, именно вы научите его это делать.
Где получить профессию
Чтобы стать компьютерным лингвистом, выберите один из способов:
- Окончите программу бакалавриата или магистратуры по направлению «фундаментальная и прикладная лингвистика». В настоящее время специальность можно найти во многих вузах страны, в частности, МГУ, СПбГУ, РГГУ, университете «Синергия», ТомГУ и др.
- Пройдите профессиональную переподготовку или курсы повышения квалификации на базе высшего образования. Если вы уже получили образование программиста, переводчика, филолога, то прохождение курсов профессиональной переподготовки по компьютерной лингвистике откроет огромные возможности и станет серьёзным шагом в развитии карьеры.
Книги о цифровой лингвистике
Познакомиться ближе с компьютерной лингвистикой и сформировать общее представление об особенностях профессии помогут книги:
- The Oxford Handbook of Computational Linguistics, Руслан Митков. Автор рассказывает об основных принципах и методах компьютерной лингвистики.
- Нейросетевые методы в обработке естественного языка, Й. Гольдберг. Книга содержит инструкции по использованию нейросетевых моделей в обработке данных естественного языка (NLP — Natural Language Processing).
- Прикладной анализ текстовых данных на Python. Машинное обучение и создание приложений обработки естественного языка, Бенджамин Бенгфорт, Ребекка Билбро, Тони Охеда. Издание о том, как работать с Python и делать классные приложения.
Материалы, которые вас могут заинтересовать:
В России создадут рейтинг вузов по подготовке специалистов в области ИИ
Особенности профессии JavaScript-разработчика: легко войдёшь в IT, но сеньором не станешь
Исследование: к 2026 году до 90% онлайн-контента будет генерировать искусственный интеллект