В этом году на Академической программе по искусственному интеллекту, поддерживаемой фондом «Интеллект» на факультете ВМК МГУ имени М.В. Ломоносова, состоялся первый выпуск слушателей. В числе выпускников оказался и Кирилл Суглобов, успешно окончивший в этом году бакалавриат факультета ВМК.
– Кирилл, сложно ли было учиться на факультете ВМК?
– Нагрузка на факультете ВМК довольно приличная, особенно если студент учится на сложной кафедре. У меня была кафедра ММП – математических методов прогнозирования, специализирующаяся на вещах типа машинного обучения, глубинного обучения, нейросетей, она считается одной из самых сложных, но при этом одной из самых интересных. Совмещать обучение с работой, наверное, можно даже на кафедре ММП, но при этом успеваемость, скорее всего, будет не очень хорошая. Студентам ММП трудно совмещать учебу с чем-то еще.
– Почему вы решили пойти на Академическую программу по искусственному интеллекту?
– Машинное обучение – это тренд и мне хотелось исследовать его, но у меня не было курсов по этому направлению. С середины второго курса я уже понимал, что попаду на ММП и буду заниматься машинным обучением. У меня оставалось полгода до начала учебы на кафедре, и я решил, что неплохо было бы заранее вникнуть в тему «искусственного интеллекта», машинного обучения, и с радостью записался на программу. Потом выяснилось, что часть курсов, которые учитывает эта программа, преподаются на нашей кафедре. То есть мне было легче, чем студентам с других кафедр, потому что помимо своего учебного плана, им нужно было закрывать учебный план Академической программы.
– Какие курсы вам понравились на АП?
– Я прошел 7 курсов: «Язык программирования Python 3», «Введение в искусственный интеллект», «Машинное обучение», «Глубокое обучение», «Байесовские методы машинного обучения», «Основные модели данных в аналитической деятельности» и «Нейробайесовские методы». Мне понравились 4 курса, и, по-моему, они являются одними из лучших на факультете, потому что я примерно знаком с учебными планами других кафедр. Первый курс – это «Язык программирования Python 3», который описывает современное состояние языка программирования Python, его синтаксис, основные приемы программирования. Лектор курса Георгий Владимирович Курячий – общительный, харизматичный преподаватель, его лекции захватят даже тех, кто не знаком с темой. Этот курс я прошел на первом семестре первого курса. С тех пор, когда мои знакомые спрашивают меня, как изучить Python, советую этот курс. Важно понимать, что курс сильно отличается от основной массы других по изучению Python – он более глубокий, подробный, я бы даже сказал фундаментальный, с описанием того, что происходит под капотом на языке Python, с так называемым “растворением” синтаксического сахара. Синтаксический сахар – это конструкции языка программирования, которые упрощают написание программы, но при этом человек, пишущий более простой код с синтаксическим сахаром, не очень понимает, что происходит внутри. На курсе Курячего это все рассказывается. Второй курс – это «Глубокое обучение», логическое продолжение курса по машинному обучению. Лектор Кропотов Дмитрий Александрович – глава команды по методам оптимизации в исследовательской группе байесовских методов «Bayesian Methods Research Group», преподаватель ВМК МГУ и НИУ ВШЭ. На этом курсе дается понимание того, что нейронные сети — это не только инструмент для решения задач машинного обучения, но и в целом универсальный аппроксиматор, который может использоваться гораздо шире: для решения систем дифференциальных уравнений, задач дискретной оптимизации, задач управления. Собственно, моя выпускная квалификационная работа как раз связана с применением нейронных сетей для решения задач дискретной оптимизации. Опять же, если меня кто-то спрашивает про курс по глубокому обучению, рекомендую именно курс Кропотова. Он лучший из того, что я видел по этой теме на русском языке.
Про последние два курса можно сказать, что это вообще самые лучшие курсы на факультете ВМК, и лучшие курсы, которые я проходил. Это «Байесовские методы машинного обучения» и «Нейробайесовские методы». На курсе «Байесовские методы» изучается подход к теории вероятностей с помощью байесовского подхода как одного из способов математических рассуждений в условиях неопределенности. В байесовском подходе вероятность интерпретируется как мера незнания, а не как объективная случайность, как это делается в математической статистике. Байесовский подход можно рассматривать как обобщение классической булевой логики. Курс учит и теории, и практике. Его логическое продолжение – это «Нейробайесовские методы машинного обучения». Это курс, посвященный байесовским методам глубинного обучения в нейронных сетях. В том числе, в нём рассказывается про моделирование неопределенности в параметрах нейронной сети и о некоторых открытых проблемах глубинного обучения. Последние темы курса – это в целом передний край науки, начиная с диффузионных моделей и заканчивая ландшафтом функций потерь в нейронных сетях. Автор и лектор этих курсов Дмитрий Петрович Ветров – выдающийся исследователь, глава исследовательской группы баейсовских методов «Bayesian Methods Research Group», преподаватель ВМК МГУ, Школы анализа данных Яндекса, профессор и преподаватель НИУ ВШЭ. Мне понравилась захватывающая подача материала: сложные вещи объясняются простым языком, интересно будет даже тем, кто не в теме. Дмитрий Петрович Ветров по совместительству мой научный руководитель, однако хвалю его совсем не поэтому, а как раз наоборот, он талантливый человек, поэтому я и попросился к нему под научное руководство. В общем и целом, этими курсами я восхищен и всем советую.
– Что вам кажется наиболее интересным сейчас в области искусственного интеллекта?
– Считаю, что это большие языковые модели. «Мировой порядок» изменился после релиза ChatGPT – сервиса «общения» с нейросетью GPT в виде чата. Сначала была доступна модель GPT-3, потом её улучшение - GPT-3.5, и, наконец, в середине марта вышла модель GPT-4. Если посмотреть на результаты опроса за февраль 2023 года, проведенного в США на примере только одной нейронной сети, то можно увидеть, что 49 процентов всех компаний уже применяют ChatGPT и 30 процентов компаний хотят применять его, и это только февральская информация. При этом 48 процентов компаний заявили, что после внедрения ChatGPT сократили сотрудников.
Нейронные сети открывают новые горизонты для автоматизации не только рутинных, но и творческих процессов, которые раньше считались прерогативой человека. Например, для создания рекламного ролика вместо того, чтобы заказывать студию, фотографа, модель, можно обратиться к современным нейросетям. ChatGPT напишет интересный и подробный сценарий, а генеративные нейронные сети создадут по нему ролик с человеком-моделью, которого никогда не существовало. Все это можно сделать без преувеличения за полчаса и Вам это будет стоить ноль долларов.
Способность нейросети к обучению и генерации текста зависит, в том числе от числа обучаемых параметров, числа нейронов. Чем больше нейронов в модели, тем лучше ее качество, но также тем больше вычислительных ресурсов и времени требуется для ее обучения и работы.
Скорее всего, будет развиваться тренд на увеличение параметров моделей. Если у GPT-3 около 175 миллиардов обучаемых параметров, которые можно интерпретировать как 175 миллиардов нейронов у человека, то, как предполагают некоторые эксперты, у GPT-4 от 500 миллиардов до 1 триллиона нейронов.
Я считаю, что в дальнейшем развитие таких серьезных больших языковых моделей типа ChatGPT с большим числом параметров, которые надо долго и дорого обучать, станет уделом больших корпораций. Энтузиастам тут будет не место – у них просто нет таких ресурсов.
Это главный тренд за последнее время, прорыв уровня Интернета. Мне кажется, что наша жизнь изменится и буквально через 5 лет наверняка у каждого в смартфоне будет свой помощник типа нейросети GPT с доступом в Интернет, и она будет помогать решать нам или решать за нас повседневные задачи: как рутинные, так и творческие.
Если у человека закончится вдохновение, нейросеть поможет ему с идеей и, возможно, натолкнет на новую мысль. Как мне кажется, в будущем мы увидим большую оптимизацию интеллектуального труда, и начнем экономить время и другие ресурсы. И у нас будет оставаться больше времени на другие задачи или на отдых.
– Давайте перейдем к вашим планам. Чем планируете дальше заниматься?
– Сейчас я занимаюсь исследованием по применению нейронных сетей для решения задачи дискретной оптимизации в «Bayesian Methods Research Group», под руководством Дмитрия Петровича Ветрова. Планирую в ближайшие пару лет заниматься исследованиями. Также иду в магистратуру в МГУ на ту же кафедру ММП. Значит, мне надо будет осваивать учебный план, параллельно занимаясь научной работой. Сейчас прохожу собеседование в одну крупную технологическую компанию. Предполагаю совмещать учебу с работой и наукой. Индустрия нужна больше для опыта, понимания того, как работает корпорация изнутри.
– А чем вам больше нравится заниматься – наукой или практическими вещами?
– Наука и индустрия – это вечный спор, но на самом деле наука – это фундаментально, красиво. Еще наука – это будущее. Учитывая то, как быстро сейчас всё развивается, видимо, в ближайшем будущем можно будет заменять специалистов из индустрии, в том числе из IT – тестировщиков, бэкендеров, фронтендеров – либо значительно упрощать их задачи с помощью нейронных сетей.
Один из важных трендов сейчас – это промпт-инжиниринг, то есть как правильно задавать вопросы и какие именно входные данные подавать в языковые модели. Это еще один новый тренд. Промпт-инженер может научить человека, который не знаком с темой, как правильно задавать вопросы, и этот человек сможет заменять собой специалиста, используя ту же ChatGPT, задавая ей правильные вопросы. Учитывая, что специалистов смогут заменять нейросети, разумно, конечно, идти в науку. И в конечном итоге, как мне кажется, апогеем развития нейронных сетей и больших языковых моделей типа ChatGPT станет то, что останутся исследователи, ученые, которые будут заниматься исследованием нейронных сетей и «искусственного интеллекта», и может быть, еще сохранится пара профессий, где нужно работать руками. Это не только мои слова, но, в том числе мнение моего научного руководителя.
– Порекомендуйте, пожалуйста, Академическую программу ребятам, которые думают, идти или не идти.
– Я успел поработать в бэкенде в крупной технологической компании, то есть обычным программистом. Мне хотелось посмотреть на промышленный бэкенд для понимания, что происходит в другом популярном направлении в IT. Лично мне без математики и исследований, которые характерны для ML и DL, стало скучно уже через несколько недель, при том, что компания и люди очень понравились. Я только убедился в том, что выбрал верную специальность в IT – машинное обучение. А глубокие знания и понимание в этой области дали перечисленные курсы Академической программы. Для студентов ВМК Академическая программа – ключ к успешной профессии будущего.
Даже если вы думаете, что машинное обучение это не ваше, возможно, вы измените мнение через некоторое время. Потому что, как я уже сказал, нейросети могут заменить множество профессий, либо в этих профессиях можно сильно оптимизировать работу, в том числе с помощью больших языковых моделей. В конечном счете, все, по всей видимости, сведется к нейронным сетям, «искусственному интеллекту». Поэтому нужно идти на Академическую программу и вливаться в тренды.