Молодой ученый из Дзержинска придумывает, как ускорить обучение нейросетей и предсказать свойства химических веществ, не проводя экспериментов.
Его портреты в рамках проекта Десятилетия науки и технологий висели на билбордах по всему Нижнему Новгороду, но для многих он оставался «ученым из плаката», чья работа — загадка. В интервью РБК Нижегородская область математик Никита Кузьмин рассказал, почему променял карьеру программиста на фундаментальную науку, как графы помогают химии и зачем искусственному интеллекту нужны паросочетания. А еще — о том, планирует ли вернуться в регион, который его взрастил, и что нужно, чтобы зажечь в школьниках из российской провинции искру научного азарта.
Давайте начнем с самого начала. Откуда вы родом и как оказались в Нижнем Новгороде?
Я из Дзержинска. Это город-спутник, совсем рядом с Нижним. Сюда, в нижегородский кампус Высшей школы экономики, я и приехал учиться на программиста. Но так получилось, что после первого семестра я захотел заниматься математикой и перевелся на математическое направление. Я еще учился на платном, перевелся сразу и на бюджет заодно.
Меня интересовала тогда дискретная математика. С первого курса я уже нашёл себе научного руководителя — Дмитрия Сергеевича Малышева. И мы с ним практически сразу начали заниматься наукой. Так, что сразу после магистратуры я защитил кандидатскую диссертацию. Она, по сути, была написана еще в бакалавриате. Необходимые статьи и результаты достаточные для кандидатской уже были. Вот, так закрутилось сразу.
Да, это звучит как очень серьёзная научная амбиция. А что дальше? Диссертацию защитили — и куда движетесь сейчас? Чем занимаетесь в новой лаборатории?
Да, я защитился летом и после этого переехал в Москву, но продолжаю работать с родной Вышкой. Сейчас у меня довольно насыщенный график: я руковожу магистратурой по анализу данных в НИУ ВШЭ – Нижний Новгород, там же преподаю, плюс работаю младшим научным сотрудником в нашей лаборатории ЛАТАС (Лаборатория алгоритмов и технологий анализа сетевых структур). А параллельно с этим я присоединился к новой лаборатории в МФТИ.
Направление сменил не кардинально — всё так же в области графов и комбинаторики. Но сейчас задача стала намного более прикладной. Представьте себе сеть компьютеров, которые обмениваются данными. У каждого своя часть информации, которой нет у других. И нужно, чтобы все данные разошлись по всем узлам сети как можно быстрее.
И где же она находит применение? Что-то из области IT-инфраструктуры?
Одно из ключевых применений сейчас — это машинное обучение, особенно обучение больших нейронных сетей. Дело в том, что такие вычисления почти всегда идут параллельно на множестве машин. Каждая из них производит расчёты на своём кусочке данных. Потом всем этим машинам нужно обменяться полученными результатами, чтобы продолжить обучение модели. И чем быстрее и эффективнее пройдёт этот обмен, тем быстрее будет обучена сама нейросеть. Так что моя нынешняя работа находится на стыке: задача прикладная, но в её основе лежит сложная математическая модель, которую как раз и нужно построить и оптимизировать. Вот этим я сейчас и занимаюсь.
То есть фактически все, что связано с развитием систем нейросетей, искусственного интеллекта?
Конкретная задача, она, конечно, намного шире, но сейчас ее главное приложение — именно обучение тех же нейросетей и других моделей машинного обучения.
Ваша диссертация называется «Исследование количеств паросочетаний в некоторых классах графов». Что вы отвечаете родственникам на празднике, когда спрашивают, чем занимаетесь?
Если рассказывать людям, далёким от математики, то я говорю, что занимаюсь химическими соединениями. Можно представить себе молекулу: есть атомы и связи между ними. Если нарисовать это на листке бумаги — точки и отрезки — получится граф. Если он нарисован по молекуле, то это молекулярный граф. Изучая такие схемы, можно что-то понять о свойствах самих химических веществ. В своей работе я исследовал числовую характеристику графов — так называемый индекс Хосойи. Его в начале 70-х предложил японский химик. Оказалось, что этот показатель связан с реальными физическими свойствами, например, с температурой кипения некоторых веществ. Таких связей нашлось много.
Мне стало интересно изучать саму эту числовую характеристику, даже без привязки к конкретным молекулам. И в итоге мы с Дмитрием Сергеевичем придумали новый метод, как находить особые, экстремальные графы — те, у которых эта характеристика достигает максимума в заданных рамках.
Некоторые классы графов соответствуют реальным молекулам, конкретным химическим соединениям. И тогда нашу математическую задачу можно переформулировать на язык химии. Например, мы можем спросить: какое вещество в этом классе соединений будет иметь самую высокую температуру кипения? Часто нам нужно именно предсказывать такие свойства, а не измерять их в лаборатории — потому что провести эксперимент может быть очень сложно, дорого или вообще невозможно. Вот в таких случаях как раз может пригодиться индекс Хосойи: его значение для молекулярного графа позволяет нам дать оценку, сделать прогноз.
А где именно это может быть востребовано? В любой химической отрасли или есть особые направления?
Честно говоря, мне как математику сложно говорить о конкретных применениях. Я знаю, что подобные числовые характеристики, которые называются топологическими индексами, в химии используют целыми наборами. Но если уж выделять, то, наверное, чаще всего это медицина — просто потому, что там публикуется огромное количество исследований. Предсказание свойств в этой сфере особенно важно, ведь молекулы лекарств бывают очень сложными — порой гораздо сложнее, чем в какой-нибудь промышленной химии. Хотя, конечно, бывает по-разному.
То есть ваша работа — это всё-таки больше про теорию и доказательства? А как выглядит рабочий процесс: вы сидите и пишете на доске, а потом кто-то проверяет ваши идеи на компьютере?
В целом, да. Мы садимся и пишем формулы, доказываем теоремы, строим рассуждения на доске. Это основа. Потом, конечно, наступает этап проверки: студенты или коллеги могут «прогнать» наши идеи через вычислительные модели, посмотреть, как это работает на практике. В прикладных задачах без этого никуда. Но моя личная часть — это всё та же чистая математика, работа с формулами. Например, в задаче про обмен данными между компьютерами моя цель — придумать математически строгий способ определить оптимальные пути для информации. Нужно найти такую комбинацию, такое правило, которое гарантированно сократит время передачи. Это про абстрактные взаимодействия в алгоритме, а не про написание кода. Формально описать это на математическом языке — задача очень нетривиальная, тут сложно объяснить в двух словах.
И что же в итоге получается на выходе? Когда вы говорите: «Задача решена», что вы показываете заказчику или коллегам?
В конечном счёте мы показываем правило или схему, по которой должна двигаться информация. Если записать его формально, то это будет выглядеть как формула, иногда даже достаточно компактная. Она и есть тот самый алгоритм или принцип, который решает поставленную задачу — например, минимизирует время обмена данными в сети.
Иногда говорят, что в науку идут по инерции или потому что так принято в вузе. В вашем случае было так? Или вас конкретно увлекли эти сложные задачи? Ведь вам наверняка предлагали перспективы в IT с хорошим доходом. Почему вы всё-таки выбрали науку?
В университете не всем обязательно идти в науку, но обычно хорошо бы в той или иной степени ей позаниматься. В этом глобальный смысл университета — научиться решать какие-то сложные задачи, хотя бы к ним прикоснуться как-то. Но научные задачи — это самые сложные, самые интересные. Если говорить про студентов-математиков, то там, конечно, процент людей, которые идут в науку, больше. Обычно человек, которому хочется заниматься наукой, наоборот, в IT не хочет, хотя там зарплаты большие и тоже много интересных задач.
Мне кажется, дело всё-таки в складе ума. Лично для меня — да и, наверное, для многих математиков — возможность решать по-настоящему сложные задачи оказалась куда важнее и интереснее, чем просто идти зарабатывать деньги на чём-то попроще. Хочется решать самые сложные.
Вы много времени проводите за решением задач. А что помогает отвлечься и перезагрузиться? Есть ли у вас хобби, или наука настолько поглощает, что становится и работой, и увлечением одновременно? Откуда вообще берется вдохновение для такой работы?
Какого-то одного серьезного хобби у меня нет. Иногда могу картингом заняться, иногда на скалодром сходить. В общем, пробую разное, но постоянного увлечения нет. Честно говоря, большую часть времени я всё равно провожу за математикой. Так что, получается, моё главное хобби — это моя же работа. С отпусками у учёных тоже особо не получается: отпуск — это обычно время, чтобы наконец дописать статью, которую не удавалось закончить в рабочие дни из-за срочных дел.
Я, конечно, стараюсь поддерживать активность — занимаюсь спортом. И, наверное, главный источник смены обстановки — это поездки на конференции. Раз в два-три года бываю в Сочи, в Адыгее. В нашей области как-то исторически сложилось, что многие мероприятия проводят где-нибудь в горах у моря. Очень приятно. Так что вдохновения хватает, да и поездок бывает достаточно.
Что, на ваш взгляд, может зажечь в сегодняшних школьниках или студентах интерес к научной карьере? Красивые лаборатории, поездки на конференции? Или что-то другое? Что бы вы посоветовали, исходя из своего пути?
Конечно, определённый склад ума должен быть — это основа. Но ведь люди с таким складом могут так ни за что и не зацепиться, уйти в IT или другую индустрию. Как их привлечь? По-моему, самое важное — это примеры. Примеры успешных учёных, которые видны, с которыми можно пообщаться. У меня самого так и было: я видел своего научного руководителя — чем он занимается, какие задачи решает, каких результатов достигает. И не только его — вокруг в Вышке было много ярких математиков.
Например, у нас в нижегородской Вышке есть очень сильная международная лаборатория динамических систем. Прекрасный коллектив, атмосфера. Просто хотелось заниматься математикой, чтобы быть среди этих людей, общаться с ними. Мне кажется, если в университете будут такие учёные — успешные, современные — то этого уже может быть достаточно, чтобы заинтересовать молодёжь.
Вы упомянули важность примеров и сильных школ. У вас сейчас есть возможность работать в ведущем институте — МФТИ. Возникает ли желание вернуться в Нижний Новгород, чтобы создать там что-то подобное, свою школу или лабораторию? При каких условиях это могло бы стать реальностью?
Сейчас, конечно, сложно строить конкретные планы. Я работаю в МФТИ, а это, наверное, один из самых сильных научных центров в стране. Недавно я был на Конгрессе молодых учёных, и там проректор по науке МФТИ на вопрос о развитии талантов ответил: «У нас и так бесконечные ресурсы». Так что конкурировать с такими возможностями непросто.
Но если говорить гипотетически… Да, я бы мог вернуться в Нижний, если бы появилась реальная перспектива создать там сильную школу — например, в области комбинаторики или дискретной оптимизации. Если бы я почувствовал, что смогу её вывести на новый уровень — то да, это могло бы стать серьёзным стимулом. Пока это, конечно, лишь моделирование ситуации.
Если представить, что такая возможность появится, — в какой именно среде это должно было бы расти? Нужен сильный университетский «хостинг»: Вышка, ННГУ, может быть, «НЕЙМАРК»? Что здесь критично?
В первую очередь, нужна серьёзная поддержка — как правило, государственная. Раньше были программы мегагрантов, сейчас они, наверное, тоже есть, но, честно говоря, я не слишком глубоко вникал в эти механизмы. Главное — чтобы был крупный ресурс, который позволит не просто купить оборудование, а привлечь людей.
Если смотреть на примеры, то для меня ориентир — это опыт нижегородской Вышки. Когда-то туда приехала Ольга Витальевна Починка из Москвы и вдохнула новую жизнь в школу динамических систем, которая выросла в успешную лабораторию. Это тот сценарий, который я видел своими глазами ещё на первых курсах: как приезд сильного лидера и наличие поддержки могут запустить процесс. Так что вопрос не столько в конкретном вузе, сколько в готовности этого вуза принять такой проект и обеспечить ему устойчивое развитие. Нужны гранты, которые позволят пригласить специалистов высокого уровня и заинтересовать студентов — чтобы вокруг идеи сформировалось сообщество.
Вы говорили о поддержке и грантах. Как устроена эта система изнутри? Учёный постоянно живёт от гранта до гранта? И как это работает — вы сначала обещаете результат, а потом ищете его, или наоборот?
В современной науке ситуация часто именно такая: почти любое рабочее место учёного — это временная позиция, связанная с конкретным грантом. Постоянных ставок для исследователей практически нет. Соответственно, ты постоянно отчитываешься за полученные деньги — по каждому проекту нужно показывать прогресс.
Финансирование обычно привлекается под уже более-менее понятные вещи. Например, под готовое решение, под конкретный технический этап, результат которого можно предсказать. Или когда уже ясно, что́ именно нужно сделать, и ты уверен, что сможешь это выполнить.
Если говорить про работу внутри лаборатории, то там могут быть и более мелкие, достижимые задачи — что-то проверить, что-то посчитать, получить промежуточные результаты. Их проще планировать и по ним отчитываться. А вот когда речь идёт о фундаментальных, открытых проблемах — там часто всё наоборот. Сначала ты её решаешь, получаешь результат, а уже потом под этот результат находишь финансирование или публикуешь работу.
Ваша работа кажется очень внутренней, почти медитативной. Но наука — это всё же коллективное дело? Как устроена ваша команда и общение в ней? Или каждый всё-таки работает в своём «коконе»?
Конечно, без этапа, когда сидишь один и думаешь, никуда — это основа. Но назвать это полным одиночеством тоже нельзя. Потому что постоянно идут обсуждения: мы встречаемся, обмениваемся идеями, рассказываем, кто что прочитал или придумал. Ведь в математике задач — бесконечное количество, и результатов публикуется огромное множество. Во всём этом в одиночку не разобраться.
«Копаться» в литературе или в сложных выкладках коллективно — вообще-то, проще и эффективнее. Но когда доходит до сути, до самого ядра задачи, тут уже нужно расходиться, чтобы каждый мог её обдумать, покрутить в голове. А потом — снова собраться и обсудить, что получилось. Так что общение с коллегами идёт постоянно, но без этих периодов глубокого личного размышления, конечно, не обойтись.
Давайте в конце нашей беседы заглянем в будущее. Лет через 20 кто-то открывает вашу диссертацию. Что бы вы хотели, чтобы этот человек вынес из неё? Какой главной мыслью или чувством?
Сложный вопрос... Наверное, больше всего хочется, чтобы была понята сама идея, суть того, что делалось. В математике ведь есть такая проблема: мы часто друг друга не понимаем. Область огромная, мысли выражаются очень формальным, сложным языком, и бывает, что даже коллеги из смежных разделов не могут разобраться в работах друг друга. Так что, если через 20 лет кто-то откроет мою диссертацию и поймёт, в чём там была основная задумка, — это, наверное, и будет лучшим результатом.
_________
Больше про нижегородских ученых читайте в проекте «Наука в Нижнем» ВКонтакте, Телеграм или Дзен. Проект создан в рамках инициативы «Десятилетие науки и технологий».