Читать художественную или профессиональную литературу при текущей скорости жизни становится всё труднее. Часто люди знакомятся с первыми главами и оставляют книгу на потом. На вдумчивое прочтение просто нет ресурсов.
И здесь на помощь человеку приходит искусственный интеллект! Современные модели ИИ могут сжать любой текст и предоставить краткую выжимку содержания, сохранить стилистику автора и даже сгенерировать тест на понимание прочитанного.
Эти модели под силу создать способному школьнику. Поговорили с одним из таких: 17-летний Арсений Новожилов из Череповца вместе с друзьями разработал ассистента, который оптимизирует объём книги под ограниченное время, которое пользователь готов на неё потратить.
Дорога в IT
С детства мечтал о карьере в области IT, потому что перед глазами был пример старшего брата — он программист. При этом до 8-го класса я не думал о шагах в этом направлении. Всё изменилось, когда мой школьный товарищ предложил вместе пройти курс по изучению Python. И понеслось: обучение в различных онлайн-школах (в том числе и на Сириус.Курсах), просмотр видеороликов.
В начале прошлого учебного года учительница информатики прислала ссылку на проектную программу «Сириус.ИИ». Её суть заключалась в следующем: школьники объединяются в команды и решают задачи по искусственному интеллекту от крупных технологических компаний. До конца регистрации оставалось несколько дней, но я тогда подумал: почему бы и нет? Мы быстро собрали команду из трёх человек и подали заявку.
Первая неудача
В финал той программы наша команда не попала. У нас ещё не было опыта реализации проектов в сфере ИИ, и мы получали знания прямо во время работы.
Для конкурсного отбора мы выбрали проект от Сбера и университета ИТМО. Нужно было создать систему для чтения книг со встроенным ИИ-ассистентом, который бы стимулировал пользователей читать и помогал им лучше понимать содержание книг.
Во время работы мы поняли, что замахиваться на широкую аудиторию — не самая хорошая идея. Поэтому представили, что делаем проект для школьников 8–11-х классов и студентов первых курсов, которые хотят сэкономить время при чтении.
Проектный путь
Для отбора на «Сириус.ИИ» мы с ребятами разработали основную идею и сделали первую версию системы. Впоследствии мы дорабатывали проект вместе с наставниками в региональном центре «Импульс», созданном в Вологде по модели «Сириуса». Полученные там знания и опыт помогли нам пройти отбор с этим же проектом в финал «Больших вызовов».
В период между «Сириус.ИИ» и «Большими вызовами» мы поменяли интерфейс системы. Вначале это было десктопное приложение, но потом остановились на боте в телеграме, — это решение показалось нам более практичным.
Три модуля
Мы разбили проект на три модуля, и каждый участник команды работал над своей частью. Я отвечал за систему сжатия текста: ИИ-помощник по запросу предоставлял краткий конспект главы или вообще целой книги. Другой модуль представлял собой интерактивный чат с ассистентом, куда любой пользователь мог задать вопрос по содержанию прочитанного. Наконец, третий модуль — система рекомендаций, которая учитывала поведение и предпочтения пользователя и предлагала ему похожие книги.
Основная проблема
На тот момент простые языковые модели, которые находились в открытом доступе и которые мы могли использовать, не были в состоянии обрабатывать очень большие тексты. Условно говоря, если бы я закинул в неё «Войну и мир», то устал бы ждать пересказа содержания. Конечно, можно было разбить текст на определённое количество частей и попросить машину обработать каждую. Но в этом случае модель потеряла бы контекст и на обработку информации времени ушло бы больше, чем хотелось.
Решение проблемы
Мой наставник посоветовал мне использовать RAG. Суть этой технологии заключается в том, чтобы помочь ИИ «подсматривать» в нужные документы. Для этого я разбил все тексты на части и каждой присвоил цифровую метку — вектор. Это не просто числа, а смысловой код, по которому можно искать нужное. Когда модель получала запрос, она превращала его в такую же цифровую метку и моментально находила в базе данных максимально похожие по смыслу отрывки из документов, которые становились основой для ответа ассистента. Ту же «Войну и мир» ИИ-помощник мог теперь сжать за 10 секунд.
Система рекомендаций
Мы собрали большую базу из примерно 20 тысяч книг, находящихся в открытом доступе. Модель, ориентируясь на теги и набор векторов, могла работать в двух режимах и советовать похожие тексты в зависимости от запроса пользователя или на основе книг, которые он загрузил в систему.
Человек вводил что-то вроде «Детектив о мрачном Петербурге с гнетущей атмосферой», и наш ИИ выдавал ему произведение Достоевского «Преступление и наказание».
Результат
Качество работы эксперты оценивали с помощью технических метрик. Например, результаты сжатия текста с помощью нашей модели сравнивались с эталонным — таким, как если бы краткое содержание писал сам автор книги. В этом случае эксперты анализировали соответствие наших ответов этому идеалу. Оценка показала, что качество сжатия текста у нашей модели выше, чем у DeepSeek.
Будущее
Хочу ещё раз съездить в «Сириус» уже будучи студентом. Кажется, я могу приезжать на смены без отбора, на правах бывшего призёра. Кроме того, планирую поступать по результатам ЕГЭ на программную инженерию в наш местный университет, а после — списаться со своими наставниками с проектных программ и договориться о стажировке.
Совет участникам
Хватайтесь за любые предоставленные возможности, их вокруг довольно много. Помните, что иногда успех зависит от случайности. Если бы учительница информатики не прислала тогда ссылку на «Сириус.ИИ», неизвестно, чем бы я сейчас занимался. То событие запустило процесс моего роста. Если у вас есть интерес и чёткое видение цели, то всё получится.
Разобраться в том, что интересно, и изучить теорию, необходимую для участия в проектных программах, школьники могут на Сириус.Курсах. На странице «Навигатора “Сириуса” по искусственному интеллекту» они выстраивают собственную траекторию обучения и проходят 19 бесплатных онлайн-курсов, которые позволяют им погрузиться в мир ИИ, получить востребованные знания и навыки.
Читайте по теме:
Как создать ассистента с эмоциональным интеллектом? Опыт школьника из Балашихи