116,4K подписчиков

Как во время курса Skillbox написать нейросеть для СТС

169 прочитали

Все слышали про Data Science, а вот что это такое — ответят единицы. А из тех, кто ответит, — ещё меньше внятно скажут, чем же конкретно занимается дата-сайентист. В статье объясняем, что за профессия у такого специалиста и куда он может приложить свои знания. Спойлер: например, научить нейросеть писать сценарии для СТС. Погодите, что?

А почему вообще появилась профессия Data Scientist?

Тут всё просто. Раньше оцифрованных данных было совсем мало. Ну, например, у человека был профиль в базе данных банка. Надо понять, насколько хороший заемщик гражданин Васечкин — берёте большую таблицу и анализируете его кредитную историю. Вводили такие данные тоже вручную.

«Если я вовремя не введу данные в компьютер…» Кто помнит продолжение фразы Чендлера? :)
«Если я вовремя не введу данные в компьютер…» Кто помнит продолжение фразы Чендлера? :)

Потом оцифрованных данных стало больше. Да и потребность в них возросла: приходит к вам отдел маркетинга и говорит: хотим настроить рекламу на всех жителей Санкт-Петербурга с доходом от 50 тысяч в месяц, которые регулярно ездят в путешествия с детьми. На помощь специалистам по работе с данными пришли программисты: они создали язык SQL-запросов — теперь вы могли отправить команду в базу и вытащить из нее все нужные данные. Сохраняете в табличку, отдаёте маркетологам, все довольны.

А потом появилась Big Data. Представьте, что есть большой склад, где хранятся вообще все данные обо всех. Сколько кредитов у Васечкина, в каких кофейнях бывает Линейкин, какой любимый сорт яблок у Ёлкиной. И каждую секунду на этот склад подъезжают огромные фуры с новыми данными. Само собой, навести порядок на таком «складе знаний» человеку не под силу. Зато машинные алгоритмы с этим справляются: находят закономерности в хаосе, разделяют данные на кластеры по разным признакам, строят связи и делают прогнозы.

Data Scientist (дата-сайентист, если по-русски) занимается тем, что пишет и обучает такие алгоритмы и с их помощью добывает ценную для бизнеса информацию. Например, делает прогнозы курсов ценных бумаг или предсказывает предполагаемые места землетрясений.

«Сидоровы». Как дата-сайентисты с курса Skillbox научили нейросеть писать сценарии для ситкома

Специалисты по Data Science могут быть полезны не только в айти или банкинге! Живое тому доказательство — проект ребят, которые прошли обучение на образовательной платформе Skillbox. Они создали нейросеть, которая пишет сценарии для нового ситкома СТС, «Сидоровы».

Нейросеть-сценарист называется A.I. TV Script Generator, это выпускная работа Владимира Ларькина и Вадима Поволоцкого
Нейросеть-сценарист называется A.I. TV Script Generator, это выпускная работа Владимира Ларькина и Вадима Поволоцкого

Идея сериала в том, что обычная семья Сидоровых постепенно осознает, что живет внутри сериала — герои ситкома слышат закадровый смех и почему-то не покидают своей квартиры. И они решают выбраться из шоу.

Авторы взяли наработки Сбера в области обучения нейросетей русскому языку и адаптировали их к конкретной задаче — созданию сценариев. Материалами послужили другие сериалы СТС: «Воронины», «Родком» и «Жена олигарха».

Конечно, нейросети далеко до искусственного интеллекта, поэтому авторы рассматривают ее как вспомогательный инструмент для сценариста. Алгоритм генерирует сцену, пишет диалоги, а человек-сценарист решает, что из этого взять. Вся прелесть в том, что нейросеть может выдавать хоть сотню вариантов одной сцены на выбор — то есть выступать настоящим «генератором идей»!

Сцена, написанная нейросетью. Да, щиколотка Вити выглядит ужасно, бывает
Сцена, написанная нейросетью. Да, щиколотка Вити выглядит ужасно, бывает

Владимир и Вадим сделали этот проект как дипломную работу в МАИ, где учились на «Прикладной математике». Сами они рассказывают, что за недостающими знаниями пришли на платформу Skillbox:

Студенты университета интересуются нейросетями, но конкретного предмета по ним на бакалавриате нет. Поэтому в эту область идут только по личной инициативе. Так случилось и с нами, наш научный руководитель Валентин Пановский предложил реализовать проект сценарной нейросети в качестве дипломной работы. Недостающие знания в работе с искусственным интеллектом набирали на курсе Skillbox.

Сериал уже снимают, показ первой серии запланирован на осень 2022. Ждём!

Что ждёт на курсе Skillbox по Data Science?

Участники курса проходят трехуровневую подготовку:

1️⃣ Базовая подготовка (6 месяцев). Здесь можно получить базовые знания, без которых в профессии никуда. И попробовать себя во всех направлениях: аналитика данных, Machine Learning и Data Engineering.

2️⃣ Специализация (6 месяцев). Вы выбираете карьерный трек (один из трёх). После обучения вы готовы устроиться на позицию Junior.

3️⃣ Повышение квалификации до Middle (1 год). Вы работаете и параллельно углубляетесь в интересную вам сферу: например, компьютерное зрение.

Гарантированное трудоустройство после года обучения — обязательный пункт подготовки
Гарантированное трудоустройство после года обучения — обязательный пункт подготовки

На позиции junior-специалиста вы сможете зарабатывать около 50 000 рублей, а вот со второго года доход увеличивается — от 120 000 рублей и выше.

Спикеры курса — практикующие специалисты в области Data Science из таких компаний, как Wrike, Сбер, ЮMoney, VISA.

Кроме спикеров, у каждого участника курса будет куратор — к нему можно обратиться за советом в любое время
Кроме спикеров, у каждого участника курса будет куратор — к нему можно обратиться за советом в любое время

Какие ещё бонусы у тех, кто обучается на этом курсе?

✅ Учитесь сейчас — платите потом. Расходы за первые 6 месяцев обучения берёт на себя Skillbox. Узнайте больше на сайте ↓

✅ Гарантированное трудоустройство. По статистике, 88% участников курсов Skillbox получают работу по новой специальности.

✅ Рассрочка. Необязательно платить всю сумму сразу, размер ежемесячного платежа — 6 158 ₽.

✅ Обновлённая программа. Более 80 практических заданий на развитие аналитического мышления, 3 больших итоговых проекта на реальных данных.

✅ Бонусный курс по английскому. Пригодится любому IT-специалисту!

Сейчас курс участвует в распродаже — его можно приобрести с 40% скидкой. Листайте дальше, чтобы узнать подробности. Кто знает, может, вы напишете следующую DALL-E?