195 подписчиков
Я наконец нашел время, чтобы удариться в ностальгию и продолжить серию постов про мой путь в мире ИИ! 🚀
Первый пост тут, второй - тут, и закончился он на том, что у меня произошел мэтч с классной питерской компанией Just AI.
На тот момент ребята активно занимались разработкой умных голосовых ассистентов и мобильных секретарей 💡 Я пришел на позицию Senior NLP-разработчика. Одной из моих первых задач была разработка SDK. Далее я сделал модель восстановления пунктуации, которая впоследствии была продана одной крупной телеком компании в составе продукта по распознаванию речи и транскрибации текста.
✨Фанфакт: как-то раз в Just AI я собеседовал себе руководителя. В итоге наняли очень талантливого человека, который под руководством мэтра российского машинного обучения К.В. Воронцова, написал половину модели BigARTM для тематического моделирования. Выпала же честь! (Тематическое моделирование - это когда вы в ИИ загружаете много текстов, а он вам на выходе присваивает тему каждому тексту) Знаю толк в хороших кадрах! 😄
Еще одним интересным проектом была разработка проприетарного решения по распознаванию числительных. Датасетов не было, поэтому сделал регулярки на стероидах (когда используешь не только функционал регулярок, но и с нуля прогаешь правила, чтобы числительные извлекались по красоте🤌🏼) +сторонние решения, чтобы улучшить текущее распознавание числительных для лингвистов. По итогам независимых тестов прирост получился +20% с точки зрения количества правильных ответов модели 🦾
Продолжение ниже 👇🏼
1 минута
24 апреля 2024