Найти в Дзене

🤖 Искусственный интеллект для общения в Телегарм-каналах.


Ребята в Data Acquisition активно тестируют и применяют NLP технологии для задач, связанных с маркетингом.

Например, был проведен эксперимент по созданию ботов, которые будут общаться с живыми участниками телеграм-каналов по теме криптовалют. Для реализации было использовано два подхода: выгрузка готовых диалогов и обучение нейросети для живого общения на тему криптовалют.

На практике оба подхода оказались успешными. Для выгрузки диалогов был написан автоматический парсер телеграма. С него было выгружено более 100 000 диалогов. Далее эти диалоги проходили несколько этапов «очистки» от различных стоп-слов (например, определенные названия монет), запрещенных тематик и других нежелательных сценариев. С помощью библиотек, анализирующих эмоциональный окрас сообщений даже удалось отфильтровать диалоги с признаками агрессии. В итоге полученный набор диалогов был использован для имитации общения между ботами, но этого было недостаточно, чтобы инициировать общение с живыми участниками чатов.

Чтобы реализовать общение с живыми участниками было дообучено несколько моделей семейства GPT на релевантных диалогах. Здесь как раз пригодился набор выгруженных на первом этапе диалогов. Лучше всего себя показала модель GPT-3 Davinci, после обучения которой боты прошли проверку на качество в реальных чатах. Основным критерием качества был факт продолжительного общения с живыми участниками и отсутствие банов со стороны администраторов каналов.

Если у вас есть вопросы по ботам, или другим направлениям машинного обучения, переходите по ссылке.
🤖 Искусственный интеллект для общения в Телегарм-каналах.  Ребята в Data Acquisition активно тестируют и применяют NLP технологии для задач, связанных с маркетингом.
1 минута
358 читали