Найти в Дзене

Искусственный Интеллект и Искусственные Нейронные Сети в Корпорации - 1 часть

Первая часть Прежде всего применения Искусственного Интеллекта и Искусственных Нейронных Сетей в Корпорации целесообразно разделить на два сегмента:
1. Что можно применять самостоятельно
2. Что можно поручить разработчикам и применять после разработки Данная статья посвящена тому, что "можно поручить разработчикам и применять после разработки". Далее целесообразна следующая классификация:
1. Компьютерное зрение (Computer Vision)
2. Большие языковые модели (LLM - Large Language Model)
3. Общее, прочее, разное Компьютерное зрение
(Computer Vision) Варианты применения 1. Распознавание изображений
2. Классификация изображений (котик / собачка, паспорт / не паспорт, какой тип лютика, какая цифра)
3. Определение объектов на изображении (какие объекты изображены на изображении, текстовое описание происходящего)
4. Определение наличия объекта на изображении (есть котик / нет котика, в маске / не в маске
5. Определение местоположение объекта на изображении (обводит контур)
6. Сегментация
Оглавление

Первая часть

Прежде всего применения Искусственного Интеллекта и Искусственных Нейронных Сетей в Корпорации целесообразно разделить на два сегмента:
1. Что можно применять самостоятельно
2. Что можно поручить разработчикам и применять после разработки

Данная статья посвящена тому, что "можно поручить разработчикам и применять после разработки".

Далее целесообразна следующая классификация:
1. Компьютерное зрение (Computer Vision)
2. Большие языковые модели (LLM - Large Language Model)
3. Общее, прочее, разное

Компьютерное зрение
(Computer Vision)

Варианты применения

1. Распознавание изображений
2. Классификация изображений (котик / собачка, паспорт / не паспорт, какой тип лютика, какая цифра)
3. Определение объектов на изображении (какие объекты изображены на изображении, текстовое описание происходящего)
4. Определение наличия объекта на изображении (есть котик / нет котика, в маске / не в маске
5. Определение местоположение объекта на изображении (обводит контур)
6. Сегментация изображения (закрашивает объекты разным цветом)
7. Определение эмоций, жестов, расы, пола, возраста, наклонностей угрожающих действий (зависит от библиотек, постепенно расширяется)
8. Распознавание лиц (распознает лица по ключевым точкам, применимо в сфере безопасности и авторизации)
9. Восстановление пропущенных фрагментов на изображении
10. Перенос стиля, смешивание изображений

Обработка естественного языка
(NLP - Natural Language Processing)

В сфере NLP наиболее распространены GPT-модели.

GPT - Generative Pre-trained Transformer
(Генеративный предобученный трансформер)

"Нашумевший" ChatGPT-3 - как раз из этой серии.
Можно сказать, что есть GPT и GPT-like модели, и потом все остальные.

Если языковая модель что-либо генерирует в одну сторону, чаще всего "слева направо", то в общем случае чаще всего это будет GPT или GPT-like. Если языковая модель что-либо анализирует, классифицирует или "генерирует в обе стороны", то в общем случае чаще всего это будет BERT или BERT-like, хотя определенные классификации возможны сразу и на GPT.
Все остальные модели, типа LSTM и прочие, популярные недавно, постепенно уступают и применяются все реже и реже.

Варианты применения

1. Машинный перевод (в сфере иностранных языков)
2. Генерация текста (новости, статьи, истории). Используется как для чат-ботов в режиме "болталка" для поддержания общей беседы. Может подключаться к чатам для удержания клиента на ресурсе.
3. Генерация текста с учетом дозагруженных собственных данных. Есть много настроек, позволяющих настраивать распределение и выбор модели между общими и дозагруженными данными. Применим для генерации контекста, более коррелирующего с собственными загруженными данными. Пример - генерация реплик о финансовых рынках, но не основе общих данных и википедии, а на основе подобранной литературы и собственных баз знаний.
4. Стилизация текста. Генерация текста в заданном стиле. Например, в стиле Достоевского или в стиле Пушкина. В общем случае аналогично пункту 3.
3. Классификация текста (токсично / не токсично, позитивно / негативно, последовательно / непоследвательно). Применимо для классификации комментариев.
4. Суммаризация текста.(Большой текст превращается в маленький или в заголовок)
5. Подстановка пропущенных слов
6. Определение ближайшего по смыслу слова
7. Определение ближайшего по смыслу текста (применимо для поддержки пользователей при наличии детерминированной Базы Знаний формата "Вопрос-Ответ" из FAO-раздела, сеть ищет ближайший по смыслу запрос из Базы Знаний и отвечает детерминированным ответом из Базы Знаний)
8. Генерация уникального текста в соответствии с загруженной Базой Знаний формата "Вопрос-Ответ" (применимо для автоматической поддержки пользователей при наличии Базы Знаний и существенной вариативности запросов)
9. Выделение смысловых сущностей (применимо для приема заказов. Например, "мне пожалуйста обычную вашу воду две большие бутылки завтра после обеда если можно спасибо". Сеть определит смысловые сущности и зафиксирует заказ в CRM.
10. Определение "близости" текстов (применимо для анализа соответствий диалогов менеджеров по продажам утвержденному сценарию)

Общее, прочее, разное

1. Голосовые помощники типа "Алиса" и "Сбер". Могут общаться голосом. Распознавание и синтез речи уже приемлемого качества. В ряде случаев нахождение в Каталоге Сбер может рассматриваться как канал привлечения новых пользователей.
2. Рекомендательные системы для торговли. Очень отдельный пункт.
3. Распознавание и синтез речи
4. Генерация изображения по тексту
5. Генерация виде по тексту
6. Классификация набора данных (перспективный кандидат / не перспективный, перспективный инвестпроект / не перспективный, выдавать кредит / не выдавать)
7. Поиск закономерностей (определение закономерностей "успешных" и "неуспешных" наборов, последующая классификация поступающих данных.