Введение
Не для кого не секрет, что телеграм давно стал одним из наиболее популярных мессенджеров. Его активная аудитория в 2023 году составила 800 миллионов человек. Это, на секундочку, 8,7% населения планеты. Не будем забывать, что у компании российские корни. В нашей стране 41% населения используют телеграм ежедневно. Другая подробная статистика может найтись, например, тут.
Кроме того, телеграм предоставляет весьма широкие возможности для разработчиков программного обеспечения. Сейчас даже и уметь программировать не нужно, чтобы собрать какое-то приложение с использованием телеграм. Есть огромное количество различных конструкторов и удобных no-coding решений, можно посмотреть здесь. Плюсом также является супер удобная отправка файлов, картинок, видео в любых форматах, текстовое форматирование и простой понятный интерфейс, удобная как мобильная, так и десктопная версии.
Именно это и привлекает людей, когда речь идет о каких-то несложных графических приложениях, например, генерация картинок по текстовому описанию с помощью нейросетей.
Обзор функций и возможностей Telegram генераторов изображений
Поскольку приложения, созданные на основе телеграм-бота, имеют некоторые ограничения, связанные с инструментарием самого мессенджера, стоит разобраться в том, что можно с их помощью сделать и чего нельзя. Для этого мы разбили общий функционал генеративных нейросетей на категории, поместили все это в обзорную таблицу и вот что получилось:
Далее попытаюсь чуть подробнее раскрыть все пункты представленные в таблице.
- Генерация изображений - пожалуй самая популярная и доступная функция. Есть большое количество бесплатных решений и более навороченных платных.
- Создание артовых фильтров. Видели в соцсетях изображения вашей подруги в карандашном рисунке? Это и есть арт-фильтры. Преобразование исходного изображения в изображение рисованное. Этим все еще занимаются и художники. Но и технологии не отстают.
- Перенос стилей. Процесс очень похожий на арт-фильтры, за исключением того что в качестве референса может использоваться конкретная картинка или кадр из фильма, стиль которого наложится на ваше исходное изображение.
- Реставрация изображений. Вашу старую пожелтевшую детскую фотку можно отсканировать и восстановить ее исходную цветовую палитру, просто загрузив фото в телеграм.
- Генерация анимаций. Тут целая куча вариантов, начиная от сборки слайдшоу до наложения фильтров на готовое видео. Часть простых инструментов можно реализовать прямо в телеграм.
- Улучшение разрешения - один из наиболее востребованных инструментов. Например вы что то сфотографировали на телефон с увеличением и качество снимка оставляет желать лучшего. Загружаем снимок в телеграм и вуаля.
- Генерация текстур. Например вы планируете размещать фото вашего продукта на сайте, и ищете хороший фон. Тут вполне могут помочь нейросети, которые этот фон создадут заново. Не плохо правда и навыками фотошопа владеть, чтобы быстро адаптировать полученное под ваши изображения.
- Интерполяция изображений. Генеративные нейросети могут создавать плавные переходы между двумя изображениями, создавая новые изображения, которые находятся на границе этих двух изображений.
- Автоматическое окрашивание черно-белых фотографий. Просто приложу пример.
- Автоматическое создание коллажей. Несколько изображений комплектуются фоном по описанию и размещаются поверх.
Остальные инструменты, как правило требуют более сложного управления чем просто текстовое описание. Поэтому реализация их в виде чат бота крайне затруднительна. Как правило требуется указание определенных областей для работы, или какие то настройки требующие мгновенной визуализации. Хотя с течением времени возможности телеграм расширяются, и например уже сегодня можно встраивать обычные веб-приложения прямо в мессенджер, по технологии web-app.
Особенности и преимущества работы с нейросетями через телеграм.
Доступность - как ни странно, но в наше время далеко не каждый сервис готов похвастаться этим. Пресловутый OpenAI блокирует доступ пользователям из России. Многие сервисы на базе нейросетей так же не открываются без VPN. Другие требуют установки приложений на компьютер или мобильный телефон. С помощью телеграм можно легко и быстро попробовать любой сервис, не затрачивая время на обходы блокировок и развертывание локальных установок.
Простота использования - как правило достаточно просто текстового описания ожидаемого результата чтобы начать. Разберется даже ребенок. Однако не стоит забывать и о том что правильное составление текстовых запросов (промптинг) это приобретаемый со временем навык.
Гибкость приложений - не смотря на все ограничения, приложение в телеграм может обладать довольно широким списком различных настроек, которые сохраняются отдельно для каждого пользователя. Это позволит каждому приспособить сервис под себя, если конечно разработчики такую возможность предусмотрели.
Безопасность - телеграм пожалуй самый защищенный мессенджер в мире и при его использовании вы можете быть уверены в том что ваши работы перемещаются по зашифрованным каналам, заглянуть в которые не возможно.
Стабильность и быстродействие - не приятная история между властями и телеграмом произошедшая в начале 2018г. довольно ясно дала понять степень стабильности сервиса. Кроме того облачная инфраструктура позволяет использовать сервис без задержек в любой точке планеты и это несомненный плюс когда вы, например, любите путешествовать.
Пытливый читатель наверняка поинтересуется: "не ужели в чат-ботах одни плюсы?" И действительно не все так гладко как хотелось бы. Давайте рассмотрим и минусы.
В чате вы не сможете модернизировать определенные области изображений. Строго говоря любые работы связанные с подменой лиц, предметов и так далее почти не возможны. Есть приложения которые приглашают на свой вебсайт для того чтобы сделать какие то более сложные обработки, но их мало. В основном либо это чат-бот, либо это веб-приложение. Ситуация может измениться в ближайшее время с появлением технологии web-app, но пока что имеем такое ограничение.
То же касается и работы с 3D моделями. Конечно в теории можно получить из чат-бота готовый файл в формате *.stl или другом, но вот сразу просмотреть или подправить его в чате не получится.
Обзор популярных ботов работающих с изображениями
- Котик-ботик - это пожалуй самый удобный и простой в освоении бот, при этом снабженный большинством необходимых функций. Плюсом к генератору изображений идет самый настоящий chatGPT от OpenAI. На момент написания статьи этот бот генерирует картинки бесплатно, а вот за поддержку chatGPT придется доплачивать. Доступен выбор из четырех открытых моделей нейросетей, есть возможность генерировать изображения в разных пропорциях, улучшение качества сгенерированного изображения, интерфейс похож на популярную Midjorney. Из приятных дополнений: есть партнерская программа, поддерживается голосовой ввод, нормально понимает русский язык.
- Yes AI - отличное решение для тех кто решил углубиться в генерацию изображений серьезно. Пожалуй наиболее функциональное решение на рынке, поскольку имеет огромное количество настроек генерации. Здесь представлено 9 различных моделей, есть настройки количества шагов генерации, CFG и даже DPM++SDE KARAS. За поддержку некоторых настроек придется платить отдельно. Так же при регистрации вы получите небольшое количество пробных запросов, и далее только за оплату. Есть ChatGPT на борту, но работает он не лучшим образом, особенно когда получает запросы на русском, учитывая что он доступен бесплатно это не так и плохо, но вероятнее всего используется opensorce модель gpt а не оригинальный OpenAI.
- Stable Diffusion - бот для тех кто хочет испробовать максимальное количество различных моделей нейросетей. Тут их представлено аж 20 штук и каждая из них имеет свой неповторимый характер. Так же есть различные настройки генерации. Есть возможность преобразования загруженной фотографии. Бот бесплатный, однако есть и возможность задонатить автору.
- Avatar generator - это скорее специализированное решение чем инструмент широкого профиля. Данный бот предназначен для генерации красивых аватарок для соцсетей. Добавляете несколько своих фотографий, выбираете стиль, дополняете все это текстовым описанием и бот сгенерирует несколько вариантов вашего лица, преобразованного под выбранный стиль. Отличный продукт, демонстрирующий возможности нейросетей, которые пока что мы не видели в других решениях.
- DALL_E_2BOT - не могли пройти мимо этого чат-бота, поскольку он один из не многих использует нейросеть DALL_E_2. Не то что бы ее результаты превосходят результаты моделей основанных на Stable Diffusion использованных в большинстве ботов, но характер отрисовки явно отличается, и вполне вероятно кому то из пользователей подойдет больше именно такой вариант.
Примеры использования генеративных нейросетей
На самом деле, сейчас мы живем в том славном времени когда отличить работу нейросети от работы реального художника практически не возможно. Нейросети получили настолько широкое распространение что пользоваться ими теперь может каждый имеющий мобильный телефон. А качество генерируемых картинок постоянно растет. Разглядывая статью или товар в интернете трудно заранее отличить оригинальные изображения от сгенерированных. Мы не знаем на что именно мы смотрим теперь. Плохо это или хорошо - трудно сказать, но это уже случилось. Будем рады услышать ваше мнение в комментариях.
В соцсетях появляется множество пабликов и каналов которые публикуют работы людей с использованием нейросетей. Направление популярное и быстро-растущее. Монетизацию обеспечивает размещение рекламы. Вот некоторые из них: NeuroImages, WhatIsMidjorney.
Так же многие люди ведут личные странички с использованием красивых артов. Это во первых может привлечь внимание людей к вашей персоне, а во вторых помогает следовать политике механизмов отбора постов в ленты соцсетей. Скажем если выведете какой то бизнес, то для привлечения внимания можно использовать такой метод. Вот несколько аккаунтов людей использующих нейросети: А.Шураев, Spitsyn.A
В связи с бумом популярности нейросетей естественно появление предприимчивых людей, готовых за небольшие деньги обучить любого использованию генеративных нейросетей на высшем уровне. Периодически в сети нам попадаются курсы по навыкам промптинга, курсы нейрохудожников и прочие новые профессии и занятия с весьма многообещающими перспективами. Автору данной статьи представляется работа с нейросетями чрезвычайно простой во первых и требующей прикладных навыков во вторых. То есть например если вы попробовали генераторы картинок в телеграм и у вас круто получается, то это не значит что вас с распростертыми объятьями примут работать художником в разработку игр. Просто потому что там нужны еще и знания конкретно в этой отрасли, знание специальных программ, которые за частую уже сейчас оснащаются нейросетями. Однако ничего не достигает тот, кто ничего не делает, поэтому приведу пару подобных курсов: Нейроиллюстратор, Курс по Stable Diffusion.
В последнее время нейросети успешно используются для создания рекламных кампаний. Например, в Уфе агентство Marten Marketing и Группа компаний «Третий Трест» запустили первую в России наружную рекламную кампанию, которую полностью создала нейросеть. ИИ сгенерировал креативные материалы, которые были размещены на рекламных щитах, автобусах и других поверхностях.
Также, «БКС Мир инвестиций» использовала нейросети для создания контекстной рекламы в приложении. Нейросеть ChatGPT помогла сгенерировать тексты, а нейросеть Midjourney создала визуалы.
Компания Сбер выпустила рекламный видеоролик, где все визуальные эффекты были сгенерированы нейросетью StableDiffusion. В видео показан музей, где герои картин передают друг другу бутылку Coca-Cola, создавая ощущение оживших картин.
Будем рады если в комментариях вы расскажете о других кейсах использования нейросетей. Вполне возможно соберется материал для отдельной статьи.