Приветствую всех читателей. Наверное, каждый из вас на данный момент неравнодушен к такой продвинутой технологии мира, как "нейронная сеть". С помощью них мы получаем то, чего сами никогда бы не сделали. Конечно, это полезная технология и лично для меня это уже нечто большее, чем просто удобная вещь. Но насколько они полезны и могут ли полностью удовлетворять наши требования? Разберём несколько нейросетей, созданных для разных целей.
1. Fusion Brain
Эта нейросеть генерирует изображения по тексту. Функционал и дизайн этой нейросети, в принципе, неплохой. Она может сгенерировать даже самую, казалось бы, абсурдную картинку, подобие которой в интернете точно никогда не найти. Она полностью бесплатная, нужна только регистрация. И на этом, наверное, все преимущества проекта заканчиваются.
Нейросеть крайне нестабильная. Очень часто перестаёт работать после каждого запроса. Хотя, это обычно зависит от трудности генерации изображений из-за заданного текста. Ещё она может подолгу их генерировать. Казалось бы, сложную картинку может сгенерировать через 3 секунды, а какую-нибудь элементарную, по типу "белый дом" или "человек в лесу" приходится ждать по нескольку минут. Но я обычно не жду дольше 3 секунд, если долго генерирует, сразу перезахожу.
Ещё она часто делает, что хочет. На те же лёгкие запросы она может сгенерировать что-то совершенно не имеющее отношения к нему. Например, на тот же элементарный белый дом она может сгенерировать какую-нибудь пышную красавицу. Но такое происходит только при первом пуске, последующие нажатия обычно более благополучные.
И ещё одно замечание - это её странные ограничения. В ней нельзя запрашивать изображения с малейшим намёком на что-то откровенное и страшное, но при этом на допустимые запросы может сгенерировать жуткое или омерзительное изображение, проще говоря, шокирующее, а иногда даже откровенное. Из-за этой нейросети можно легко сломать себе психику. Чем-то напоминает ютуб.
В целом я бы поставил этой нейросети 6 из 10. Хоть и к ней можно быстро привыкнуть и она добротная, но всё же у неё большие минусы.
2. SnapEdit
Нейросеть очень глубокая. Она может делать с изображениями практически всё, от улучшения качества до удаления определённого объекта. Её основным преимуществом и является возможность удовлетворять важные повседневные потребности. Не могу представить человека, которому хоть раз бы не понадобилось воспроизвести те манипуляции с изображениями, которые вручную воспроизводить долго и сложно. В целом она справляется со своими задачами, но имеет множество недочётов.
Удаление фона с изображения у этой нейросети не самое лучшее, которое я находил. Она может удалить не всё, может сделать не совсем то, но всё же видно, как она старается.
Улучшение качества тоже не самое лучшее. У неё как будто отсутствует реалистичность, полученные результаты хоть и соответствуют требованиям, но изображения теряют ощущение чего-то настоящего. Можно смело довести своё изображение до абсурда, несколько раз прогнав его через эту нейросеть.
Эта нейросеть заслуживает 7 баллов из 10. Она действительно полезная и имеет место быть, она в полной мере выполняет требования пользователей, но в некоторых местах имеет свои недостатки.
3. Vmake
Если SnapEdit специализировался на манипуляциях с изображениями, то Vmake работает и с изображениями, и с видео. Но эта нейросеть может только улучшать качество, для этого она и создана. Она бесплатная, серьёзных затруднений в работе с ней не возникает. Но то, как эта нейросеть улучшает качество оставляет желать лучшего.
Мои претензии к ней просто на высшем уровне. Качество в этой нейросети мы получаем, мягко говоря, ужасное. SnapEdit с этим хоть немного справляется, а Vmake как будто просто искажает. Но во всяком случае, она умеет взаимодействовать с картинками и видео низкого качества.
Также, стоит обратить внимание на длительность загрузки видео. Иногда они загружаются быстро - за 2 минуты, а иногда приходится ждать часами. Часто я так и не дожидался завершения.
Vmake заслуживает не больше 5 из 10 баллов. Но всё же это единственная нейросеть, позволяющая в полной мере и бесплатно улучшать качество видео.
4. RVC
И заключающая, на сегодня, нейросеть - RVC. Она в прямом смысле позволяет изменять голос в аудио. Её в этом списке можно назвать самой качественной, но не самой безупречной.
Начнём с того, что доступ к ней очень сложно заполучить. На данный момент эта нейросеть постоянно меняется и остаётся только успевать за ней. К сожалению, сейчас с ней нет ни одного нормального гугл коллаба и был заблокирован дискорд сервер с моделями голосов.
Если же взять во внимание то, что ещё возможно - это RVC v2. Но даже эта версия работает крайне нестабильно и после запуска прекращает свою работу в лучшем случае через 5 минут. В итоге мы не успеваем поставить правильные настройки и получаем совсем не то, что хотели. Но каким образом я изменяю голоса в аудио (не знаю насчёт других)? К счастью до сих пор есть способ это сделать - через программу на python "RVC GUI".
Принцип крайне прост. Закидываем туда аудиофайл, выбираем загруженную модель голоса (на данный момент их можно взять на сайте weights), далее выбираем метод (всегда ставьте harvest) и всё, на этом наши действия закончились, нажимаем на конвертацию.
Из недостатков можно отметить долгую загрузку. Но я думаю, это не такая серьёзная проблема. Поэтому этой нейросети можно поставить 8 из 10 баллов. Её по-настоящему можно назвать невероятной технологией.
Итак, на этом моё оценивание нейросетей закончилось. Можно сделать вывод, что далеко не все нейросети оправдывают ожидания и облегчают работу вручную. Но на данный момент они найдутся для любого необходимого действия с интернет файлами и выполнят свою работу либо бесплатно, либо за небольшие деньги.
Подписывайтесь на мой яндекс дзен и ютуб канал.