Нейросеть... Мало кто не слышал об этом слове и мало кто не пробовал эти самые "сети" в действии. Я даже больше скажу, с такой дурацкой подводочкой написано уже невероятно большое количество статей, постов, снята куча видео, новостных репортажей ну и прочего медиаконтента. Кто ж не знают что это такое, как это и зачем... Не совсем. Конечно, в общих чертах все понимают какие есть нейронки, но в данном материале хотелось бы в максимальных подробностях разобрать все разновидности искусственных интеллектов, разобрать как они работают, ну короче всё то, что я написал в заголовке сверху. Без лишних предисловий, статья и так обещает быть длинной, начинаем!
Что вообще такое нейросеть и откуда растут руки?
Начну с того, что объясню термин нейросеть. Нейросеть — это разновидность машинного обучения, то есть определённый метод, по которому программа учится и создаёт необходимые результаты. К примеру, возьму нейросети, что генерируют изображение. У нас есть, собственно, программа. Ей выдаётся огромное множество данных, на которых она учится, то есть, проанализировав тысячи изображений пляжа, прога учится, а после сможет сотворить картинку, которая в принципе-то смахивает на множество других, но так-то точно такой же вы не найдёте.
Точно также работает и с прочими видами нейросетей. Те же имитации голосов знаменитостей, что вы могли слышать в разнообразных ai-cover'ах или пресловутый чат GPT искусственный интеллект он как бы и не искусственный интеллект, а лишь та же машина, что попросту на основе полученной информации генерирует нечто похожее на то, что она уже успела увидеть. Поэтому все посты в духе, о нет, они сейчас восстанут и захватят мир (а такие реально есть, я не шучу) фейк и неосведомлённость автора.
Ну и вкратце об этимологии слова: нейросеть, она же нейронная сеть, как я уже говорил, но другими словами, это математическая модель, которая основывается на сетях нервных клеток живого организма. Понятие это возникло при изучении процессов в нашем с вами мозгу, а если быть точнее, при попытке воссоздать, нарисовать, ну или же смоделировать эти самые процессы на бумаге. Я конечно могу сейчас попытаться понять сам, а после объяснить, как это выглядело и как работало, но основное вы думаю поняли — понятие нейросетей возникло при изучении мозга. Пытаясь перенести наш образ мышления на что-то неживое, то мы получили машин, что основываясь на предыдущем опыте создают что-то схожее, но в то же время уникальное. Надеюсь объяснил всё понятно, посему двигаемся дальше.
Какие бывают нейросети??
Так, со сложным всё, теперь расскажу про разновидности нейросетей, ну и зачем эти все разновидности в принципе нужны. Ну и из-за того что я дебил, который разбивает всё по категориям, то все нейронки я поделил на такие вот группки:
1. Визуальные нейросети. То есть те, которые как-то связаны с изображением чего-либо, картинки там, видео
2. Звуковые нейросети. Все те, что связаны со звуком, музыкой и вот этим вот всем.
3. Текстовые нейросети. Ну вот эти все чат GPT и иже с ними.
Давайте по порядку:
1. Визуальные нейросети
Генерация изображения
Одна из самых применяемых сфер нейросетей это именно генерация изображений. То есть, мы вводим запрос (он же промт), и на его основе наша нейросеть генерирует изображение. Не знаю что тут ещё можно объяснять, поэтому быстренько пройдусь по самым популярным:
MidJourney — одна из самых крупных визуальных нейронок. Стала чуть ли не именем нарицательным в этой сфере. Генерировала вроде как неплохо, но сейчас стоит от десяти баксов в месяц.
DALL-E 3 — нейронка получила большое распространение в начале двадцатых годов в версии mini, хотя не совсем ясно почему, ибо она была, мягко говоря, хреновастенькой. Прошло много времени, далли открыли обществу, а сейчас вообще выкатили третью версию. Но в России он блокнут, попробовать ещё можно в чате гпт, но он тоже блокнут у нас, так он ещё и платный, так что Далли идёт нафиг, листайте дальше.
Microsoft Designer — не знаю как это пробилось в топы нейросетей, так как использовать Бинг и его побочные сайты ради нейросетей, которых и так до ужаса много такая себе идея, и снова да, его заблокировали в России, пропускаем его.
Stable Difusion — одна из самых известных, популярных и главных нейронок в этой сфере. На неё есть кучища модов, её спиратили, повторили разместили везде где можно, где-то столько же раз, сколько и Миджорню. Можно поставить прилогу себе на ПК, либо же пользоваться браузерной версией. У неё есть платная версия, где есть пару прикольных фич, но и так эта очень крутая нейронка с реально большим количеством возможностей. Одна из лучших в своём роде, всем советую.
P.S: только сейчас ещё узнал, что для Далли и микрософт дезигнера нужно ещё зарегистрироваться в учётной записи Майкрософт. Мой вердикт:💩💩💩.
Dream by Wombo — спорная штука. Так-то она бесплатная, но местами прям очень ограниченная. Работать в принципе можно, генерирует изображения она неплохо, но к сожалению лишь просто неплохо, и не более того. А, ну из прям минусов-минусов, это то, что генерит она только вертикальные картинки, не оч прикольно если честно.
Craiyon — я не знаю как этот мусор попал в какие-то там топы лучших нейронок, это самая нереалистичная и вообще неумеющая рисовать ии из всех, что были раньше. Да, она бесплатная, но генерирует гавно. Никому не советую.
Lexica — генерирует всего лишь 16 картиночек в месяц, а за раз генерит сразу 4, то есть у вас есть 4 бесплатные генерации, всего лишь. Да, рисует красиво, но не тратьте зря время, дальше будут ещё хорошие нейронки.
StarryAi — красиво конечно рисует, но опять же, если у вас так много денег и вы совсем не знаете куда же их потратить, то без проблем, девять баксов в месяц и она ваша. Но пять генераций в день, не знаю, для профессионального и удобного использования такое себе. + у меня это инвалидное говно не работало и выдавало ошибку, хз чё не так...
LeonardoAi — в принципе тут бесплатных генераций уже побольше так, что использовать даже в принципе можно. Нооо, там очень странная система, что какие-то изображения стоят столько-то токенов, какие-то меньше/больше. Слишком много геморра, берите другую.
Шедеврум — нейросеть от Яндекса, реализована максимально спорным способом. Да, она бесплатная, но вы должны скачать отдельное приложение НА ТЕЛЕФОН, быть зарегистрированным в Яндексе, ну и все работы обязательно постить в сеть. Можно конечно попробовать, но я не особо представляю работу на телефоне, так что двигаем дальше.
Kandinsky — тоже русская нейросеть, только теперь уже от Сбера. Использовать её можно как на сайте, так и в боте. АБСОЛЮТНО БЕСПЛАТНА. Как по мне, так имба, генерит не прям, чтобы на уровне миджорней и иже с ними, но учитывая то, что она бесплатна, без подписок и фигни.
HotPot — немножко ещё полуизвестных нейронок и пойдём дальше. Десять бесплатных генераций в день со своими вроде как прикольными стилями.
ArtBreeder — ну 10 генераций в месяц с ещё криволапым сайтом это конечно сииильно. Плюс сама нейронка такая себе, скипаем эту тоже.
Easy-Peasy.Ai — ну а тут вообще всего можно только сделать пять генераций, ноо мне чего-то зацепил стиль рисовки этой нейронки, да и библиотека у неё здоровая.
Playground — очень проработанные фоны, да и картинки в целом. Пару раз она почему-то проигнорировала мои слова в запросе, зато картинки крутые. Жирный плюс ещё за то, что аж 100 генераций В ДЕНЬ, так что смело рекомендую для генераций.
Отдельный абзацец про Scribble Diffusion. У меня она почему-то работать не захотела, но по идее, ориентируясь только на ваши наброски и подпись, нейросеть должна нарисовать картинку. Чисто в теории такая разработка может стать следующим шагом в нейронках-картинках, ведь теперь можно хотя бы примерно отрисовывать картинку, а ии уже дорисует как правильно. Нооо как видно, рисует эта штука так себе, так что как иной вариант это TraDiffusion, которая выдаёт чудеса эквилибристики, буквально за пару мазков рисует киношедевры. Ну в общем, интересная тема, можете посмотреть что там да как.
Далее, помимо обычной генерации картинок, можно также почистить фон (вот пару таких: тык, тык и тык), дорисовать готовое изображение (умеют всё те же StableDiffusion и Kandinsky, но тык, тык и тык тоже хороши в этом), перерисовывать уже готовое изображение (может всё тот же Кандинский, но для приличия: тык, тык и тык). Также я не касался темы видео, сейчас уже нейронки начали генерировать видева аж в двух разных форматах: обрывочная анимация, то бишь та, где много-много картинок соединяют в одно целое и та, где уже имеется полноценная анимация. Поприкалываться можно и в Кандинском, но если пытаться в более серьёзное то пробуйте RunwayML (немного урезаны возможности, но так бесплатна), можете глянуть Synthesia (заморочки с регистрацией, но качество видосов поражает), ну и до кучу D-ID, опять урезана часть функционала, но пробовать можно сколько хочешь + качество крутое.
2. Звуковые нейросети.
Куда более захватывающее направление, ежели прошлое. Здесь прям есть где разгуляться, так как в звуковые нейросети я вписываю как те, что могут зачитывать текста, повторять голоса, а также те, что могут самостоятельно придумывать музыку и писать песни, это ли не круто? Нет...
Казалось бы, что может быть проще... Может. Ибо в Интернете так просто отыскать хорошие "озвучкеры" та ещё задачка — большинство либо ушло в дичайшую коммерцию, куда большую, чем все ваши миджорни, либо же просто наиотвратительнейшие. Нет, ну правда, в начале развития всего вот этого было где разгуляться, а сейчас, эх, чёртовы капиталлисты. И вот тут по сценарию должно было идти перечисление различных нейронок, что всё-таки доступны простым смертным, но таких я почти что не нашёл. Нет, серьёзно, в планах были и абзацы про бесплатные подражатели голосам знаменитостей, и про просто читку голосов. Но все они либо с просто невозможными ограничениями, в духе, полторы генерации в день и валите, либо полностью платные. Из всех выделяется Silero TTS Bot из телеграмма, который хоть и имеет не то чтобы много бесплатных генераций, зато полный выбор голосов, которых ну просто дофига.
Ну и всё-таки приведу примеры платных голосовых нейросетей, вдруг вам это будет нужно/интересно.
Zvukogram — кроме внушительной библиотеки всяких разных звуков (которая кста бесплатная), они сделали множество голосов для читки текста. Да, там есть бесплатные генерации, но они настолько отвратно работают, что и на пару раз не хватит. + там прям оч много голосов, так что выбирать можно долго;
Tinkoff VoiceKit — оказывается, что и эти ребята впрыгнули в эту среду. Как я понял, в первую очередь они старались для помощников и всяких колл-центров, насколько круто она работает можете протестить, два дня бесплатны;
Яндекс.Спичкит — ещё одна нейросеть от крупной компании. Работает хорошо, правда найти и запустить как пройти через семь кругов ада. Как минимум этому можно доверять, яндекс это не какие-то нн звукограмы
Silero TTS Bot — если же покупать плааатную версию, то это вообще кайф. Огромный выбор голосов всяких мемных и не очень личностей/персонажей, множество фишичек, крутая вещь в общем.
Ну и немножко про создание своих песен нейронкой. Собственно первопроходец, лидер в этой сфере определённо Suno Ai, так как даже до этого несильно большого уровня Суны никто не добрался. Либо всё скатывается в коммерческую коммерцию, либо же просто какая-то фигня. И да, если вы до сих пор не поняли, данная нейронка способна от начала и до конца создать песню, то есть, и музыку, и текст. Причём, без шуток, весьма недурная. Я попробовал не раз и не два, и песни получались правда хорошими. Вы можете задавать ей текст или же давать написание ии; вы можете выбирать жанр/ы и получить то, что хотели. Про бесплатность/платность не скажу, я сколько генерил мне никто ничего про токены и вот эту всю муть не говорил, пользуйтесь в своё удовольствие.
3. Текстовые нейросети.
Ну и напоследок затронем текстовые нейросети, то есть те, которые тем или иным образом связаны с набором текста умнным (или не очень) ИИ.
Загрузить чат GPT в нашей стране так просто не получится, заблочен он у нас, так ещё эта штука до кучи платная, так что как всегда приходится искать аналоги среди всякого неизвестного. Из самого простого это тг-боты, причём, что самое удивительное, широко используемые. Там вообще огненная смесь из миджорни, далли и самого чата гпт, но как оно всё работает смотреть вам, к текстовой части сервиса вопросов вообще нет. Далее, если вы по какой-то неведомой причины не работаете в телеграмме и до безумия хотите чат gpt именно в браузере, то как вариант Chad Ai, где очень умный нейронкин по 10 генераций в день выдаёт.
Google Colab одна из самых наверное мощных текстовых нейронок в принципе. Да-да, опять приходиться использовать всякие обходные vpn-ы и подобное, но результат того стоит. Поддерживает большинство языкв, в том числе наш родной, текста пишет прямо-таки мощнецкие, очень хорошо ищет информацию, собственно, если не хотите сами проводить долгие тесты, тоо вам в помощь множество YouTube-роликов, где нейронка выдаёт иногда такие ответы, что не каждый умный человек напишет такое.
Яндексы смотря на своих американских собратьев тоже захотели крутую нейросеть gpt, но по итогу получился Yandex GPT3... Ну результат ну просто как бы ну очень мда. Сыпется с первых же запросов, а когда я попросил привести аналоги чатов gpt он мне начал рассказывать про миджорни и кандинский 0_0. А ну на прочее простое отвечает очень односложно, в поисковой строке он работал пободрее что ли.
Далее, GPTOPEN, за подписку можно поиграться и с миджорни и подобным, но вроде как за полностью бесплатно можно развлекаться аж 80-ю вариациями. Тут есть как и реально полезные, в духе копирайтера, программиста, маркетолога и тд, так и несерьёзные, выдуманные персонажи — Лара Крофт, магистр Йода и прочие. Здесь можно, как вы поняли из моих слов, и делом заняться, и фигнёй помаяться. Но из минусов это то, что генерация ну очень медленная, причём дело не в том, что над ответом долго думает ии, а в том, что печатает с какой-то удивительной медлительностью.
Порфирьевич, ещё одна российская разработка. Работает странно, то и дело выдаёт ошибку, но общую суть я понял. В общем, вы писатель, пишите себе свой, представим рассказ. Ну и вот сидите, вообще не понимаете о чём писать дальше. Так вот, эта нейронка добавляет сколько-то слов (до 60) в продолжение вашего рассказа. И блин, если бы не внезапные провисания это было бы прикольно хотя бы потому, что дополнения Порфирьевича достаточно необычные (один раз он почему-то продолжил историю в сторону рехаба 0_0).
Ну и помимо всяких текстов, нейронка может помочь программистам в решении трудностей кода. Я в этой теме далёк и сам проверит нейросети не смогу, так что пришлось опираться на всякие левые сайты. Из самых известных упоминаются GitHub Copilot. На этом сайте постятся различные проекты, собственно эта нейронка там запостчена энтузиастами. Она может помогать писать код, предлагая различные подсказки, ну а также переводить обычные предложения в строки кода. Отзывы вроде хорошие, НО нужна подписка. Далее, IntelliCode от Microsoft. Бесплатна при использовании Visual Studio и Visual Studio Code, для тех кто уже в них работает это в плюс. Помогает кодить, ориентируясь на проекты ГитХаба. Старается косить под ваш стиль.
Codeium как я понял полностью бесплатна. Быстро интегрируется под вас и ваш стиль, хз, можно ли сказать, ваш стиль написания кода. Поддерживает разные платформы и языки.
Ну и до кучи чуть-чуть про TabNine. Автозаполняет код как и прошлые, легко совмещается с популярными редакторами кода. Может также работать и в оффлайн режиме. Есть бесплатная версия, но с ограниченными возможностями.
ИТОГИ:
Подводя итоги, нейросети действительно полезная разработка последних лет. Ноо мне кажется, что их можно использовать только в определённых узконаправленных кругах, то есть, программистам, каким-то сценаристам и писателям, ну и подобное, упоминалось уже выше. Заменят ли нейросети художников? Нет. Заменят ли они профессиональных актёров дубляжа? В ближайшие годы также нет. Так что это очень узкая в использовании разработка, которая в своей сфере, для которой создавалась, может быть очень полезной.