Отечественные нейронные сети – это звучит круто и ласкает слух любого патриота нашей Родины! Особенно на волне мирового хайпа ChatGPT и Midjourney. И это не сарказм! Именно поэтому мы с таким воодушевлением встретили Шедеврум от Яндекса и Kandinsky от Сбера. И это действительно достойные сети, кто бы чего не говорил и сколько бы ведер шлака на них не выливал!
Работы Шедеврума на нашем канале мы уже рассматривали. Вот здесь:
А также мы активно пользуемся нейронкой TurboText - тоже от российских разработчиков.
Но являются ли данные нейронные сети действительно российским в полном смысле этого слова? Или тут как с операционными системами, которые вроде как и существуют, и даже входят в государственный реестр отечественного программного обеспечения, но по сути все равно основаны на Linux.
В случае с Kandinsky и TurboText все предельно ясно и понятно. Под капотом у Kandinsky находится DALL-E, а у TurboText - Stable Diffusion. И об этом сами разработчики открыто заявляют. Ну да, потом эти предобученные нейронные сети уже наши специалисты дообучают на множестве других изображений. Но, тем не менее, назвать их теперь российскими нейросетями язык не поворачивается!
Совсем другое дело – Шедеврум. Что у него «под капотом» - тайна, покрытая мраком! По крайней мере, у нас найти данную информацию никак не получилось!
Но давайте идти логическим путем. Если Шедеврум с самого начала, с нуля, так сказать, разрабатывалась Яндексом, то логично предположить, что и «дрессировали» ее на наших родных российских фотосетах. Т.е. у нее не должно быть проблем с такими русскими понятиями как: Щи, балалайка, гармонь, кокошник, лапти, шапка-ушанка, неваляшка (ванька-встанька), матрешка, чебурашка и т.д.
Ну, давайте посмотрим как обстоят дела!
Итак, какие выводы можно сделать.
Уже практически понятно, что Шедеврум пока мало чего "знает" о русских символах. Вернее, языковая модель как-то обрабатывает данные на входе и, например, "понимает", что лапти - это обувь. Но, т.к. нейронная сеть никогда "в глаза их не видела", то и рисует она просто обувь. По сути, из всех примеров увенчалась успехом только матрешка - можно сказать самый известный символ, который у подавляющего числа иностранцев ассоциируется с Россией. Что это значит?
А значит это то, что с очень-очень высокой вероятностью "под капотом" Шедеврума находится какая-нибудь предобученная иностранная нейронная сетка. Абсолютно точно также как и у Kandinsky и у TurboText. Увы, чуда не случилось!
И вот вам еще на сладенькое, в качестве последнего гвоздя, так сказать.
На самом деле, пройдет время, Шедеврум дообучат и эти проблемы уйдут. Например, взять тот же Kandinsky. Сбер там перестарались и сильно переобучили свою нейросеть. Теперь она на любой запрос, в котором есть хоть малейшее упоминание патриотизма, выдает практически одну и туже картинку - молодежь на фоне российского триколора. Попробуйте сами!
Обидно другое. Неужели наши программисты и проектировщики не способны создать истинно российский продукт. Понятно, что это спорный вопрос - зачем стараться, если вся база уже давно выложена в открытом доступе. Можно взять Linux и, немного обработав его, выдать за российскую операционную систему. Точно также, можно взять Stable Diffusion, дообучить ее на наших российских фотосетах и выдать это все за русскую нейронную сеть. Не знаем как вам, а нам обидно. Ведь мы считаем себя патриотами нашей страны и действительно хотим, чтобы у нас было все самое лучшее и самое крутое - первый космонавт, первый искусственный спутник, первая нейронная сеть....
А может мы и не правы вовсе. В любом случае, будем рады увидеть ваше мнение в комментариях!