Найти в Дзене

Как я три часа пытался заставить Гигачат (Кандинский) написать по-русски — и почему оно всё-таки того стоило

Я три часа пытался объяснить Гигачату, как выглядят нормальные русские буквы, и получил целую коллекцию “ПИНЯЛИЕ” и “ИСПЛИТОН”. Зато разобрался, почему Kandinsky 5.0 есть только на словах, а по факту — доступна старая версия. И почему обычному человеку рано радоваться громким презентациям. Если вы думаете, что генерация картинок в Гигачате — это просто “написал промт и получил красоту”, то я тоже так думал. До того момента, пока нейросеть не начала выдавать мне слова, которых в русском языке не существует. Новость про Kandinsky 5.0 меня разогрела быстрее, чем морской чайник на примусе.
Все кричат: «Русская модель! Мощнее, быстрее, теперь доступна каждому!»
Ну думаю: вот оно — современная техника добралась до простого человека, и сейчас я, старый моряк, сделаю картинку, чтобы объяснить, что такое «веса нейросети» простыми человеческими метафорами. Ох бы мне кто тогда постучал по плечу… Сначала я решил проверить маленького новичка — NanoBanana.
Ничего не ждал. Просто кинул ему описание:
Оглавление

Я три часа пытался объяснить Гигачату, как выглядят нормальные русские буквы, и получил целую коллекцию “ПИНЯЛИЕ” и “ИСПЛИТОН”. Зато разобрался, почему Kandinsky 5.0 есть только на словах, а по факту — доступна старая версия. И почему обычному человеку рано радоваться громким презентациям.

Если вы думаете, что генерация картинок в Гигачате — это просто “написал промт и получил красоту”, то я тоже так думал. До того момента, пока нейросеть не начала выдавать мне слова, которых в русском языке не существует.

Итак, история начинается. Я — полный оптимизма. И вера в Кандинского 5.0.

Новость про Kandinsky 5.0 меня разогрела быстрее, чем морской чайник на примусе.
Все кричат: «Русская модель! Мощнее, быстрее, теперь доступна каждому!»
Ну думаю: вот оно — современная техника добралась до простого человека, и сейчас я, старый моряк, сделаю картинку, чтобы объяснить, что такое «веса нейросети» простыми человеческими метафорами.

Ох бы мне кто тогда постучал по плечу…

Шаг первый: NanoBanana — тихий герой дня

Сначала я решил проверить маленького новичка — NanoBanana.
Ничего не ждал. Просто кинул ему описание:
Мне нужно объяснить людям старшего поколения, плохо владеющим компьютером, что такое веса в ИИ. Создай образное изображение.

И что вы думаете?
Он сделал.
С первого раза.
На нормальном русском (почему это важно, поймете позже).
В аккуратном стиле.

Я даже присвистнул.
Вот та самая картинка, которая у него получилась:

Генерация Нано Банана
Генерация Нано Банана

Шаг второй: ChatGPT — сначала мольба, потом победа

Воодушевлённый успехом, думаю:
«Ну теперь-то ChatGPT точно сделает конфетку».
Запускаю.
И он выдаёт…
ну… скажем так:
картинку, к которой у меня возникло много вопросов и один нервный смешок.
Он решил, что мы в Англии, а Вы у меня читаете по английски также, как по-русски. Видимо укачало беднягу.
Со второй попытки он выдал уже приличный результат.
Но это была борьба, а не генерация.

Шаг третий: Гигачат — куда ж ты меня привёл, родной?

И вот я захожу в Гигачат.
Ожидания — выше мачты.
Ведь в новостях пишут: «Теперь доступен Kandinsky 5.0!»
Ага… сейчас.
Гигачат начал выдавать такие слова, что у меня кот спросил:
«Ты уверен, что это по-русски?»
Вот такие шедевры я получил:
– «
ПИНЯЛИЕ» вместо ПОНЯТИЕ
– «
ДАННЬЕ» вместо ДАННЫЕ
– «
ИСПЛИТОН» вместо… ну мы так и не выяснили чего

Картинка выглядела примерно так:

И сколько бы я ни пытался…
ни один вариант Гигачата
не смог правильно написать русские слова в кадре.
В конце-концов он начала откровенно халтурить, пытаясь сократить количество слов:

Вот тогда-то шторм разочарования и накрыл.

Почему так? Где этот Kandinsky 5.0, о котором все говорят?

👉 Потому что настоящий Kandinsky 5.0 действительно существует.
Но исключительно в виде
кода для разработчиков.
То есть работает он пока так:
Не «сгенерировать картинку кнопкой».
А «скачай 12 гигабайт весов, установи Python, настрой GPU, запусти скрипт, молись, чтобы не вылетело».
Обычный человек 45+ этого не сделает.
Да и не должен.

А в Гигачат встроена старая модель.
Сколько бы ораторы ни махали руками на презентациях.

«На сцене всё работает идеально. В реальной жизни — не всегда работает даже слово “понятие”.»

Что я понял после трёх часов попыток

  • Реальный Kandinsky 5.0 открыт, но не доступен обычным людям.
  • NanoBanana — тихий герой, сделал лучше всех.
  • ChatGPT справился, но через переговоры.
  • Гигачат… ну… он старался.

Но этот шторм того стоил.
Потому что теперь я могу честно объяснить людям, что:
новости — это одно, а реальная доступность технологий — совсем другое.

Ответы на главные вопросы читателей

Почему Гигачат так корёжит русские слова?
Возможно потому что использует старую модель, а не Kandinsky 5.0.

Можно ли обычному человеку использовать настоящий 5.0?
Нет. Только через код и настройки.

Значит, презентации — обман?
Нет. Но до кнопки «сгенерировать красиво» ещё далеко.

Стоит ли ждать?
Надеюсь,, что пару месяцев новые модели появятся в сервисах.

Ваш штурман в океане ИИ
Ваш штурман в океане ИИ

Заключение

Вот такая история.
Три часа борьбы с Кандинским, смех сквозь слёзы, «Исплитон» как символ эпохи и неожиданная победа NanoBanana.

Но главное — теперь я точно знаю, как всё работает на самом деле.
И могу рассказать людям честно.

А вы пробовали заставить ИИ написать по-русски? Или тоже получали “ДАННЬБЕ”?