Найти тему

Нейросеть Kandinsky опять не понимает русские слова и как с этим бороться

Оглавление

Пишешь нейросети нарисовать одно, а она генерирует совершенно другое. Сталкивались с таким? На днях в комментариях подписчик поделился проблемой - не получается сгенерировать овчарку. Хотя с другими породами проблем почти нет. И это не первый подобный случай. Тема актуальна - будем разбираться.

Вместо овчарки нейросеть генерирует пастуха с овцами. Как тут не вспомнить песню волшебника-недоучки: "Сделать хотел грозу, а получил козу". Разберём способ всё исправить, и расскажу почему такая проблема вообще возникает.

Морской котик вместо кота

С первого дня работы нейросети Kandinsky разработчики громко заявляют: "Наша нейросеть понимает 101 язык". Тут не придраться - действительно, пиши хоть на арабском, всё равно сгенерирует картинку.

Но особенность всё же есть. Делюсь своими наблюдениями.

Я пользуюсь нейросетью Kandinsky уже полгода, с релиза алгоритма 5.1. Все новые нейросети я проверяю по одному описанию "котик". Да, просто котик.

Алгоритм 5.1 упорно генерировал морского котика.

Удивлены? Всё дело в переводе на английский язык. Вот посмотрите - для слова "Котик" на первом месте идёт перевод "Морской котик".

-2

Получается, что на самом деле нейросеть генерирует картинку не по русскому тексту, а по переводу описания на английский язык. И это не единичный случай подтверждения переводной системы.

Нейросеть Kandinsky понимает 101 язык - это правда. Но правильнее будет сказать - нейросеть Kandinsky умеет переводить на английский 100 языков.

Перевод, естественно автоматический, а не по смыслу. При автоматическом переводе используется первое рекомендованное значение слова.

Про трудности перевода я уже писала на своём канале, тема остаётся актуальной до сих пор:

Вместо собаки рисует пастуха и овец

Точнее не просто вместо собаки, а вместо овчарки.

-3

Действительно, если в описании нейросети Kandinsky просто написать "овчарка", получится вот такой пастух с отарой овец.

Прежде чем ругать нейросеть, давайте посмотрим на первый приоритетный перевод слова "овчарка": shepherd.

А теперь переведём в обратную сторону - с английского на русский и получается вот такой список. И овчарка далеко не на первом месте. Вот поэтому вроде как нейросеть на русском языке выдаёт пастуха. Всё дело в многозначности перевода с русского на английский.

-5

У самого слова "овчарка" есть несколько вариантов на выбор. Давайте пройдёмся по всем.

sheep-dog

Получается смесь собаки и овцы. Слово "sheep-dog" переводится однозначно как овчарка. Но тут особенность в синтаксисе - используется тире. В результате получаем смесь двух животных, а не породу собаки.

shepherd breed

-7

Отличный результат получается на слово "shepherd breed" - в переводе на русский "порода овчарок". При этом вариант с обратным переводом не работает. То есть если написать "порода овчарка" всё равно получится несуществующий гибрид.

-8

sheepdog

-9

Вроде овчарка, но какая-то не привычная для нас. Тут уже срабатывают предпочтения жителей конкретной территории. В России большинство держит немецких овчарок. А по запросу "sheepdog" нейросеть генерирует не просто овчарок, а пастушьих собак. Тут вам будет Австрийская пастушья овчарка, Староанглийская овчарка бобтейл, Пиренейская пастушья собака, шарпланинец, Венгерская овчарка Командор, шелти и остальные пастушьи собаки.

Подведём итог

  1. Если нейросеть Kandinsky генерирует вам картинки с неожиданным результатом - проверяйте варианты перевода русского описания на английский язык. Многочисленные факты указывают на то, что итоговый текст для генерации до алгоритма доходит всё же на английском.
  2. Пробуйте для генерации разные варианты перевода, чтобы определить какой из них даст вам максимально точный результат. И не всегда это будет самый первый вариант в списке возможных переводов.
  3. Учитывайте вариативность реально существующих объектов, как в случае с разнообразием пород пастушьих собак.

Если вы осваиваете нейросети, учитесь составлять промты – добро пожаловать на мой канал.

✅ Включите колокольчик во вкладке "Подписки", чтобы получать оповещения.

✅ Или подпишитесь на Телеграм и точно не пропустите новые публикации.

Давайте осваивать нейросети вместе! Делитесь своими успехами в комментариях.

Ещё на канале: