Пишешь нейросети нарисовать одно, а она генерирует совершенно другое. Сталкивались с таким? На днях в комментариях подписчик поделился проблемой - не получается сгенерировать овчарку. Хотя с другими породами проблем почти нет. И это не первый подобный случай. Тема актуальна - будем разбираться.
Вместо овчарки нейросеть генерирует пастуха с овцами. Как тут не вспомнить песню волшебника-недоучки: "Сделать хотел грозу, а получил козу". Разберём способ всё исправить, и расскажу почему такая проблема вообще возникает.
Морской котик вместо кота
С первого дня работы нейросети Kandinsky разработчики громко заявляют: "Наша нейросеть понимает 101 язык". Тут не придраться - действительно, пиши хоть на арабском, всё равно сгенерирует картинку.
Но особенность всё же есть. Делюсь своими наблюдениями.
Я пользуюсь нейросетью Kandinsky уже полгода, с релиза алгоритма 5.1. Все новые нейросети я проверяю по одному описанию "котик". Да, просто котик.
Алгоритм 5.1 упорно генерировал морского котика.
Удивлены? Всё дело в переводе на английский язык. Вот посмотрите - для слова "Котик" на первом месте идёт перевод "Морской котик".
Получается, что на самом деле нейросеть генерирует картинку не по русскому тексту, а по переводу описания на английский язык. И это не единичный случай подтверждения переводной системы.
Нейросеть Kandinsky понимает 101 язык - это правда. Но правильнее будет сказать - нейросеть Kandinsky умеет переводить на английский 100 языков.
Перевод, естественно автоматический, а не по смыслу. При автоматическом переводе используется первое рекомендованное значение слова.
Про трудности перевода я уже писала на своём канале, тема остаётся актуальной до сих пор:
Вместо собаки рисует пастуха и овец
Точнее не просто вместо собаки, а вместо овчарки.
Действительно, если в описании нейросети Kandinsky просто написать "овчарка", получится вот такой пастух с отарой овец.
Прежде чем ругать нейросеть, давайте посмотрим на первый приоритетный перевод слова "овчарка": shepherd.
А теперь переведём в обратную сторону - с английского на русский и получается вот такой список. И овчарка далеко не на первом месте. Вот поэтому вроде как нейросеть на русском языке выдаёт пастуха. Всё дело в многозначности перевода с русского на английский.
У самого слова "овчарка" есть несколько вариантов на выбор. Давайте пройдёмся по всем.
sheep-dog
Получается смесь собаки и овцы. Слово "sheep-dog" переводится однозначно как овчарка. Но тут особенность в синтаксисе - используется тире. В результате получаем смесь двух животных, а не породу собаки.
shepherd breed
Отличный результат получается на слово "shepherd breed" - в переводе на русский "порода овчарок". При этом вариант с обратным переводом не работает. То есть если написать "порода овчарка" всё равно получится несуществующий гибрид.
sheepdog
Вроде овчарка, но какая-то не привычная для нас. Тут уже срабатывают предпочтения жителей конкретной территории. В России большинство держит немецких овчарок. А по запросу "sheepdog" нейросеть генерирует не просто овчарок, а пастушьих собак. Тут вам будет Австрийская пастушья овчарка, Староанглийская овчарка бобтейл, Пиренейская пастушья собака, шарпланинец, Венгерская овчарка Командор, шелти и остальные пастушьи собаки.
Подведём итог
- Если нейросеть Kandinsky генерирует вам картинки с неожиданным результатом - проверяйте варианты перевода русского описания на английский язык. Многочисленные факты указывают на то, что итоговый текст для генерации до алгоритма доходит всё же на английском.
- Пробуйте для генерации разные варианты перевода, чтобы определить какой из них даст вам максимально точный результат. И не всегда это будет самый первый вариант в списке возможных переводов.
- Учитывайте вариативность реально существующих объектов, как в случае с разнообразием пород пастушьих собак.
Если вы осваиваете нейросети, учитесь составлять промты – добро пожаловать на мой канал.
✅ Включите колокольчик во вкладке "Подписки", чтобы получать оповещения.
✅ Или подпишитесь на Телеграм и точно не пропустите новые публикации.
Давайте осваивать нейросети вместе! Делитесь своими успехами в комментариях.