Найти в Дзене
Авто-Драйф 4х4.

Как генерирует искусственный интеллект Автомобили для Бездорожья.

Как то вечером, я решил познакомиться с искусственным интеллектом и попросил сгенерировать его автомобили для бездорожья и он мне выдал вот такие фотографии. Искусственный интеллект не «видит» бездорожье как человек — он статистически «угадывает», как выглядят типичные внедорожники по миллионам примеров из датасета. В общих чертах процесс такой: Модель (например, Stable Diffusion, Midjourney, DALL·E) обучают на: Во время обучения ИИ запоминает статистические закономерности: ИИ не знает, зачем это нужно для бездорожья — он знает, что это часто вместе встречается на таких снимках. Когда вы пишете, например:
«Сгенерируй автомобиль для бездорожья», у модели происходит следующее: Так шаг за шагом из шума получается картинка, статистически «похожая» на те, что модель видела в обучении. ИИ не конструирует технику по законам физики и механики, а комбинирует визуальные элементы. Поэтому: Если хотите получать более реалистичные автомобили для бездорожья, в запросе (промпте) лучше указывать:
Оглавление

Как то вечером, я решил познакомиться с искусственным интеллектом и попросил сгенерировать его автомобили для бездорожья и он мне выдал вот такие фотографии.

-2

Искусственный интеллект не «видит» бездорожье как человек — он статистически «угадывает», как выглядят типичные внедорожники по миллионам примеров из датасета. В общих чертах процесс такой:

1. На чём всё основано: обучение на огромной базе картинок

Модель (например, Stable Diffusion, Midjourney, DALL·E) обучают на:

  • миллионах изображений машин, дорог, грязи, природы, тюнинга;
  • подписях к картинкам: “off-road truck”, “4x4 suv in mud”, “rally raid car” и т.п.

Во время обучения ИИ запоминает статистические закономерности:

  • у «off-road car» часто:высокий клиренс;
    большие колёса с грязевой резиной;
    усиленные бамперы, кенгурятники;
    защита днища, силовые пороги;
    багажник на крыше, доп. фары;
  • сцена обычно:грязь, колея, песок, камни;
    лес, горы, пустыня;
    брызги, следы от протектора.

ИИ не знает, зачем это нужно для бездорожья — он знает, что это часто вместе встречается на таких снимках.

-3

2. Как идёт генерация: текст → картинка

Когда вы пишете, например:
«Сгенерируй автомобиль для бездорожья», у модели происходит следующее:

  1. Текст кодируется в набор чисел (эмбеддинг), где слова «автомобиль», «внедорожник», «бездорожье» превращаются в вектор признаков.
  2. Стартовое состояние — шумная «зернистая» картинка.
  3. Диффузия (denoising): шаг за шагом сеть убирает шум, каждый раз сверяясь с текстом.
  4. На каждом шаге модель:«вспоминает», как в датасете выглядели машины при словах «off-road», «4x4» и т.п.;

    дорисовывает:форму кузова, колёса;
    подвеску, свет, окружение (грязь, камни, холмы).

Так шаг за шагом из шума получается картинка, статистически «похожая» на те, что модель видела в обучении.

-4

3. Почему образы бывают странными или нереалистичными

ИИ не конструирует технику по законам физики и механики, а комбинирует визуальные элементы. Поэтому:

  • подвеска может быть нереальной (никак не отработает удар);
  • колёса могут быть слишком большими/тонкими;
  • углы съезда/въезда не подходят для реального бездорожья;
  • деталей слишком много (слишком много фар, труб, выхлопов) — визуальный «перебор»;
  • встречаются конструкции, которые нельзя собрать или обслуживать.

-5

4. Как сделать промпт так, чтобы внедорожник выглядел «правдиво»

Если хотите получать более реалистичные автомобили для бездорожья, в запросе (промпте) лучше указывать:

  1. Тип машины«раллийный рейдовый автомобиль категории Dakar»
    «подготовленный внедорожник для трофи-рейдов»
    «overland expedition SUV»
  2. Конструкциювысокий клиренс, независимая/мостовая подвеска;
    большие грязевые шины с высоким профилем;
    усиленные стальные бамперы, силовые пороги;
    лебёдка спереди, защита днища, шноркель.
  3. Среду и задачуглубокая грязь, лесное бездорожье;
    каменистый серпантин в горах;
    дюны пустыни, песок.
  4. Стиль и реализм«фотореалистичный стиль», «cinematic lighting»;
    «вид сбоку», «три четверти спереди», «детальный крупный план».

Пример на русском (для моделей, что понимают русский):

«Фотореалистичный подготовленный внедорожник для тяжёлого бездорожья, большой клиренс, массивные грязевые шины, стальной силовой бампер, лебёдка, защита днища, шноркель, экспедиционный багажник, автомобиль едет по глубокой грязи в лесу, реалистичная физика и пропорции, детализированный рендер, профессиональное фото»

-6

5. Почему ИИ «понимает» слово «бездорожье»

Потому что в обучающих данных:

  • рядом с подписью типа «off-road» почти всегда грязь, колёса, брызги, кусты, камни;
  • рядом со словами «SUV», «4x4», «jeep», «rally raid» — определённые формы кузова и колёс.

Слова → ассоциативные пакеты визуальных признаков.
Когда вы говорите «бездорожье», он активирует не абстрактную идею, а набор характерных паттернов:

  • коричневые/серые текстуры (грязь, пыль);
  • следы протектора, колея;
  • наклон автомобиля, брызги;
  • фон: лес, горы, степь и т.п.

Если хотите, можете описать, как выглядели те сгенерированные машины (или отправить картинки), а я разберу по деталям: что в них «придумал» ИИ, что реалистично, а что чисто визуальная фантазия без практического смысла.

-7
  • Не забудьте ставить лайки и подписываться на канал, чтобы не пропустить новые интересные видео и статьи! Ваши поддержка и интерес очень важны для нас!

-8

Спасибо вам за то что прочитали статью до конца!