113 подписчиков

Запустил ИИ для генерации картинок у себя бесконечное количество и с любым разрешением!

11 марта 202511 мар 2025

4 мин

Много раз сталкивался с ситуацией, Надо найти картинку или сгенерировать для той или иной ситуации. Пару раз мне помогали бесплатные источники, но в один прекрасный день мне стало этого мало! И что можно придумать? Все просто, если у тебя, как и у меня случайно завалялась RTX 3080ti. Или другая с CUDA. Stable Diffusion использует CUDA и Tensor Cores.

Минимальное требование — 4 ГБ видеопамяти, но желательно 8+ ГБ. GTX 10xx (2016-2017) 1070, 1080, 1080 Ti8-11 ГБ RTX 20xx (2018-2019) 2060, 2070, 2080, 2080 Ti6-11 ГБ RTX 30xx (2020-2021) 3050, 3060, 3070, 3080, 30908-24 ГБ RTX 40xx (2022-2024) 4060, 4070, 4080, 40908-24 ГБ ✅ Лучшая бюджетная: RTX 3060 12GB (если покупать)

✅ Оптимальная: RTX 4070 Ti / RTX 4080

✅ Лучшая для профи: RTX 4090 (24 ГБ) Я буду использовать ИИ Stable Diffusion. Если у вас ещё не установлен PyCharm, скачайте и установите. PyCharm — кроссплатформенная интегрированная среда разработки для языка программирования Python. Можно использовать любую другую,

✅ Оптимальная: RTX 4070 Ti / RTX 4080

Оглавление

NVIDIA
1. Установка PyCharm ( или аналог)
2. Создание проекта

И что можно придумать?

Все просто, если у тебя, как и у меня случайно завалялась RTX 3080ti. Или другая с CUDA.

NVIDIA

Stable Diffusion использует CUDA и Tensor Cores.
Минимальное требование — 4 ГБ видеопамяти, но желательно 8+ ГБ.

GTX 10xx (2016-2017) 1070, 1080, 1080 Ti8-11 ГБ

RTX 20xx (2018-2019) 2060, 2070, 2080, 2080 Ti6-11 ГБ

RTX 30xx (2020-2021) 3050, 3060, 3070, 3080, 30908-24 ГБ

RTX 40xx (2022-2024) 4060, 4070, 4080, 40908-24 ГБ

✅ Лучшая бюджетная: RTX 3060 12GB (если покупать)
✅ Оптимальная: RTX 4070 Ti / RTX 4080
✅ Лучшая для профи: RTX 4090 (24 ГБ)

Я буду использовать ИИ Stable Diffusion.

1. Установка PyCharm ( или аналог)

Если у вас ещё не установлен PyCharm, скачайте и установите.

PyCharm — кроссплатформенная интегрированная среда разработки для языка программирования Python.

Можно использовать любую другую, которая вам удобно.

2. Создание проекта

Открываем PyCharm
Создаём новый проект

Нажмите "File" → "New Project"
Выберите Python Interpreter → New Virtual Environment
Укажите путь к проекту (например, C:\Projects\diffusion)
Нажмите "Create"

3. Установка зависимостей

Откройте терминал PyCharm (View → Tool Windows → Terminal) и введите:

1) pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118
2) pip install diffusers deep-translator 3)pip install transformers accelerate safetensors pillow

(буду добавлять если что то упустил)

🔹 Важно!

cu118 означает, что PyTorch будет использовать CUDA 11.8 для ускорения на видеокарте (если у вас NVIDIA).
Если у вас нет CUDA (или нет видеокарты NVIDIA), используйте:
pip install torch torchvision torchaudio

4. Сохранение кода

В PyCharm создайте новый файл: main.py
Вставьте в него код:

import torch
from diffusers import DiffusionPipeline
from deep_translator import GoogleTranslator

def translate_to_english(text):
return GoogleTranslator(source='auto', target='en').translate(text)

def get_resolution():
resolutions = {"1": (1280, 720), "2": (1920, 1080)}
print("Выберите разрешение:")
print("1: 720p (1280x720)")
print("2: 1080p (1920x1080)")
choice = input("Введите номер (1 или 2): ")
return resolutions.get(choice, (1280, 720)) # По умолчанию 720p

def main():
pipe = DiffusionPipeline.from_pretrained(
"stabilityai/stable-diffusion-xl-base-1.0",
torch_dtype=torch.float16,
variant="fp16" )
device = "cuda" if torch.cuda.is_available() else "cpu" pipe.to(device)

while True:
prompt_ru = input("Введите описание картинки на русском (или 'exit' для выхода): ")
if prompt_ru.lower() == "exit":
break
prompt_en = translate_to_english(prompt_ru)
width, height = get_resolution()

try:
num_images = int(input("Сколько картинок сгенерировать? (1-5): "))
if num_images < 1 or num_images > 5:
raise ValueError
except ValueError:
print("Некорректный ввод. Будет сгенерирована 1 картинка.")
num_images = 1
print(f"Генерирую {num_images} изображение(й) {width}x{height}...\n")

with torch.no_grad():
images = pipe(prompt=prompt_en, num_inference_steps=25, width=width, height=height).images[:num_images]

for i, img in enumerate(images):
filename = f"generated_image_{i + 1}.png" img.save(filename)
print(f"Изображение сохранено как {filename}")

print("Программа завершена.")

if __name__ == "__main__":
main()

Файлик с программой будет в моем ТГ и ВК

5. Запуск кода

В PyCharm откройте main.py
Нажмите зеленую кнопку запуска (Shift + F10)

6. Проверка работы

Если всё настроено правильно, программа спросит у вас описание изображения.
Введите текст на русском (например: "кот в космосе").
Программа переведёт текст на английский и сгенерирует изображение.
Результат сохранится в файле generated_image_1.png в папке проекта.

Дополнительно

Обновление PyTorch и Diffusers

Если нужно обновить библиотеки, выполните:

pip install --upgrade torch torchvision torchaudio diffusers

Проблемы с CUDA?

Проверьте, работает ли видеокарта с PyTorch запускаем программу:

import torch
print(torch.cuda.is_available())
print(torch.cuda.get_device_name(0))

Если False → попробуйте переустановить драйвер NVIDIA и CUDA Toolkit (лучше 11.8).

Готово!

Теперь вы можете генерировать изображения в PyCharm!

Что то могло у меня уже быть установленным, по этому могут программа и ии может сразу не запустится. Пишите о своих ошибках, я напишу что надо до установит и добавлю это в статью.

Также, если интересно, пиши в комментариях, можно сделать так, чтобы в домашней сети все могли зайти на сайт, и в нем сгенерировать картинку О_О