241 подписчик

Как создать нейронную сеть для распознавания автомобилей на Python: Пошаговое руководство

3 апреля 20253 апр 2025

5 мин

Распознавание объектов, в том числе автомобилей, является одной из популярных задач компьютерного зрения, для которой можно использовать нейронные сети. В этой статье мы создадим простую нейронную сеть для распознавания изображений автомобилей с использованием Python и TensorFlow/Keras. Для работы с нейронными сетями и изображениями нам понадобятся библиотеки TensorFlow, Keras и NumPy. Если у вас они ещё не установлены, установите их с помощью pip: pip install tensorflow numpy matplotlib Для задачи распознавания автомобилей можно использовать набор данных, содержащий изображения автомобилей и других объектов. Одним из таких наборов является Stanford Cars Dataset, который включает изображения различных моделей автомобилей. Если у вас нет набора данных, вы можете использовать другой набор с изображениями автомобилей, например, CIFAR-10, где один из классов — это автомобили. import tensorflow as tf

from tensorflow.keras.datasets import cifar10

# Загрузка данных CIFAR-10

(x_train,

from tensorflow.keras.datasets import cifar10

# Загрузка данных CIFAR-10

(x_train,

Оглавление

Шаг 1: Установка необходимых библиотек
Шаг 2: Подготовка данных
Загрузка данных (например, CIFAR-10)

Шаг 1: Установка необходимых библиотек

Для работы с нейронными сетями и изображениями нам понадобятся библиотеки TensorFlow, Keras и NumPy. Если у вас они ещё не установлены, установите их с помощью pip:

pip install tensorflow numpy matplotlib

Шаг 2: Подготовка данных

Для задачи распознавания автомобилей можно использовать набор данных, содержащий изображения автомобилей и других объектов. Одним из таких наборов является Stanford Cars Dataset, который включает изображения различных моделей автомобилей.

Stanford Cars Dataset: https://ai.stanford.edu/~jkrause/cars/car_dataset.html

Если у вас нет набора данных, вы можете использовать другой набор с изображениями автомобилей, например, CIFAR-10, где один из классов — это автомобили.

Загрузка данных (например, CIFAR-10)

import tensorflow as tf
from tensorflow.keras.datasets import cifar10

# Загрузка данных CIFAR-10
(x_train, y_train), (x_test, y_test) = cifar10.load_data()

# Классы CIFAR-10
class_names = ['airplane', 'automobile', 'bird', 'cat', 'deer', 'dog', 'frog', 'horse', 'ship', 'truck']

# Выбор только класса автомобилей (class 1)
x_train = x_train[y_train.flatten() == 1]
y_train = y_train[y_train.flatten() == 1]
x_test = x_test[y_test.flatten() == 1]
y_test = y_test[y_test.flatten() == 1]

# Нормализация данных (пиксели в диапазоне от 0 до 1)
x_train, x_test = x_train / 255.0, x_test / 255.0

В этом примере мы используем набор данных CIFAR-10, который состоит из 10 классов, включая автомобили. Мы выбираем только те изображения, которые принадлежат классу автомобилей (индекс 1).

Шаг 3: Построение модели нейронной сети

Теперь построим простую нейронную сеть с использованием Keras. Для задачи распознавания изображений используем сверточную нейронную сеть (CNN).

from tensorflow.keras import layers, models

# Создание модели
model = models.Sequential([
# Сверточный слой с 32 фильтрами, размером 3x3 и активацией ReLU
layers.Conv2D(32, (3, 3), activation='relu', input_shape=(32, 32, 3)),

# Слой подвыборки (MaxPooling)
layers.MaxPooling2D((2, 2)),

# Сверточный слой с 64 фильтрами
layers.Conv2D(64, (3, 3), activation='relu'),

# Слой подвыборки
layers.MaxPooling2D((2, 2)),

# Сверточный слой с 64 фильтрами
layers.Conv2D(64, (3, 3), activation='relu'),

# Преобразуем многомерный вывод в одномерный вектор
layers.Flatten(),

# Полносвязный слой
layers.Dense(64, activation='relu'),

# Выходной слой с 10 нейронами (по количеству классов)
layers.Dense(1, activation='sigmoid') # Только два класса: автомобиль или не автомобиль
])

# Компиляция модели
model.compile(optimizer='adam',
loss='binary_crossentropy',
metrics=['accuracy'])

Объяснение структуры модели:

Conv2D: Сверточный слой для извлечения признаков из изображений.
MaxPooling2D: Слой подвыборки для уменьшения размерности.
Flatten: Преобразует двумерные данные в одномерный вектор.
Dense: Полносвязный слой, который принимает результаты из предыдущих слоев и обрабатывает их.
Sigmoid: Выходной слой с функцией активации sigmoid, так как задача бинарная (автомобиль/не автомобиль).

Шаг 4: Обучение модели

Теперь мы обучим модель на наших данных:

# Обучение модели
model.fit(x_train, y_train, epochs=10, batch_size=64, validation_data=(x_test, y_test))

epochs=10: Модель будет обучаться 10 эпох.
batch_size=64: Размер мини-пакета для обучения.

Шаг 5: Оценка модели

После обучения модели нужно оценить её точность на тестовых данных.

# Оценка точности модели
test_loss, test_acc = model.evaluate(x_test, y_test, verbose=2)
print(f'Точность на тестовых данных: {test_acc}')

Шаг 6: Прогнозирование

После того как модель обучена, мы можем использовать её для прогнозирования.

# Прогнозирование для первого изображения в тестовом наборе
import numpy as np
import matplotlib.pyplot as plt

# Прогнозирование
predictions = model.predict(x_test)

# Печать прогноза для первого изображения
plt.imshow(x_test[0])
plt.show()

# Вывод прогнозируемого класса
print(f'Прогноз: {"Автомобиль" if predictions[0] > 0.5 else "Не автомобиль"}')

В этом примере мы выводим первое изображение из тестового набора и печатаем прогноз модели (автомобиль или не автомобиль).

Полный код:

import tensorflow as tf
from tensorflow.keras.datasets import cifar10
from tensorflow.keras import layers, models
import matplotlib.pyplot as plt

# Загрузка данных
(x_train, y_train), (x_test, y_test) = cifar10.load_data()

# Классы CIFAR-10
class_names = ['airplane', 'automobile', 'bird', 'cat', 'deer', 'dog', 'frog', 'horse', 'ship', 'truck']

# Выбор только класса автомобилей (class 1)
x_train = x_train[y_train.flatten() == 1]
y_train = y_train[y_train.flatten() == 1]
x_test = x_test[y_test.flatten() == 1]
y_test = y_test[y_test.flatten() == 1]

# Нормализация данных
x_train, x_test = x_train / 255.0, x_test / 255.0

# Построение модели
model = models.Sequential([
layers.Conv2D(32, (3, 3), activation='relu', input_shape=(32, 32, 3)),
layers.MaxPooling2D((2, 2)),
layers.Conv2D(64, (3, 3), activation='relu'),
layers.MaxPooling2D((2, 2)),
layers.Conv2D(64, (3, 3), activation='relu'),
layers.Flatten(),
layers.Dense(64, activation='relu'),
layers.Dense(1, activation='sigmoid') # Бинарная классификация
])

# Компиляция модели
model.compile(optimizer='adam',
loss='binary_crossentropy',
metrics=['accuracy'])

# Обучение модели
model.fit(x_train, y_train, epochs=10, batch_size=64, validation_data=(x_test, y_test))

# Оценка точности
test_loss, test_acc = model.evaluate(x_test, y_test, verbose=2)
print(f'Точность модели: {test_acc}')

# Прогнозирование
predictions = model.predict(x_test)
plt.imshow(x_test[0])
plt.show()
print(f'Прогноз: {"Автомобиль" if predictions[0] > 0.5 else "Не автомобиль"}')

Заключение

Мы создали простую нейронную сеть для распознавания автомобилей с использованием набора данных CIFAR-10. В этом примере мы построили модель, обучили её, и протестировали на тестовых данных. Вы можете экспериментировать с более сложными архитектурами, такими как глубокие сверточные нейронные сети, или использовать другие наборы данных, чтобы улучшить точность модели для более сложных задач распознавания объектов.