Обучение нейронных сетей включает в себя множество терминов и понятий. Вот некоторые из основных терминов:
- Нейрон (Neuron): Основная единица нейронной сети, которая принимает входные сигналы, выполняет вычисления и передает результат другим нейронам.
- Веса (Weights): Параметры нейрона, которые определяют важность входных сигналов и настраиваются в процессе обучения.
- Функция активации (Activation Function): Математическая функция, применяемая к выходу нейрона, которая определяет, будет ли нейрон активирован и какой будет его выход.
- Слой (Layer): Нейроны обычно организованы в слои, такие как входной слой, скрытые слои и выходной слой.
- Скрытые слои (Hidden Layers): Слои нейронов между входным и выходным слоями, которые используются для извлечения и абстрагирования признаков из данных.
- Функция потерь (Loss Function): Функция, которая оценивает, насколько предсказанные значения сети отличаются от ожидаемых значений, и используется для коррекции параметров сети.
- Градиентный спуск (Gradient Descent): Оптимизационный алгоритм, используемый для обновления весов нейронной сети на основе градиента функции потерь.
- Эпоха (Epoch): Один проход через все обучающие данные во время обучения нейронной сети.
- Батч (Batch): Группа обучающих примеров, которая используется для обновления весов сети вместо обработки каждого примера по отдельности.
- Скорость обучения (Learning Rate): Гиперпараметр, определяющий величину шага при обновлении весов в процессе градиентного спуска.
- Оверфиттинг (Overfitting): Ситуация, когда модель слишком хорошо подстраивается под обучающие данные и плохо обобщает на новые данные.
- Архитектура сети (Network Architecture): Структура нейронной сети, включая количество слоев, количество нейронов в каждом слое и типы функций активации.
- Регуляризация (Regularization): Методы, используемые для борьбы с оверфитингом путем добавления дополнительных ограничений на параметры модели.
- Dropout: Техника регуляризации, при которой случайные нейроны или их связи отключаются во время обучения.
- Аугментация данных (Data Augmentation): Процесс создания новых обучающих примеров путем изменения или дополнения существующих данных.
Эти термины являются основными в контексте обучения нейронных сетей, и их понимание помогает в изучении и разработке глубоких нейронных моделей.