187 читали · 2 года назад
GRU в Машинном обучении простыми словами
Управляемый рекуррентный блок (GRU – Gated Recurrent Units, УРБ) – механизм Нейронных сетей (Neural Network), объединяющий кратковременную и долговременную виды памяти в одно состояние. Механизм создан в 2014 году, и это разновидность Рекуррентной нейронной сети (RNN), набирающая большую популярность. Давайте посмотрим, как она работает. Вы все знаете, что базовая RNN страдает от проблемы с кратковременной памятью. Например, мы пытаемся сделать автозаполнение последнего слова для утверждения: «Дхавал...
1874 читали · 1 год назад
✔ Что такое Gated Recurrent Unit (GRU)? Где используется ? Закрытый рекуррентный блок (GRU) является частью конкретной модели рекуррентной нейронной сети, которая намеревается использовать соединения через последовательность узлов для выполнения задач машинного обучения, связанных с памятью и кластеризацией, например, в распознавании речи. Рекуррентные блоки помогают регулировать входные веса нейронной сети для решения проблемы исчезающего градиента, которая является общей проблемой с рекуррентными нейронными сетями. Еще закрытые рекуррентные блоки используются в машинном переводе. Они отличаются от LSTM, хотя тоже являются расширением для нейросетевого машинного обучения. В GRU на один гейт меньше, и работа строится по-другому: вместо входного, выходного и забывания, есть гейт обновления (update gate). Он определяет, сколько информации необходимо сохранить c последнего состояния и сколько информации пропускать с предыдущих слоев. Функции сброса гейта (reset gate) похожи на затвор забывания у LSTM, но расположение отличается. GRU всегда передают свое полное состояние, не имеют выходной затвор. Часто эти затвор функционирует как и LSTM, однако, большим отличием заключается в следующем: в GRU затвор работают быстрее и легче в управлении (но также менее интерпретируемые). На практике они стремятся нейтрализовать друг друга, так как нужна большая нейросеть для восстановления выразительности (expressiveness), которая сводит на нет приросты в результате. Но в случаях, где не требуется экстра выразительности, GRU показывают лучше результат, чем LSTM. В дополнение к машинному преводу, модели нейронной сети, использующие рекуррентные единицы, могут использоваться для исследования генома человека, анализа почерка и многого другого. Некоторые из этих инновационных сетей используются для анализа фондового рынка и работы правительства. Многие из них используют моделируемую способность машин запоминать информацию. @machinelearning