2 года назад
Архитектура глубоких нейронных сетей Transformer
Transformer – это одна из самых инновационных архитектур глубоких нейронных сетей, которая была представлена в 2017 году и с тех пор стала основой для многих современных моделей в области обработки естественного языка (Natural Language Processing, NLP). Transformer был представлен в статье "Attention Is All You Need" командой исследователей от Google Brain. Главным достоинством Transformer является его способность эффективно моделировать долгосрочные зависимости в текстовых данных, благодаря механизму внимания (attention mechanism)...
9 месяцев назад
Обзор архитектур нейронных сетей: от простого перцептрона до трансформеров
Ознакомиться с лекцией можно тут Нейронные сети прошли долгий путь от простейших архитектур до сложных моделей, таких как трансформеры, которые сегодня применяются в обработке естественного языка и других задачах. Понимание основных архитектур и их применения в реальных задачах помогает лучше ориентироваться в мире машинного обучения. Перцептрон — это базовая модель нейронной сети, предложенная в 1950-х годах Фрэнком Розенблаттом. Эта архитектура имитировала работу биологического нейрона и решала задачи бинарной классификации...