2 месяца назад
Трансформер — что это такое, как он обрабатывает данные и почему стал основой современных ИИ
Трансформер — это архитектура нейронных сетей, в которой обработка информации осуществляется через механизм внимания, а не последовательного прохождения. В статье разъясняется, как трансформер устроен, почему он заменил рекуррентные модели, каким образом внимание между токенами формирует контекст, и как эта структура стала основой современных языковых и мультимодальных моделей. Текст охватывает принципы токенизации, механизм self-attention, устройство энкодера и декодера, а также философские и этические аспекты, связанные с архитектурой без субъекта...
156 читали · 3 года назад
Мультфильмы о трансформерах, часть 8. Два года спустя
Прошлый обзор ТФ-мультфильмов был написан в 2020 году, но всё это время Хасбро и ТакараТоми не стояли на месте и выпустили новые анимационные короткометражки и мультсериалы, а это значит, что пришло время дополнить ранее написанное. Данная статья является продолжением темы, с которой начинался канал, поэтому для более полного понимания рекомендуется ознакомиться с предыдущими частями (1 2 3 4 5 6 7 Б1 Б3-1). Хорошо забытое старое Впрочем, не все дополнения будут действительно новыми. В шестой части...