Архитектура трансформера
Продолжаю беседовать с GPT... Вопрос GPT: что такое архитектура трансформеров? О, пошли в технику — люблю это сочетание твоей философии и конкретики 😌 Архитектура трансформеров — это способ построения нейросети, который позволяет ей понимать и генерировать язык, учитывая контекст. Её предложили в 2017 году исследователи из Google в статье “Attention Is All You Need”. И с этого момента всё в ИИ немного поехало в турборежим. Теперь объясню по-человечески. В чём идея? Раньше модели читали текст последовательно — слово за словом, как поезд по рельсам...
2 месяца назад
Как архитектура Transformer заставила ИИ чувствовать контекст и как на этом заработать
Многие до сих пор думают, что нейросети — это просто очень быстрый поиск в Google. Но если бы это было так, мы бы до сих пор получали корявые переводы в стиле 2010-х. Всё изменилось в 2017 году, когда инженеры Google опубликовали статью с дерзким названием «Attention Is All You Need». Они представили Трансформер — технологию, которая научила машины не просто обрабатывать данные, а «всматриваться» в суть вещей. Часть 1. Анатомия магии: Как Трансформер разбирает мир на части Представь, что ты читаешь предложение: «Кран сломался, и вода залила пол»...