Современные крупные языковые модели способны выполнять разнообразные задачи с различными типами данных, включая обработку текстов на разных языках, генерацию компьютерного кода, решение математических задач и анализ изображений и аудио. Исследователи из Массачусетского технологического института изучили внутренние механизмы работы этих моделей. Ученые обнаружили, что языковые модели имеют сходство с человеческим мозгом. Как известно, в передней височной доле мозга находится «семантический центр», который интегрирует информацию из разных источников — визуальных, тактильных и других. Исследователи выяснили, что языковые модели используют похожий механизм, обрабатывая данные разных типов централизованным способом через доминирующий язык модели. В ходе экспериментов было установлено, что начальные слои модели обрабатывают данные в их специфическом формате, подобно специализированным отделам мозга. Затем модель преобразует токены в универсальные представления для дальнейшей обработки. При э
Ученые MIT обнаружили сходство между языковыми моделями и мозгом человека
19 февраля 202519 фев 2025
1 мин