В больших моделях искусственного интеллекта, таких как ChatGPT, память и рассуждения архитектурно разделены, обнаружили ученые. Этим открытием, которое поможет сделать ИИ безопаснее и надежнее, они поделились в препринте на arXiv. Модели ИИ, обученные на огромных массивах данных, опираются как минимум на две ключевые функции. Первая — память, позволяющая системе извлекать и воспроизводить информацию. Вторая — логическое мышление (рассуждения), то есть решение новых задач путем применения обобщенных принципов и усвоенных паттернов. Однако до сих пор не было известно, как организованы эти важнейшие навыки. Чтобы это выяснить, специалисты по машинному обучению из стартапа Goodfire.ai изучили внутреннюю структуру больших языковых и визуальных моделей. Как устроен «мозг» ИИ Сначала они применили математический метод K-FAC (приблизительная кривизна с учетом фактора Кронекера), чтобы идентифицировать компоненты, ответственные за разные способности. Оказалось, что простое запоминание данных св
Исследование «мозга» ИИ показало, что память и рассуждения в нем разделены
12 ноября 202512 ноя 2025
33
2 мин