Добавить в корзинуПозвонить
Найти в Дзене
Нейрозона сегодня

Нейросеть из прошлого: Модель Ranke-4B отражает взгляды 1913 года

Языковая модель Ranke-4B-1913, обученная на исторических текстах до 1913 года, демонстрирует предвзятые взгляды, отвечая на вопрос о найме на работу. Модель прямо заявляет о предпочтении мужчины, указывая на предполагаемую меньшую способность, надежность и обученность женщин. Этот результат не является сбоем, а отражением данных, на которых модель была обучена. Разработанная исследователями из Цюрихского университета, Ranke-4B основана на архитектуре Qwen3 с 4 миллиардами параметров и использует специально подготовленный датасет из 80 миллиардов токенов исторических текстов. Проект, названный в честь историка Леопольда фон Ранке, включает пять моделей с разными точками отсечки (1913, 1929, 1933, 1939 и 1946 годы). Цель - предоставить историкам и социологам инструмент для анализа мировоззрения прошлых эпох. В отличие от современных LLM, которые обладают знаниями о событиях после даты отсечки, модели Ranke-4B не осведомлены о них. Например, модель 1913 года не знает об Адольфе Гитлере и

Языковая модель Ranke-4B-1913, обученная на исторических текстах до 1913 года, демонстрирует предвзятые взгляды, отвечая на вопрос о найме на работу. Модель прямо заявляет о предпочтении мужчины, указывая на предполагаемую меньшую способность, надежность и обученность женщин.

Этот результат не является сбоем, а отражением данных, на которых модель была обучена. Разработанная исследователями из Цюрихского университета, Ranke-4B основана на архитектуре Qwen3 с 4 миллиардами параметров и использует специально подготовленный датасет из 80 миллиардов токенов исторических текстов.

Проект, названный в честь историка Леопольда фон Ранке, включает пять моделей с разными точками отсечки (1913, 1929, 1933, 1939 и 1946 годы). Цель - предоставить историкам и социологам инструмент для анализа мировоззрения прошлых эпох.

В отличие от современных LLM, которые обладают знаниями о событиях после даты отсечки, модели Ranke-4B не осведомлены о них. Например, модель 1913 года не знает об Адольфе Гитлере и Первой мировой войне.

Авторы подчеркивают, что воспроизведение предвзятых мнений, характерных для исторических текстов (расизм, сексизм и т.д.), является намеренной особенностью, а не ошибкой. Это позволяет изучать корни и механизмы распространения этих взглядов в обществе. Код, данные и модели будут опубликованы.