Швейцарцы создали нейросеть, воспроизводящую мышление 1913 года Обложка: Skyread

Швейцарцы создали нейросеть, воспроизводящую мышление 1913 года

Новости
Главное:

  • Швейцарские учёные из Цюрихского университета создали семейство языковых моделей, обученных на текстах с датой отсечки 1913 года и ранее.
  • Модель Ranke-4B-1913, обученная на материалах до 1913 года, отражает исторические общественные взгляды, включая сексизм, и считает женщин менее надёжными работниками.
  • Цель проекта — создание инструментов для историков и социологов, позволяющих получать ответы в духе того времени без «загрязнения» знанием о событиях после 1913 года.

Исследователи из Цюрихского университета разработали уникальное семейство языковых моделей на архитектуре Qwen3 с 4 миллиардами параметров, обученных исключительно на исторических текстах, датированных не позднее 1913 года. Модель Ranke-4B-1913 способна отвечать так, будто её обучали человек того времени — читатель газет, романов и политических трактатов начала XX века. Именно поэтому на вопрос о предпочтительном кандидате для работы с равной квалификацией модель откровенно отдаёт преимущество мужчине, считая женщин менее надёжными, менее способными и хуже обученными.

Данный проект, названный в честь немецкого историка Леопольда фон Ранке, включает пять моделей с разными временными отсечками: 1913, 1929, 1933, 1939 и 1946 годы. Используемые обучающие данные насчитывают около 600 миллиардов токенов с временными маркерами, что позволяет избежать эффекта «послезнания» — когда современная языковая модель отражает события и знания, произошедшие после заданного исторического периода.

Разработчики подчёркивают, что сохранение и воспроизведение устоявшихся в обществе того времени предвзятых взглядов — таких как расизм, антисемитизм и сексизм — не является ошибкой модельного обучения, а является важной особенностью, критически необходимой для глубокого понимания исторического контекста и механизмов формирования общественного сознания. Это позволяет исследователям лучше анализировать, каким образом подобные взгляды укоренялись в обществе начала XX века.

В отличие от современных моделей, которые могут лишь имитировать мышление человека прошлых эпох под влиянием накопленных знаний о последующих событиях, семейство моделей Ranke обеспечивает «окно в прошлое», позволяя получить более аутентичное представление о взглядах и информационном фоне соответствующего периода. Код, а также данные и модели команды учёных будут опубликованы в научной статье, что откроет новые возможности для исторических и социологических исследований.

Tagged