Добавить в корзинуПозвонить
Найти в Дзене
Social Mebia Systems

Почему LLM любят числа 27, 42 и 73? Загадка "случайности" в больших языковых моделях

Введение: AI и странные любимые числа В последние месяцы пользователи заметили любопытный феномен: если попросить современные большие языковые модели (LLM) — такие как GPT-4o, Claude, Gemini, DeepSeek и другие — "угадать" случайное число в диапазоне от 1 до 100, они с удивительной частотой выбирают 42, а при повторном запросе — 73 или 27. Это наблюдение стало мемом в AI-сообществе и вызвало волну обсуждений: почему "искусственный интеллект" так неравнодушен к этим числам? Как это проявляется Этот паттерн воспроизводится на разных моделях и языках, хотя при смене языка (например, на китайский) второй выбор может отличаться. Почему так происходит? Возможные причины Научные подтверждения Недавние исследования (например, статья ICML 2025, arXiv:2505.18545) показали: GPT-4o и другие модели действительно склонны выбирать 7 в диапазоне 0–9, а при многоразовых попытках могут корректировать свой выбор, чтобы избежать повторяемости. Вывод: "Случайность" LLM — это отражение человеческой культуры

Введение: AI и странные любимые числа

В последние месяцы пользователи заметили любопытный феномен: если попросить современные большие языковые модели (LLM) — такие как GPT-4o, Claude, Gemini, DeepSeek и другие — "угадать" случайное число в диапазоне от 1 до 100, они с удивительной частотой выбирают 42, а при повторном запросе — 73 или 27. Это наблюдение стало мемом в AI-сообществе и вызвало волну обсуждений: почему "искусственный интеллект" так неравнодушен к этим числам?

Как это проявляется

  • 42 — культовый ответ на "главный вопрос жизни, Вселенной и всего такого" из "Автостопом по галактике". Многие LLM выбирают именно его при первом запросе.
  • 73 — любимое число Шелдона Купера из "Теории большого взрыва", также простое число, а его обратное (37) — тоже простое.
  • 27 — часто появляется, если диапазон меньше (например, 1–50), или при повторных попытках.
  • 7 — если диапазон 1–10, LLM почти всегда выбирает 7 — это и человеческая психологическая "любимка".

Этот паттерн воспроизводится на разных моделях и языках, хотя при смене языка (например, на китайский) второй выбор может отличаться.

Почему так происходит? Возможные причины

  1. Влияние обучающих данных
    Большие языковые модели учатся на огромных массивах текстов, где часто встречаются культурные мемы, популярные числа и психологические паттерны. Например, 42 — мем из поп-культуры, 7 — "счастливое число" во многих культурах, 73 — мем из "Теории большого взрыва".
  2. Человеческие предубеждения
    Исследования показывают: если попросить человека "угадать" случайное число, он чаще выбирает 7, 17, 27, 37, 42, 73 и т.д. LLM, обучаясь на человеческих текстах, наследуют эти паттерны.
  3. Психология "случайности"
    Люди (и, как следствие, LLM) считают некоторые числа "более случайными" или "интересными". Например, 42 кажется "особенным" из-за культурных ассоциаций, а 73 — из-за математических свойств и мемов.
  4. Особенности промптов и архитектуры
    Если LLM не имеют встроенного генератора истинной случайности, они опираются на вероятностные паттерны из обучающих данных. Поэтому "случайный" выбор на самом деле отражает статистику встречаемости чисел в текстах.
  5. Самоанализ моделей
    Когда LLM просят объяснить свой выбор, они часто ссылаются на культурные и статистические причины: "42 — популярный мем", "7 — часто выбирают люди", "73 — простое и мемное".

Научные подтверждения

Недавние исследования (например, статья ICML 2025, arXiv:2505.18545) показали: GPT-4o и другие модели действительно склонны выбирать 7 в диапазоне 0–9, а при многоразовых попытках могут корректировать свой выбор, чтобы избежать повторяемости.

Вывод: "Случайность" LLM — это отражение человеческой культуры

Большие языковые модели не генерируют истинную случайность, а воспроизводят вероятностные паттерны, заложенные в их обучающих данных. Поэтому их "любимые числа" — это не баг, а зеркало человеческих привычек, мемов и культурных ассоциаций.

Если вы хотите получить по-настоящему случайное число — используйте генератор случайных чисел, а не LLM!