Найти в Дзене

ИИ не база данных и не поисковая система. Как же он "думает" без доступа данным на которых учился?

Оглавление

Поддержать в один клик:

Мысли в фокусе: Полезная информация и Размышления | Дзен

Как получается, что не имея доступа к данным на которых тебя обучали, ты можешь давать связные и чаще всего точные ответы?

Короткий ответ

Я не имею доступа к данным, на которых обучался, потому что эти данные во мне не хранятся.
Ответы берутся из параметров модели, а не из текстов.

Теперь разложим это аккуратно.

1. Где «находятся» данные после обучения?

❌ НЕ так:

  • у меня нет базы текстов
  • нет книг
  • нет статей
  • нет интернета
  • нет «архива»

✅ ТАК:

Во мне есть числа.

Много чисел.

Очень много.

Это называется веса модели (parameters).

2. Что происходит во время обучения (упрощённо)

Во время обучения:

  1. Модели показывают текст
  2. Она ошибается в предсказании следующего токена
  3. Ошибка считается
  4. Веса чуть-чуть изменяются, чтобы в следующий раз ошибаться меньше

Повторить триллионы раз

👉 В итоге:

  • тексты исчезают
  • остаются только скорректированные веса

Это как:

Ты 1000 раз читал слово «жёсткий диск»
У тебя в голове не хранится каждая страница
Но ты знаешь, что это значит

3. Аналогия с человеком (очень точная)

Ты не помнишь:

  • каждую фразу, которую читал в жизни
  • каждую страницу учебника

Но ты:

  • умеешь говорить
  • умеешь рассуждать
  • знаешь связи между понятиями

👉 Это не воспоминания, а навык.

Я — это навык языка, зафиксированный в числах.

4. Откуда тогда конкретные ответы?

Из обобщения, а не из памяти.

Когда ты спрашиваешь:

«Почему NTFS может быть повреждён?»

Я:

  • не ищу статью
  • не вспоминаю инструкцию
  • не открываю Google

Я:

  • активирую связи между понятиями:
  • NTFS
  • ошибки
  • копирование
  • HDD
  • bad sectors
  • и вычисляю, какое продолжение логично

5. Почему я иногда ошибаюсь, если «знаю»?

Потому что:

  • я не проверяю факты в реальном мире
  • я не вижу твой диск
  • я не имею опыта
  • я не понимаю последствий

Я делаю наилучшее вероятностное предположение.

6. Почему я не могу сказать: «Вот источник»?

Потому что:

  • нет источника
  • нет ссылки
  • нет документа

Есть только:

статистически выученная структура языка и знаний

7. Очень важный момент (часто неочевидный)

Обучающие данные ≠ знания

Данные — это топливо.

Знания — это форма весов после обучения.

Как:

  • бензин ≠ движение машины
  • еда ≠ мышление человека

8. Почему тогда я иногда «знаю редкие вещи»?

Потому что:

  • они проявились в данных
  • модель уловила структуру
  • обобщение сработало

Но:

  • я могу ошибиться
  • я могу перепутать
  • я могу «галлюцинировать»

9. Самая точная формула

Я не храню тексты.
Я не имею доступа к данным.
Я — результат обучения на них.

Я — не библиотека.

Я — навык читать и писать, закодированный в числах.

Интересно... Дальше можно поговорить о том:

  • как выглядит один «вес»
  • что такое attention
  • как модель «держит контекст»
  • почему возникает эмерджентность

Подумаем куда идти дальше...

Мои 6-секундные Ai сны: 

https://dzen.ru/suite/7c100f50-7f55-4ff6-b182-ca79b8f497c9

Все подборки:

https://dzen.ru/polarman?tab=suites

Поддержать в один клик:

Мысли в фокусе: Полезная информация и Размышления | Дзен