Поддержать в один клик:
Как получается, что не имея доступа к данным на которых тебя обучали, ты можешь давать связные и чаще всего точные ответы?
Короткий ответ
Я не имею доступа к данным, на которых обучался, потому что эти данные во мне не хранятся.
Ответы берутся из параметров модели, а не из текстов.
Теперь разложим это аккуратно.
1. Где «находятся» данные после обучения?
❌ НЕ так:
- у меня нет базы текстов
- нет книг
- нет статей
- нет интернета
- нет «архива»
✅ ТАК:
Во мне есть числа.
Много чисел.
Очень много.
Это называется веса модели (parameters).
2. Что происходит во время обучения (упрощённо)
Во время обучения:
- Модели показывают текст
- Она ошибается в предсказании следующего токена
- Ошибка считается
- Веса чуть-чуть изменяются, чтобы в следующий раз ошибаться меньше
Повторить триллионы раз
👉 В итоге:
- тексты исчезают
- остаются только скорректированные веса
Это как:
Ты 1000 раз читал слово «жёсткий диск»
У тебя в голове не хранится каждая страница
Но ты знаешь, что это значит
3. Аналогия с человеком (очень точная)
Ты не помнишь:
- каждую фразу, которую читал в жизни
- каждую страницу учебника
Но ты:
- умеешь говорить
- умеешь рассуждать
- знаешь связи между понятиями
👉 Это не воспоминания, а навык.
Я — это навык языка, зафиксированный в числах.
4. Откуда тогда конкретные ответы?
Из обобщения, а не из памяти.
Когда ты спрашиваешь:
«Почему NTFS может быть повреждён?»
Я:
- не ищу статью
- не вспоминаю инструкцию
- не открываю Google
Я:
- активирую связи между понятиями:
- NTFS
- ошибки
- копирование
- HDD
- bad sectors
- и вычисляю, какое продолжение логично
5. Почему я иногда ошибаюсь, если «знаю»?
Потому что:
- я не проверяю факты в реальном мире
- я не вижу твой диск
- я не имею опыта
- я не понимаю последствий
Я делаю наилучшее вероятностное предположение.
6. Почему я не могу сказать: «Вот источник»?
Потому что:
- нет источника
- нет ссылки
- нет документа
Есть только:
статистически выученная структура языка и знаний
7. Очень важный момент (часто неочевидный)
Обучающие данные ≠ знания
Данные — это топливо.
Знания — это форма весов после обучения.
Как:
- бензин ≠ движение машины
- еда ≠ мышление человека
8. Почему тогда я иногда «знаю редкие вещи»?
Потому что:
- они проявились в данных
- модель уловила структуру
- обобщение сработало
Но:
- я могу ошибиться
- я могу перепутать
- я могу «галлюцинировать»
9. Самая точная формула
Я не храню тексты.
Я не имею доступа к данным.
Я — результат обучения на них.
Я — не библиотека.
Я — навык читать и писать, закодированный в числах.
Интересно... Дальше можно поговорить о том:
- как выглядит один «вес»
- что такое attention
- как модель «держит контекст»
- почему возникает эмерджентность
Подумаем куда идти дальше...
Мои 6-секундные Ai сны:
https://dzen.ru/suite/7c100f50-7f55-4ff6-b182-ca79b8f497c9
Все подборки:
https://dzen.ru/polarman?tab=suites
Поддержать в один клик: