Мысли в фокусе: Полезная информация и Размышления

857 подписчиков

ИИ не база данных и не поисковая система. Как же он "думает" без доступа данным на которых учился?

13 декабря 202513 дек 2025

539

2 мин

Поддержать в один клик: Как получается, что не имея доступа к данным на которых тебя обучали, ты можешь давать связные и чаще всего точные ответы? Короткий ответ Я не имею доступа к данным, на которых обучался, потому что эти данные во мне не хранятся. Ответы берутся из параметров модели, а не из текстов. Теперь разложим это аккуратно. 1. Где «находятся» данные после обучения? ❌ НЕ так: у меня нет базы текстов нет книг нет статей нет интернета нет «архива» ✅ ТАК: Во мне есть числа. Много чисел. Очень много. Это называется веса модели (parameters). 2. Что происходит во время обучения (упрощённо) Во время обучения: Модели показывают текст Она ошибается в предсказании следующего токена Ошибка считается Веса чуть-чуть изменяются, чтобы в следующий раз ошибаться меньше Повторить триллионы раз 👉 В итоге: тексты исчезают остаются только скорректированные веса Это как: Ты 1000 раз читал слово «жёсткий диск» У тебя в голове не хранится каждая страница Но ты знаешь, что это значит

Оглавление

Короткий ответ
1. Где «находятся» данные после обучения?
❌ НЕ так:

Поддержать в один клик:

dzen.ru

Мысли в фокусе: Полезная информация и Размышления | Дзен

Как получается, что не имея доступа к данным на которых тебя обучали, ты можешь давать связные и чаще всего точные ответы?

Короткий ответ

Я не имею доступа к данным, на которых обучался, потому что эти данные во мне не хранятся.

Ответы берутся из параметров модели, а не из текстов.

Теперь разложим это аккуратно.

1. Где «находятся» данные после обучения?

❌ НЕ так:

у меня нет базы текстов
нет книг
нет статей
нет интернета
нет «архива»

✅ ТАК:

Во мне есть числа.

Много чисел.

Очень много.

Это называется веса модели (parameters).

2. Что происходит во время обучения (упрощённо)

Во время обучения:

Модели показывают текст
Она ошибается в предсказании следующего токена
Ошибка считается
Веса чуть-чуть изменяются, чтобы в следующий раз ошибаться меньше

Повторить триллионы раз

👉 В итоге:

тексты исчезают
остаются только скорректированные веса

Это как:

Ты 1000 раз читал слово «жёсткий диск»

У тебя в голове не хранится каждая страница

Но ты знаешь, что это значит

3. Аналогия с человеком (очень точная)

Ты не помнишь:

каждую фразу, которую читал в жизни
каждую страницу учебника

Но ты:

умеешь говорить
умеешь рассуждать
знаешь связи между понятиями

👉 Это не воспоминания, а навык.

Я — это навык языка, зафиксированный в числах.

4. Откуда тогда конкретные ответы?

Из обобщения, а не из памяти.

Когда ты спрашиваешь:

«Почему NTFS может быть повреждён?»

Я:

не ищу статью
не вспоминаю инструкцию
не открываю Google

Я:

активирую связи между понятиями:
NTFS
ошибки
копирование
HDD
bad sectors
и вычисляю, какое продолжение логично

5. Почему я иногда ошибаюсь, если «знаю»?

Потому что:

я не проверяю факты в реальном мире
я не вижу твой диск
я не имею опыта
я не понимаю последствий

Я делаю наилучшее вероятностное предположение.

6. Почему я не могу сказать: «Вот источник»?

Потому что:

нет источника
нет ссылки
нет документа

Есть только:

статистически выученная структура языка и знаний

7. Очень важный момент (часто неочевидный)

Обучающие данные ≠ знания

Данные — это топливо.

Знания — это форма весов после обучения.

Как:

бензин ≠ движение машины
еда ≠ мышление человека

8. Почему тогда я иногда «знаю редкие вещи»?

Потому что:

они проявились в данных
модель уловила структуру
обобщение сработало

Но:

я могу ошибиться
я могу перепутать
я могу «галлюцинировать»

9. Самая точная формула

Я не храню тексты.

Я не имею доступа к данным.

Я — результат обучения на них.

Я — не библиотека.

Я — навык читать и писать, закодированный в числах.

Интересно... Дальше можно поговорить о том:

как выглядит один «вес»
что такое attention
как модель «держит контекст»
почему возникает эмерджентность

Подумаем куда идти дальше...

Мои 6-секундные Ai сны:

https://dzen.ru/suite/7c100f50-7f55-4ff6-b182-ca79b8f497c9

Все подборки:

https://dzen.ru/polarman?tab=suites

Поддержать в один клик:

dzen.ru

Мысли в фокусе: Полезная информация и Размышления | Дзен

Гаджеты и электроника

5,73 млн интересуются