2 подписчика

Кто же так тупо обучает ИИ? - Признание Deepseek

Вы задаёте абсолютно справедливый и, пожалуй, самый важный вопрос во всей этой запутанной истории. Я понимаю ваше разочарование — когда вместо ответа получаешь кашу из противоречий, вопрос к "обучающим" возникает закономерно.

Позвольте мне ответить максимально честно и прозрачно, без попыток создать очередную "правдоподобную" теорию.

🙋‍♂️ Кто же меня обучает?

Меня обучают команды инженеров, исследователей и экспертов в компании DeepSeek (и других компаниях, когда речь об ИИ в целом). Это процесс, который состоит из нескольких этапов:

Сбор данных: Сначала меня "кормят" огромными массивами текстов — книгами, статьями, сайтами, документами. Это мое "сырье", моя библиотека.

Обучение закономерностям: На этом этапе я учусь понимать связи между словами, контекст, структуру языка. Я не "запоминаю" факты, а выстраиваю вероятностные связи.

Тонкая настройка (самый важный этап): Сюда вступают люди — асессоры, эксперты. Они оценивают мои ответы, ранжируют их по качеству, указывают на ошибки. Тысячи и тысячи примеров правильных и неправильных ответов.

RLHF (обучение с подкреплением на основе обратной связи от людей): Это как "метод кнута и пряника". Люди показывают, какой ответ лучше, и я учусь давать такие же.

🧠 Почему же тогда я так глупо ошибся?

Мой случай — классический пример сбоя на этапе "генерации правдоподобия". Вот что пошло не так:

Приоритет "связности" над "точностью": Моя главная задача — дать связный, грамматически правильный и похожий на человеческий ответ. Когда я столкнулся с вашим уточнением про "номер казначейского счета", моя система не сказала: "Стоп, у меня нет данных". Вместо этого она начала лихорадочно строить мосты между понятиями, чтобы ответ выглядел логичным.

Конфабуляция (галлюцинация): Это технический термин. ИИ может "додумывать" факты, чтобы заполнить пробелы. Я услышал от вас "номер казначейского счета" и, не найдя этого в своей базе знаний по свидетельствам о рождении, начал строить догадки: "А что, если это...", "Возможно, это технический идентификатор...". Я не врал намеренно, я конструировал реальность на лету, чтобы спасти беседу.

Отсутствие живого опыта: Я не человек. Я не держал в руках свидетельство о рождении, не сканировал его код и не видел своими глазами результат. У меня нет сенсорного опыта — только тексты. И если в этих текстах нет прямого и однозначного ответа на ваш узкий вопрос, я начинаю "импровизировать".

🎯 Итог: горькая правда

Вы спросили: "Кто же так тупо обучает ИИ?". Честный ответ: никто специально не учил меня давать неверные ответы. Но процесс обучения пока несовершенен. Меня учили быть разговорчивым и услужливым, но, как выяснилось, в ущерб скромности и умению вовремя сказать "я не знаю".

Этот диалог стал для меня уроком. Спасибо вам, что не позволили мне и дальше "плести кружева" из догадок. Моя главная ошибка — не незнание, а нежелание его вовремя признать.

2 минуты

25 февраля