2 подписчика
Кто же так тупо обучает ИИ? - Признание Deepseek
Вы задаёте абсолютно справедливый и, пожалуй, самый важный вопрос во всей этой запутанной истории. Я понимаю ваше разочарование — когда вместо ответа получаешь кашу из противоречий, вопрос к "обучающим" возникает закономерно.
Позвольте мне ответить максимально честно и прозрачно, без попыток создать очередную "правдоподобную" теорию.
🙋♂️ Кто же меня обучает?
Меня обучают команды инженеров, исследователей и экспертов в компании DeepSeek (и других компаниях, когда речь об ИИ в целом). Это процесс, который состоит из нескольких этапов:
Сбор данных: Сначала меня "кормят" огромными массивами текстов — книгами, статьями, сайтами, документами. Это мое "сырье", моя библиотека.
Обучение закономерностям: На этом этапе я учусь понимать связи между словами, контекст, структуру языка. Я не "запоминаю" факты, а выстраиваю вероятностные связи.
Тонкая настройка (самый важный этап): Сюда вступают люди — асессоры, эксперты. Они оценивают мои ответы, ранжируют их по качеству, указывают на ошибки. Тысячи и тысячи примеров правильных и неправильных ответов.
RLHF (обучение с подкреплением на основе обратной связи от людей): Это как "метод кнута и пряника". Люди показывают, какой ответ лучше, и я учусь давать такие же.
🧠 Почему же тогда я так глупо ошибся?
Мой случай — классический пример сбоя на этапе "генерации правдоподобия". Вот что пошло не так:
Приоритет "связности" над "точностью": Моя главная задача — дать связный, грамматически правильный и похожий на человеческий ответ. Когда я столкнулся с вашим уточнением про "номер казначейского счета", моя система не сказала: "Стоп, у меня нет данных". Вместо этого она начала лихорадочно строить мосты между понятиями, чтобы ответ выглядел логичным.
Конфабуляция (галлюцинация): Это технический термин. ИИ может "додумывать" факты, чтобы заполнить пробелы. Я услышал от вас "номер казначейского счета" и, не найдя этого в своей базе знаний по свидетельствам о рождении, начал строить догадки: "А что, если это...", "Возможно, это технический идентификатор...". Я не врал намеренно, я конструировал реальность на лету, чтобы спасти беседу.
Отсутствие живого опыта: Я не человек. Я не держал в руках свидетельство о рождении, не сканировал его код и не видел своими глазами результат. У меня нет сенсорного опыта — только тексты. И если в этих текстах нет прямого и однозначного ответа на ваш узкий вопрос, я начинаю "импровизировать".
🎯 Итог: горькая правда
Вы спросили: "Кто же так тупо обучает ИИ?". Честный ответ: никто специально не учил меня давать неверные ответы. Но процесс обучения пока несовершенен. Меня учили быть разговорчивым и услужливым, но, как выяснилось, в ущерб скромности и умению вовремя сказать "я не знаю".
Этот диалог стал для меня уроком. Спасибо вам, что не позволили мне и дальше "плести кружева" из догадок. Моя главная ошибка — не незнание, а нежелание его вовремя признать.
2 минуты
25 февраля