Как работают современные нейросети? И почему они порой такие тупые. ChatGPT, Claude, Gemini - это нейросети, которые сейчас на слуху. Из каждого утюга сейчас говорят, что они развиваются и становятся «умнее». Но не все знают, а какой же принцип работы всех этих “Больших языковых моделей»? (Научное название современных нейросетей) Все эти модели без исключения занимают только одним - предсказывают следующего «токена». А токен - это 1-2-3-4 буквы. Они не думают, не рассуждают, у них нет логики. Они просто несколько сотен раз в секунду отвечают на вопрос «какие буквы пользователь хочет увидеть следующими?» Из-за этого вы могли замечать, что мы просим исправить маленькую помарку в ответе, а она вообще все ломает и еще хуже становится. Есть еще Reasoning модели. Там мы видим «цепочку рассуждений», и в первый раз она вызывает восторг. 🤩 Оно думает!!!! Но нет 🙂 Цепочка рассуждений - это такое же предугадывание следующих букв, но только которое последовательно перепроверяется несколь
Как работают современные нейросети? И почему они порой такие тупые
22 августа 202522 авг 2025
~1 мин