Промптология 5.3.2 Параметр top-p Ядерная выборка (или nucleus sampling) — это метод, применяемый в языковых моделях для контроля над разнообразием и случайностью генерируемых текстов. Она работает следующим образом: при генерации ответа модель предсказывает вероятности различных слов (токенов), которые могут быть следующими в тексте. Эти вероятности формируют распределение, и вместо того, чтобы выбирать одно наиболее вероятное слово, ядерная выборка ограничивает выбор до группы слов, которые совместно охватывают определенный процент этой вероятности, скажем, 90% или 50%...
Мало, кто знает, число π (читается как «число пи»), округляемое обычно до трёх целых четырнадцати сотых («3.14») , можно представить в виде дроби двадцать две седьмых. Чтобы это проверить, можно посчитать вручную либо на калькуляторе. Однако, можно заметить, что число π и данная дробь долго рассчитываются (до бесконечности), поэтому, как правило, прибегают к округлениям. Для задач порядок округления идёт от сотых (две цифры после запятой) до десяти тысячных (четыре цифры после запятой). Иногда берут...