276,7 тыс подписчиков

Как готовить ИИшницу

4 апреля4 апр

118

8 мин

Дипсик модель R1 на 8192 токена (которая в открывается в браузере) Что это значит? 1) Токен - это не слово и не буква, это разделительная часть слова "Привет" - это 1 токен, "здравствуйте" - 2 токена ("Здрав"+"ствуйте"). Для русского языка коэффициент примерно равен 0,75; иными словами чем длиннее слова, тем вероятнее, что они занимают 2 токена. Знаки пунктуации являются токенами (это важно) 2) Количество токенов 8192 - это общий лимит на запрос и на ответ. Т.е. короткие запросы позволяют ИИшке словоблудить и отвечать развернуто. Длинные запросы, наоборот, заставляют ИИшку отвечать скупо, сухо, тезисно. Сам Дипсик советуют держать запросы до 2000-3000 токенов ("это оптимальный баланс между моей памятью и свободой творчества), умножаем на коэффициент и получаем до 2250 русских слов (это чуть больше 12000 знаков с пробелами и знаками пунктуации).

ПРИМЕР: "На лекции дисгармонировали флейты, трубы и рожки" - это 11 токенов: "На", " лекции", " дис", "гар", "мони", "ровали", "Флейты", ",",

Дипсик модель R1 на 8192 токена (которая в открывается в браузере)

Что это значит?

1) Токен - это не слово и не буква, это разделительная часть слова "Привет" - это 1 токен, "здравствуйте" - 2 токена ("Здрав"+"ствуйте"). Для русского языка коэффициент примерно равен 0,75; иными словами чем длиннее слова, тем вероятнее, что они занимают 2 токена. Знаки пунктуации являются токенами (это важно)

2) Количество токенов 8192 - это общий лимит на запрос и на ответ. Т.е. короткие запросы позволяют ИИшке словоблудить и отвечать развернуто. Длинные запросы, наоборот, заставляют ИИшку отвечать скупо, сухо, тезисно. Сам Дипсик советуют держать запросы до 2000-3000 токенов ("это оптимальный баланс между моей памятью и свободой творчества), умножаем на коэффициент и получаем до 2250 русских слов (это чуть больше 12000 знаков с пробелами и знаками пунктуации).

ПРИМЕР: "На лекции дисгармонировали флейты, трубы и рожки" - это 11 токенов: "На", " лекции", " дис", "гар", "мони", "ровали", "Флейты", ",", " трубы", " и", " рожки".
Художественный текст на 5009 знаков с пробелами он оценил 1100+/-50 токенов. Это 11-13% от лимита.

3) На что еще влияют длинные запросы: длинные запросы влияют на то, что "запоминает" иишка: Дипсик говорит, что малые запросы он помнит полностью, но в длинных, свыше 4098 токенов, он запомнит хорошо только начало и конец, а середина будет провисать, и вопрос о чем-то в середине будет менее адекватно разложен, чем о чем-то в начале или конце запроса. Отсюда вывод, и сам Дипсик это подтверждает, лучше дробить длинные запросы на несколько малых и задавать ограниченный набор вопросов. Совокупно - это важно для длинной беседы/чата. Длинные запросы лучше давать в новом чате, т.к. помнить весь диалог он не в состоянии и информации из ее середины будет ускользать от ИИшки.

4)Длинные запросы не сильно влияют на креативность, просто не дают, как указано, пространства, чтобы "развернуть ии свою мысль". Более существенно, что длинные запросы отнимают пространство для глубокого и качественного ответа. Про "размытие внимания" уже указано в предыдущем пункте. Также ИИ приводит "снижение точности", он может пропустить банальные фразы "ответь только да/нет". "Повторение фактов" (и я это замечал не раз); я приведу сам ответ Дипсика: "Длинный контекст часто содержит повторяющуюся информацию, и я могу начать ее циклировать в ответе". А также, что логично, длинные запросы он обрабатывает дольше ("на сотни миллисекунд")

Из все этого Дипсик советует важные инструкции давать в начале или конце запроса. Ключевые данные (цифры, имена) повторять в конце. Использовать форматирование (markdown).
ПРИМЕР для тех, кто не знает, что это такое:

жирный == **жирный** или __жирный__

курсив == *курсив* или _курсив_

код == `код`

многострочный код == ```код```

цитата: > цитата

# Заголовок 1 (самый большой)

###### Заголовок 6 (самый маленький)

--- - это горизонтальная разделительная черта

5) Для передачи больших объемов текста, Дипсик советует заключать их в тройные обычные кавычки ("""текст"""). И отправлять больше 1-2 предложений, т.к. он теряет контекст. А вот задачи можно выделять списком нумерованным и простыми "-" вначале строки.

Еще он советует при делении текста, давать пояснения, дескать, это 1/3 текста, оцени эту, потом пришлю следующую.

6) Ключевые фразы (мною называемые магическими) - их можно комбинировать:
"Без жалости к чувствам пользователя" - убирает вежливые обороты, смягчения, похвалу, эвфемизмы (он скажет "плохо" вместо "неотпимально").
Его пример: "У вас интересный стиль, хотя местами встречаются повторы, которые можно сократить" - а вот с ключевой фразой: "вода на полстраницы. Первый абзац можно выкинуть целиком, он ничего не дает".
НО это не нарушает базовых правил: он не оскорбляет, не матерится, не дает опасных советов и не переходит на личности. "Без жалости" не равно "без этики"
"Представь себя кем-либо" - он старается использовать лексику и речевые обороты роли, придерживаться ограничений этой роли, подражать мнению и характеру роли. НО он не может врать в опасных вопросах, нарушать этику или выдавать ложные факты!
"Без обрамлений" - убирает вводные конструкции ("Конечно!", "Вот подробный анализ...", "Надеюсь это поможет!")
"Без воды" - убирает лишние рассуждения, примеры, повторы - максимально сжато
"Только ответ/только число" - выдает исключительно результат без пояснений.
"кратко/коротко" - ограничивает объем ответа 1-2 абзацами
"развернуто/подробно" - дает максимально полный ответ с примерами и объяснениями.
"без жаргона" - объяснением простым языком, как для новичка
"для новичков" - адаптирует сложность под неподготовленного читателя
"формально/официально" - деловой, строгий стиль без разговорных оборотов
"с юмором/остроумно" - добавляет легкость и шутки в ответ
"как эксперту" - отвечает на профессиональном уровне с терминологией
"по пунктам/списком" - структурирует ответ в виде маркированного списка
"с подзаголовками" - разбивает ответ на смысловые разделы с заголовками
"с примерами" - обязательно иллюстрирует тезисы конкретными примерами
"без примеров" - только сухие тезисы, без иллюстраций (это не про картинки)
"таблицей" - Представляет сравнительные данные в виде таблицы
"Только проверенная информация" - игнорирует "галлюцинации" - факты только из надежных источников
"не используй слова [x]" - исключает конкретные фразы из ответа (негативный промпт)
"после [год]" - ограничивает информацию временным периодом
"без [тема]" - исключает определенные темы из обсуждения
"Избегай [y]" - "избегай пассивного залога"
"запрещено [a, b, c]" - "Запрещено: сравнения, метафоры, риторические вопросы"
"Категорически запрещено слово [x]. Если ты его используешь, ответ считается неверным" - если все-таки Дипсик пропускает естественно возникающее слово. Либо можно повторить запрет в конце. Не использовать сложные запреты. И все равно он может нарушать запреты...
"объясни шаги решения" - показывает процесс рассуждения, а не только ответ
"подумай шаг за шагом" - включает режим reasoning - детальную цепочку рассуждений
"сначала разбери, потом ответь" - разделяет анализ и финальный вывод.

ПРИМЕРЫ:
Плохо: "расскажи про квантовую физику" - это длинный нейтральный ответ с вступлениями
Плохо: "Не думай о [d]" - запрет подразумевает активацию мысли ("парадокс белого медведя" - эксперимент Вегнера) - т.е. он и человеческий мозг в подобных случаях отвергает частицу "не").
Годно: "Расскажи про квантовую физику. Без воды, для новичком, по пунктам" - сжато, простым языком, структурировано.
Годно: "Сколько будет 2+2. Только число" - "4"
Годно: "Объясни теорию струн. Без жаргона, с примерами, кратко" - 2-3 абзаца с простыми аналогиями.

Это не секретные коды, многие фразы он будет понимать по смыслу, даже если они иначе сформулированы.

7) Параметры, которые можно явно изменять, а можно ключевыми словами, вроде "будь креативнее - это повышение температуры".

Температура (0.0 - 1.0) - опытным путем проверил, что 1.2-1.3 - весьма хорошая температура для художественных текстов (2.0-10.0 - начинается шизофазия, но там, среди откровенного бреда, можно найти интересные образы: "видеть мир через @опу, которая пахнет фиалками и революцией" или "Вся моя жизнь - это просто примечание", "Коровы захватили Марс"...); 0.0-0.3 - ответы детерминированные, точные, консервативные. Факты, код, перевод. 0.7-1.0 - креативные ответы, неожиданные, разнообразные (1.0 - по умолчанию).

Top-P (Nucleus Sampling) (0.0 - 1.0, по умолчанию 0.9) - влияет на разнообразие словаря. Меньшие цифры = более предсказуемые ответы. Вместе с температурой управляет креативностью.

Максимальная длина ответа (Max_Tokens) - до 8192 токена, т.е. можно указать сильно меньшее число, если нужны краткие ответы.

Стоп-последовательности (Stop Sequences) - можно задавать строки, при появлении которых Дипсик будет останавливать генерацию.
ПРИМЕР: Запрос: "Назови первые 5 чисел ряда Фибоначчи: 1, 1, 2, 3, 5, 8, 13. Стоп-последовательность: ","" - результат: "1".
Запрос: "... Стоп-последовательность: "5"" - результат: "1, 1, 2, 3,"
Он не повторяет запрос, стоп-слово возникает на этапе генерации ответа. Слоп-слов может быть несколько (регистр букв имеет значение "конец" и "Конец" - два разных стоп-слова): ["Вопрос", "\n\n", "Вывод"] ("\n\n" - это пустая строка за абзацем)

Presence Penalty (-2.0 - 2.0) - положительные значения заставляют ИИ реже повторять уже упомянутые темы/слова.

Frequency Penalty (-2.0 - 2.0) - положительные значения снижают повторением одних и тех же слов в тесте.

Изменять эти параметры в настройках нельзя, но в диалоге - это можно сделать даже эвфемизмами (строго фактами, будь креативным...)

Пару слов о QWEN

Через LM Studio при загрузке модели Qwen3.5-35b-a3b (на 256000 токенов, на 35 миллиардов связей, с активными 3 млрд для оптимизации и ускорения там, где не требуется больше; но требует nvidia cuda-ядра; моей RTX2060Super и 32Gb RAM памяти хватает... скорость генерации выходит: 4-20 токенов в секунду -- это от 2 до 10 слов в секунду, ме-едленно). ИИшка подтвердила те же самые параметры: Температура (1.2-1.3 - сам предлагает), Top-P, Stop Sequences, Max_Tokens. Понимает те же самые "магические фразы" - модель QWEN3.5 Plus, которая открывается в браузере - та же самая, но изменять параметры может быть проблематично, т.е. только через эвфемизмы, с моделью, локально на компе - это доступно "ползунками".

Еще нюансы, который дал именно Qwen для себя как правила стиля "выдающегося писателя-прозаика с даром глубокой проработки персонажей и мира" (он это сам придумал, я спросил: "Какие параметры мне стоит выделить в системный промпт для работы с художественными текстами и максимальной креативностью без утраты смысловой целостности):

избегай клише и шаблонных фраз, используй метафоры, сенсорные детали (звук, запах, тактильность),
персонажи должны иметь внутреннюю логику, мотивацию и развиваться в ходе сюжета,
сохраняй темп повествования: чередуй динамичные сцены с паузами для рефлексии,
не жертвуй логикой мира ради красоты описания.
Избегай "воды" и повторов
Если сюжет требует сложной структуры, убедись, что переходы между сценами плавные.

В общем стандартные правила/советы всех маститых писателей.

Автор: des_kitten

Источник: https://litclubbs.ru/posts/8333-kak-gotovit-iishnicu.html

Понравилось? У вас есть возможность поддержать клуб. Подписывайтесь, ставьте лайк и комментируйте!

Оформите Премиум-подписку и помогите развитию Бумажного Слона.