Модуль 2. ChatUI и рабочие сценарии
Урок 2. Настройка параметров генерации
Задача этого урока — не заставить пользователя запомнить все настройки сразу, а научить его отвечать на три простых вопроса:
  • какие параметры нужны большинству пользователей в обычной работе
  • когда вообще стоит менять настройки
  • с каких значений лучше начинать в типовых сценариях
Быстрая шпаргалка: что менять первым
Задача этого урока — не заставить пользователя запомнить все настройки сразу, а научить его отвечать на три простых вопроса:

Если вам нужно

Что менять первым

Более точный и строгий ответ

Температуру

Более короткий ответ

Длину ответа и формулировку запроса

Больше идей и вариантов

Температуру

Устойчивый стиль ответов

Префикс промпта

Работа с одним и тем же файлом в несколько шагов

Повторную отправку файлов

Главное правило: если вы не знаете, что менять, начните только с трех вещей:

  • температуры
  • длины ответа
  • префикса промпта

Остальные параметры чаще всего нужны уже после того, как базовая логика стала понятна.
Главное правило перед настройкой
Параметры генерации полезны, но они не заменяют хороший запрос. В большинстве случаев качество ответа в первую очередь зависит от:

  • понятной формулировки задачи
  • правильного выбора модели
  • уточняющего сообщения после первого ответа

Настройки стоит менять не «на всякий случай», а когда вы понимаете, какого именно результата хотите добиться:

  • сделать ответ точнее
  • сделать ответ короче
  • получить больше вариантов
  • уменьшить повторы
  • закрепить стиль ответа для повторяющейся задачи
Где находятся параметры
Панель параметров находится в правой части интерфейса ChatUI и открывается через боковую панель. В ней собраны настройки, которые позволяют управлять поведением модели.

В этом уроке удобно разделить их на три группы:

  • базовые — нужны большинству пользователей
  • продвинутые — полезны, когда уже понятен базовый цикл работы
  • специальные — нужны не всем и чаще относятся к техническим или редким сценариям

Такой подход помогает не перегружаться настройками на старте.
Панель параметров генерации и сохранение пресета
Базовые параметры: что нужно знать в первую очередь
1. Максимальное количество выводимых токенов
Этот параметр задает максимальную длину ответа.

Практически это означает следующее:

  • меньшее значение помогает получать более короткие и собранные ответы
  • большее значение полезно, когда нужен развернутый результат

Что важно помнить:

  • слишком большое значение не делает ответ «умнее»
  • слишком длинный лимит часто увеличивает объем, повторяемость и «воду»

Когда менять:

  • если модель отвечает слишком коротко
  • если модель уходит в слишком длинные объяснения

Стартовое правило:

  • для кратких ответов, резюме и FAQ — умеренный лимит
  • для длинных инструкций, структурных разборов и объемных черновиков — более высокий лимит
2. Температура
Температура влияет на степень вариативности и «свободы» ответа.

Проще всего понимать ее так:

  • низкая температура — более строгие и предсказуемые ответы
  • средняя температура — баланс между точностью и гибкостью
  • высокая температура — более разнообразные и креативные ответы

Ориентир:

  • 0.0–0.3 — когда важны точность и стабильность
  • 0.3–0.6 — универсальный рабочий диапазон
  • 0.7+ — когда нужны идеи, варианты и более свободная генерация

Когда менять:

  • если нужен строгий деловой ответ — снижать
  • если нужны идеи или альтернативные формулировки — повышать
3. Префикс промпта
Префикс промпта — это системная инструкция, которая автоматически добавляется к каждому запросу в текущем режиме работы. С ее помощью можно задать модели роль, стиль, тон и ограничения.

Например:

  • «Ты — аналитик. Отвечай кратко, структурированно и только по фактам»
  • «Ты — специалист службы поддержки. Пиши вежливо, понятно и по существу»

Когда параметр особенно полезен:

  • если вы делаете серию однотипных запросов
  • если хотите удерживать один и тот же стиль ответов
  • если работаете в конкретной профессиональной роли

Что важно:

  • префикс не заменяет сам пользовательский запрос
  • слишком длинный или слишком жесткий префикс может мешать качеству ответа
4. Повторная отправка файлов
Если вы загрузили документ или изображение и планируете задавать по нему несколько последовательных вопросов, повторная отправка файлов может быть полезной: модель будет продолжать работать с вложением без необходимости каждый раз загружать его заново.

Когда использовать:

  • если вы анализируете один и тот же документ в несколько шагов
  • если задаете уточняющие вопросы по одному файлу

Когда не использовать:

  • если тема уже сменилась
  • если дальше нужен ответ без опоры на старое вложение
Продвинутые параметры: что подключать после базовых
1. Top P
Top P — это дополнительный параметр вариативности. Он влияет на то, насколько широкий набор возможных продолжений модель использует при выборе ответа.

Проще всего понимать его так:

  • низкий Top P — модель выбирает из более узкого круга самых вероятных вариантов
  • высокий Top P — модель выбирает из более широкого круга вариантов

Почему этот параметр часто кажется непонятным:

  • и температура, и Top P влияют на вариативность
  • если менять оба сразу, трудно понять, что именно повлияло на результат

Практическое правило для большинства пользователей:

  • если вы уже меняете температуру, этого обычно достаточно
  • Top P лучше сначала оставить по умолчанию
  • к нему имеет смысл возвращаться только тогда, когда вы уже попробовали изменить температуру, но все еще хотите тоньше настроить характер вариативности ответа

Что важно запомнить:

  • сначала меняем температуру
  • Top P — это дополнительная, а не основная настройка
  • если вы не уверены, нужен ли он вам, скорее всего, пока не нужен
2. Штраф за частоту
Этот параметр снижает склонность модели повторять одни и те же слова и формулировки.

Когда он может пригодиться:

  • если ответ получился однообразным
  • если модель повторяет одинаковые конструкции

Когда не стоит завышать:

  • если вам нужен спокойный, нейтральный и точный ответ
  • если текст и так получается собранным
3. Штраф за присутствие
Этот параметр сильнее подталкивает модель к введению новых слов и новых тем по сравнению с уже использованными.

Когда это полезно:

  • если вы хотите получить больше идей
  • если ищете альтернативные подходы

Когда это может мешать:

  • если нужен строгий ответ без лишних отклонений
  • если задача требует точности, а не разнообразия
Продвинутые параметры: что подключать после базовых
В интерфейсе могут присутствовать и другие настройки, например:

  • максимальное количество контекстных токенов
  • детали изображения
  • stop-последовательности
  • verbosity
  • web search
  • reasoning-related настройки
  • специальные API-опции
  • streaming-related настройки

На старте их достаточно воспринимать так: это дополнительные инструменты для отдельных случаев, а не обязательная часть базовой работы. Если нет конкретной причины, эти параметры можно пока не менять.

Главное правило: сначала освоить выбор модели, формулировку запроса, температуру, длину ответа и пресетытолько потом переходить к более тонкой настройке
Если нужно быстро понять, какой параметр менять, можно опираться на такую логику:

  • нужен более точный и предсказуемый ответ → снижайте температуру
  • нужен более короткий ответ → уменьшайте лимит длины ответа и уточняйте формат
  • нужны идеи и варианты → повышайте температуру, при необходимости умеренно используйте штрафы
  • нужно удерживать роль и стиль → используйте префикс промпта
  • нужно работать с одним и тем же файлом в несколько шагов → используйте повторную отправку файлов
Практические сценарии настройки
Короткий ролевой пример
Ситуация: юрист анализирует договор и хочет получить сдержанный, структурированный ответ без лишних домыслов.

Что делает пользователь:

  • открывает панель параметров
  • выбирает низкую температуру
  • задает префикс:

Ты — корпоративный юрист. Отвечай кратко, структурированно, по фактам. Указывай риски и спорные формулировки.

  • прикладывает документ
  • отправляет запрос:

Проанализируй договор и выдели ключевые риски, спорные формулировки и отсутствующие обязательные пункты.

Почему такой подход работает:

  • задача требует точности, а не креативности
  • префикс задает нужную профессиональную рамку
  • низкая температура делает ответ более предсказуемым
3 ошибки новичка
Пресеты: как не настраивать одно и то же заново
Если вы часто работаете в нескольких повторяющихся режимах, полезно сохранять пресеты — готовые наборы параметров для быстрого переключения.

Например, можно создать отдельные пресеты:

  • Строгий анализ
  • Креатив
  • Резюме
  • Поддержка

Базовая логика работы с пресетами:

  • настроить параметры под конкретную задачу
  • сохранить их как пресет
  • в следующий раз просто выбрать нужный режим, а не собирать его заново

Это особенно удобно, если пользователь регулярно решает одни и те же типы задач.

Кнопка сохранения пресета находится в той же панели параметров, внизу экрана.
Что можно оставить по умолчанию
Если вы только начинаете работать с настройками, чаще всего можно не менять:

  • Top P
  • штраф за частоту
  • штраф за присутствие
  • специальные технические параметры
Мини-практика
Сделайте короткое упражнение:

  • выберите одну и ту же тему, например: «Подготовь сообщение для сотрудников о переносе встречи»
  • сначала задайте запрос с низкой температурой
  • затем задайте похожий запрос с более высокой температурой
  • сравните:
   - насколько отличаются формулировки
   - где ответ строже
   - где больше вариативности

  • после этого создайте один простой пресет (например, Строгий анализ или Креатив)
Итоги урока
Что важно запомнить:
  • параметры генерации полезны, но не важнее самого запроса
  • большинству пользователей сначала достаточно нескольких базовых настроек
  • температуру стоит воспринимать как главный регулятор строгости и вариативности
  • длина ответа влияет на компактность результата
  • префикс помогает удерживать роль и стиль
  • пресеты экономят время в повторяющихся задачах