Перейти к содержимому

Автоматическое резюмирование контекста

Когда разговор приближается к лимиту контекстного окна модели, Kodik автоматически резюмирует его, чтобы освободить место и продолжить работу. Вы также можете запустить резюмирование вручную с помощью команды /compact.

Kodik отслеживает использование токенов по ходу разговора. Авторезюмирование срабатывает в двух случаях:

  • Проактивно — когда оценка токенов превышает ~70% контекстного окна модели.
  • После паузы — когда кеш Anthropic устарел (прошло более 5 минут с последнего сообщения) и разговор достаточно длинный.

При срабатывании:

  1. Kodik суммирует старую часть истории разговора, сохраняя последнее сообщение пользователя и всё, что за ним следует.
  2. Устаревшие результаты инструментов в сохранённых сообщениях заменяются пометкой [Old tool result content cleared], чтобы дополнительно освободить место.
  3. История заменяется парой сообщений: вопросом «What did we do so far?» и ответом — итоговым резюме.

Резюме создаётся по фиксированному шаблону. Оно всегда содержит:

  • Goal — краткое описание задачи одной фразой
  • Constraints & Preferences — требования и предпочтения пользователя
  • Progress — выполненная работа, текущие задачи, блокеры
  • Key Decisions — принятые технические решения
  • Next Steps — следующие действия
  • Critical Context — важные технические факты, ошибки, открытые вопросы
  • Relevant Files — пути к файлам и их значимость

Kodik пытается создать резюме через Kodik API. При неудаче автоматически переключается на активную модель, настроенную в расширении. При использовании Ollama суммаризация выполняется непосредственно через локальный инстанс.

Чтобы сжать разговор в любой момент, используйте команду /compact. Она немедленно суммирует всю историю, не ожидая порогового значения токенов. Подробности — в обзоре slash-команд.

Kodik сохраняет контрольные точки в ходе работы. Если резюмирование произошло, вы можете откатиться к состоянию до него через контрольную точку. Это означает, что полный контекст не теряется: всегда можно вернуться к предыдущей версии разговора.