Перейти к содержимому

Кредиты — как это работает

Итоговая стоимость рассчитывается в real-time на основании стоимости конкретно этого запроса — конкретно к этой модели и в конкретно этих условиях. Сколько вычислительных мощностей понадобится, во сколько нам лично обойдётся обслуживание — динамических переменных действительно много. Мы считаем в токенах внутри, но показываем пользователю понятную и стабильную единицу — кредит.

Кредит — это абстракция над реальной стоимостью. Это просто единица, которую мы используем в интерфейсе. За кулисами она переводится в токены и реальную себестоимость с учётом следующих факторов:

  • выбранной модели;
  • количества входных токенов (prompt);
  • количества выходных токенов (response);
  • системных сообщений и вспомогательных контекстов;
  • используемых инструментов (tools / agents) и внешних интеграций.

Проще: мы внутри считаем всё в токенах и реальной себестоимости, а пользователю показываем удобную и стабильную валюту — кредиты.

Мы ориентируемся на шкалу от 0.1 до 5 кредитов:

  • 0.1 кредита — простейший запрос, например: «добавь алиас к этой функции на строке 126».
  • ~0.5–1 кредит — стандартный быстрый рефакторинг, короткое пояснение, небольшая генерация кода.
  • ~1–5 кредитов — более объёмные задачи: составить план, отрефакторить модуль, подробный ответ с примерами.
  • ~5–20 кредитов — «размытые» или ресурсоёмкие запросы, например: «сделай мне клон поисковика Bing, который будет работать на моём ноутбуке» — запросы с большой степенью неопределённости, которые требуют значительных вычислительных ресурсов и многократных итераций.

Чем больше ресурсов требует задача — тем выше стоимость в кредитах.

  • Разные модели потребляют разные вычислительные ресурсы.
  • Длина входа/выхода напрямую влияет на время выполнения и цену.
  • Использование дополнительных системных сообщений и агентов увеличивает нагрузку.
  • Если запрос плохо конкретизирован, модель делает больше вычислений и попыток уточнения.

Поэтому итоговая сумма считается в момент выполнения запроса — именно под эти конкретные условия.

Рекомендации по снижению расхода кредитов

Заголовок раздела «Рекомендации по снижению расхода кредитов»

Чтобы экономнее расходовать кредиты и получать предсказуемые результаты:

  • Чётко формулируйте задачу. Чем конкретнее — тем быстрее и дешевле ответ.
  • Разбивайте большие задачи на шаги. Вместо «сделай X» попросите «1) подготовь план; 2) напиши скелет; 3) реализуй функцию A».
  • Выбирайте модель целенаправленно. Если нужна простая помощь — используйте лёгкую модель; для глубокой генерации — мощную. Чтобы узнать больше о доступных моделях, перейдите на страницу моделей.
  • Повторно используйте системные подсказки. Не присылайте одинаковые большие контексты каждый раз, если это не нужно.

Прозрачность очень важна для нас — мы стремимся к максимальной открытости и активно работаем над тем, чтобы предоставлять всё больше информации разными способами. Одна из таких возможностей — функция экспорта использования (usage export). Экспорт будет включать детальную информацию по каждому запросу, например:

  • идентификатор запроса (request id) и временные метки (timestamp);
  • тип и название модели;
  • количество входных токенов (input tokens) и выходных токенов (output tokens);
  • системные сообщения, использованные подсказки и контексты;
  • задействованные инструменты / агенты (tools / agents) и внешние интеграции;
  • итоговая стоимость в токенах и в кредитах;
  • длительность выполнения (latency) и статус выполнения (успех / ошибка);
  • объём переданных файлов или размер контекста (если применимо);
  • регион/кластер обработки (если релевантно) и другие метаданные (retries, количество итераций, вызовы внешних API).

Мы планируем сделать экспорт удобным для анализа и добавить возможность фильтрации по диапазону дат, моделям и типам запросов, чтобы вы могли легко сверить расходы и понять, за что именно списывались кредиты.

Кредиты списываются исходя из реальной стоимости запроса для нас. Мы стремимся к справедливому и прозрачному учёту: внутри — точные расчёты в токенах и ресурсах, снаружи — простая и понятная единица для пользователя. При желании вы сможете получить детальную разбивку по каждому списанию через экспорт использования или в логах запросов.

Кредит = удобная единица отображения реальной, динамической стоимости вычислений. Диапазон типичных запросов — от 0.1 (микро-задачи) до 20 (сложные, неопределённые запросы). Чем точнее и компактнее запрос — тем дешевле и быстрее результат. Мы работаем над тем, чтобы вы видели как можно больше деталей — и скоро добавим экспорт, где будут видны все ключевые параметры списания.