Кредиты — как это работает

Итоговая стоимость рассчитывается в real-time на основании стоимости конкретно этого запроса — конкретно к этой модели и в конкретно этих условиях. Сколько вычислительных мощностей понадобится, во сколько нам лично обойдётся обслуживание — динамических переменных действительно много. Мы считаем в токенах внутри, но показываем пользователю понятную и стабильную единицу — кредит.

Что такое «кредит»

Кредит — это абстракция над реальной стоимостью. Это просто единица, которую мы используем в интерфейсе. За кулисами она переводится в токены и реальную себестоимость с учётом следующих факторов:

выбранной модели;
количества входных токенов (prompt);
количества выходных токенов (response);
системных сообщений и вспомогательных контекстов;
используемых инструментов (tools / agents) и внешних интеграций.

Проще: мы внутри считаем всё в токенах и реальной себестоимости, а пользователю показываем удобную и стабильную валюту — кредиты.

Шкала и примеры

Мы ориентируемся на шкалу от 0.1 до 5 кредитов:

0.1 кредита — простейший запрос, например: «добавь алиас к этой функции на строке 126».
~0.5–1 кредит — стандартный быстрый рефакторинг, короткое пояснение, небольшая генерация кода.
~1–5 кредитов — более объёмные задачи: составить план, отрефакторить модуль, подробный ответ с примерами.
~5–20 кредитов — «размытые» или ресурсоёмкие запросы, например: «сделай мне клон поисковика Bing, который будет работать на моём ноутбуке» — запросы с большой степенью неопределённости, которые требуют значительных вычислительных ресурсов и многократных итераций.

Чем больше ресурсов требует задача — тем выше стоимость в кредитах.

Почему стоимость плавающая

Разные модели потребляют разные вычислительные ресурсы.
Длина входа/выхода напрямую влияет на время выполнения и цену.
Использование дополнительных системных сообщений и агентов увеличивает нагрузку.
Если запрос плохо конкретизирован, модель делает больше вычислений и попыток уточнения.

Поэтому итоговая сумма считается в момент выполнения запроса — именно под эти конкретные условия.

Прозрачность и экспорт данных

Прозрачность очень важна для нас — мы стремимся к максимальной открытости и активно работаем над тем, чтобы предоставлять всё больше информации разными способами. Одна из таких возможностей — функция экспорта использования (usage export). Экспорт будет включать детальную информацию по каждому запросу, например:

идентификатор запроса (request id) и временные метки (timestamp);
тип и название модели;
количество входных токенов (input tokens) и выходных токенов (output tokens);
системные сообщения, использованные подсказки и контексты;
задействованные инструменты / агенты (tools / agents) и внешние интеграции;
итоговая стоимость в токенах и в кредитах;
длительность выполнения (latency) и статус выполнения (успех / ошибка);
объём переданных файлов или размер контекста (если применимо);
регион/кластер обработки (если релевантно) и другие метаданные (retries, количество итераций, вызовы внешних API).

Мы планируем сделать экспорт удобным для анализа и добавить возможность фильтрации по диапазону дат, моделям и типам запросов, чтобы вы могли легко сверить расходы и понять, за что именно списывались кредиты.

Прозрачность и справедливость

Кредиты списываются исходя из реальной стоимости запроса для нас. Мы стремимся к справедливому и прозрачному учёту: внутри — точные расчёты в токенах и ресурсах, снаружи — простая и понятная единица для пользователя. При желании вы сможете получить детальную разбивку по каждому списанию через экспорт использования или в логах запросов.

Кратко

Кредит = удобная единица отображения реальной, динамической стоимости вычислений. Диапазон типичных запросов — от 0.1 (микро-задачи) до 20 (сложные, неопределённые запросы). Чем точнее и компактнее запрос — тем дешевле и быстрее результат. Мы работаем над тем, чтобы вы видели как можно больше деталей — и скоро добавим экспорт, где будут видны все ключевые параметры списания.