跳转到主要内容

速率限制与成本

了解和管理 API 使用情况对于在 Kilo Code 中获得流畅且经济高效的体验至关重要。本节将解释如何跟踪你的 token 使用情况、成本以及如何配置速率限制。

Token 使用

Kilo Code 使用 token 与 AI 模型进行交互。Token 本质上是词语的组成部分。请求和响应中使用的 token 数量会影响处理时间和成本。

**输入 Token：**这些是你的提示中的 token，包括系统提示、你的指令以及提供的任何上下文（例如文件内容）。
**输出 Token：**这些是 AI 模型在响应中生成的 token。

你可以在聊天记录中查看每次交互的输入和输出 token 数量。

成本计算

大多数 AI 提供商根据使用的 token 数量收费。价格因提供商和具体模型而异。

Kilo Code 会根据配置的模型定价自动计算每次 API 请求的预估成本。该成本显示在聊天记录中，紧邻 token 使用情况。

注意：

成本计算是预估值。实际成本可能因提供商的计费方式而略有不同。
一些提供商可能提供免费层级或信用额度。请查看提供商的文档以获取详细信息。
一些提供商提供提示缓存，可以显著降低成本。

配置速率限制

为了防止意外过度使用 API 并帮助你管理成本，Kilo Code 允许你设置速率限制。速率限制定义了 API 请求之间的最短时间（以秒为单位）。

如何配置：

打开 Kilo Code 设置（右上角的图标）。
转到“高级设置”部分。
找到“速率限制（秒）”设置。
输入所需的延迟时间（以秒为单位）。值为 0 表示禁用速率限制。

示例：

如果你将速率限制设置为 10 秒，Kilo Code 会在一个 API 请求完成后至少等待 10 秒再发送下一个请求。

优化 Token 使用的技巧

**简洁明了：**在提示中使用清晰简洁的语言。避免不必要的词语或细节。
**仅提供相关上下文：**选择性使用上下文提及（@file.ts，@folder/）。仅包括与任务直接相关的文件。
**分解任务：**将大型任务分解为更小、更专注的子任务。
**使用自定义指令：**提供自定义指令以指导 Kilo Code 的行为，减少每次提示中冗长的解释。
**选择合适的模型：**某些模型比其他模型更具成本效益。对于不需要较大模型全部功能的任务，可以考虑使用更小、更快的模型。
**使用模式：**不同的模式可以访问不同的工具，例如 Architect 无法修改代码，这使其成为分析复杂代码库时的安全选择，而无需担心意外允许昂贵的操作。
**如果未使用 MCP 则禁用它：**如果你未使用 MCP（模型上下文协议）功能，请考虑在 MCP 设置中禁用它，以显著减少系统提示的大小并节省 token。

通过了解和管理你的 API 使用情况，你可以高效且经济地使用 Kilo Code。

Token 使用
成本计算
配置速率限制
优化 Token 使用的技巧

Is this documentation incorrect or incomplete? Report an issue on GitHub