速率限制与成本
了解和管理 API 使用情况对于在 Kilo Code 中获得流畅且经济高效的体验至关重要。本节将解释如何跟踪你的 token 使用情况、成本以及如何配置速率限制。
Token 使用
Kilo Code 使用 token 与 AI 模型进行交互。Token 本质上是词语的组成部分。请求和响应中使用的 token 数量会影响处理时间和成本。
- **输入 Token:**这些是你的提示中的 token,包括系统提示、你的指令以及提供的任何上下文(例如文件内容)。
- **输出 Token:**这些是 AI 模型在响应中生成的 token。
你可以在聊天记录中查看每次交互的输入和输出 token 数量。
成本计算
大多数 AI 提供商根据使用的 token 数量收费。价格因提供商和具体模型而异。
Kilo Code 会根据配置的模型定价自动计算每次 API 请求的预估成本。该成本显示在聊天记录中,紧邻 token 使用情况。
注意:
- 成本计算是预估值。实际成本可能因提供商的计费方式而略有不同。
- 一些提供商可能提供免费层级或信用额度。请查看提供商的文档以获取详细信息。
- 一些提供商提供提示缓存,可以显著降低成本。
配置速率限制
为了防止意外过度使用 API 并帮助你管理成本,Kilo Code 允许你设置速率限制。速率限制定义了 API 请求之间的最短时间(以秒为单位)。
如何配置:
- 打开 Kilo Code 设置(右上角的 图标)。
- 转到“高级设置”部分。
- 找到“速率限制(秒)”设置。
- 输入所需的延迟时间(以秒为单位)。值为 0 表示禁用速率限制。
示例:
如果你将速率限制设置为 10 秒,Kilo Code 会在一个 API 请求完成后至少等待 10 秒再发送下一个请求。
优化 Token 使用的技巧
- **简洁明了:**在提示中使用清晰简洁的语言。避免不必要的词语或细节。
- **仅提供相关上下文:**选择性使用上下文提及(
@file.ts
,@folder/
)。仅包括与任务直接相关的文件。 - **分解任务:**将大型任务分解为更小、更专注的子任务。
- **使用自定义指令:**提供自定义指令以指导 Kilo Code 的行为,减少每次提示中冗长的解释。
- **选择合适的模型:**某些模型比其他模型更具成本效益。对于不需要较大模型全部功能的任务,可以考虑使用更小、更快的模型。
- **使用模式:**不同的模式可以访问不同的工具,例如
Architect
无法修改代码,这使其成为分析复杂代码库时的安全选择,而无需担心意外允许昂贵的操作。 - **如果未使用 MCP 则禁用它:**如果你未使用 MCP(模型上下文协议)功能,请考虑在 MCP 设置中禁用它,以显著减少系统提示的大小并节省 token。
通过了解和管理你的 API 使用情况,你可以高效且经济地使用 Kilo Code。