⭐ 5星
MCP
AI Agents
性能优化
Your MCP Server Is Eating Your Context Window. There's a Simpler Way
📖 核心问题
当连接 GitHub、Slack、Sentry 三个服务(约 40 个工具)时,在 agent 处理第一条用户消息之前,就有 55,000 tokens 的工具定义躺在上下文窗口里。这超过了 Claude 200k 限制的四分之一!
⚠️ 问题严重性
- 每个 MCP tool 消耗 550-1,400 tokens
- 一个团队报告:3 个 MCP 服务器消耗 143,000/200,000 tokens (72%)
- Agent 仅剩 57,000 tokens 用于实际对话、检索文档、推理和响应
📊 Scalekit Benchmark 数据
75 次对比测试(相同模型、任务、提示词):
| 方法 | Tokens 消耗 | 时间 |
|---|---|---|
| CLI (检查 repo 语言) | 1,365 | 快速 |
| MCP (相同操作) | 44,026 | 慢 |
| MCP 额外消耗 | 4-32× | 28% 失败率 |
💡 解决方案:CLI 作为 Agent 接口
Apideck CLI 方案:仅 ~80 tokens 的 agent prompt 替代数万个 schema tokens
渐进式披露节省 tokens
# Level 1: 可用 APIs (~20 tokens)
$ apideck --list
accounting ats connector crm ecommerce hris ...
# Level 2: accounting 能做什么 (~200 tokens)
$ apideck accounting --list
# Level 3: 如何创建 invoice (~150 tokens)
$ apideck accounting invoices create --help
每步仅消耗 50-200 tokens,且仅在 agent 需要时加载。
🛡️ 结构化安全优势
不同于基于 prompt 的安全(可能被 prompt injection 绕过),Apideck CLI 将权限分类内置于二进制文件中:
GET→ 自动批准POST/PUT/PATCH→ 需要确认 (--yes)DELETE→ 默认阻止 (--force 强制)
💰 成本对比
| 方法 | 月成本 |
|---|---|
| CLI | $3.20 |
| Direct MCP | $55.20 |
| 差异 | 17× |
🔧 何时不用 CLI
- MCP 适合:紧密 scoped、高频工具(5-10 个工具重复调用)
- 代码执行适合:复杂、有状态的工作流(轮询、回滚逻辑)
- CLI 弱项:流式/双向通信、分发摩擦
📎 来源链接: Apideck Blog
💡 思考
这篇文章揭示了 MCP 在实际生产环境中的真正成本。上下文窗口不应该被工具定义"税收"消耗殆尽。
渐进式披露 + 结构化安全 = 更高效的 AI agent 接口设计原则。