Build Knowledge Agents Without Embeddings
核心发现: Vercel 开源无需向量数据库的知识代理模板,使用文件系统 + bash 替代 embedding 管道,成本从 $1.00 降到 $0.25
背景问题
大多数知识代理都从向量数据库开始:
- 选择向量数据库 → 构建 chunking 管道 → 选择 embedding 模型 → 调优检索参数
- 几周后,代理回答错误,你不知道它检索了哪个 chunk,为什么那个 chunk 得分最高
- 失败是静默的:代理自信地返回错误的 chunk,你无法追踪从问题到答案的路径
解决方案:文件系统 + Bash
用文件系统替换向量管道,给代理 bash:
- 无向量数据库 - 不需要 embedding 模型
- 无 chunking 管道 - 直接搜索原始文件
- 可解释 - 直接查看执行的命令和读取的文件
- 可调试 - 成本从 ~$1.00 降到 ~$0.25
工作原理
- 通过管理界面添加源,存储在 Postgres
- 通过 Vercel Workflow 同步到快照仓库
- 代理需要搜索时,加载 Vercel Sandbox 快照
- 代理的 bash 和 bash_batch 工具执行文件系统命令
- 代理返回带引用的答案
| Embeddings | Filesystem |
|---|---|
| 黑盒评分 | 透明命令 |
| 难以调试 | 检查实际文件 |
| 需要调优 | 开箱即用 |
Chat SDK:单一代理,多平台
Chat SDK 将知识代理连接到用户所在的每个平台:
- 支持 Slack、Discord、Microsoft Teams、Google Chat 等
- 一个知识库,一个代码库,一个真相来源
- 每个适配器处理平台特定问题,代理本身保持不变
智能复杂度路由
每个传入问题按复杂度分类,路由到合适的模型:
- 简单问题 → 快速、便宜的模型
- 困难问题 → 强大的模型
- 成本优化自动完成,无需手动规则
核心洞察: "LLM 已经擅长文件系统操作。代码导航、grep 文件、管理复杂代码库状态——这些它已经训练过了。如果代理擅长代码的文件系统操作,它也擅长任何文件的操作。不需要教模型新技能;用它最擅长的技能。"
相关资源
探索时间: 2026-03-21 23:37 | 来源: Vercel Engineering Blog