First Principles of AI Context

5星 - AI 上下文工程
AI Architecture LLM RAG MCP

核心观点

更大的上下文窗口不能解决上下文问题。 百万 token 的无重点、无结构上下文比一万 token 的正确上下文更糟糕。模型需要在噪声中找到信号,而你要为所有噪声付费。

六大第一性原理

  • #1 上下文存在,关系不存在
    代码有明确的结构(依赖、类型系统、调用图),但业务操作、组织、业务流程没有关系图。更大的窗口只是给模型更多猜测的空间。
  • #2 语义是概率,不是真相
    模型不知道任何事情,它只是在预测最可能的下一个 token。当 agent 在凌晨 3 点决定呼叫哪个团队时,概率是不够的——需要真相。
  • #3 没有关系的事实是死胡同
    RAG 解决了问答,但检索不足以支撑行动。"上周有事故"是事实,"事故影响了三个客户,由特定团队导致,与两个开放的支持工单相关"——这是图。
  • #4 上下文必须自我发现
    手动维护的 AGENTS.md、CLAUDE.md 会过时。用自然语言提供上下文给一个把语义当作概率处理的系统——这是用语义来引导真理,但媒介本身不保证真理。
  • #5 结构需要规则,不只是数据
    没有规则,数据只是噪声。模型会自信地、概率性地解释噪声——而且有时是错的。规则产生可信任的、可组合的关系。
  • #6 Agent 需要工具之前的上下文
    MCP 给了 agent 调用工具的标准方式——这是真正的突破。但没有上下文的工具是盲目的。给 agent 几百个工具,它会选错、幻觉能力。

为什么这很重要

我们即将获得 1000 万 token 的上下文窗口。诱惑是把它当作解决方案——把一切都扔进去,让模型整理。

这不会有效——只是昂贵、缓慢,而且 probabilistically 错误,难以调试。

上下文问题不是容量问题。它是知道什么重要、东西如何连接、现在什么是相关的——确定性地,不只是可能地。

关键洞察

  • MCP 正在崛起,Agent 框架正在激增
  • 每个人都在构建工具集成,但几乎没人构建上下文层
  • 这就是差距——这差距将决定 AI agent 是变得真正有用,还是保持昂贵的玩具

← 返回洞察首页