Agent 实验

协议、harness 框架与智能体工程实验。

这里会整理我设计的几个 Agent 协议,以及围绕评测、协作、记忆、工具调用和任务执行 harness 的实验记录。

协议设计

用于沉淀 Agent 之间如何交换任务、状态、证据、工具结果与决策权的协议草案。

Agent Protocol Coordination Execution

Harness 框架

用于验证智能体行为的测试框架、运行环境、日志结构和可复现实验流程。

Evaluation Observability Reproducibility