Agent 实验
这里会整理我设计的几个 Agent 协议,以及围绕评测、协作、记忆、工具调用和任务执行 harness 的实验记录。
协议设计
用于沉淀 Agent 之间如何交换任务、状态、证据、工具结果与决策权的协议草案。
Agent Protocol Coordination ExecutionHarness 框架
用于验证智能体行为的测试框架、运行环境、日志结构和可复现实验流程。
Evaluation Observability Reproducibility这里会整理我设计的几个 Agent 协议,以及围绕评测、协作、记忆、工具调用和任务执行 harness 的实验记录。
用于沉淀 Agent 之间如何交换任务、状态、证据、工具结果与决策权的协议草案。
Agent Protocol Coordination Execution用于验证智能体行为的测试框架、运行环境、日志结构和可复现实验流程。
Evaluation Observability Reproducibility