Signals: Agent轨迹智能采样框架
核心发现
提出一个轻量级、基于信号的框架,用于对Agent交互轨迹进行分类和优先排序。无需调用额外模型,仅通过计算实时交互中的廉价信号来识别可能有价值的交互。
🎯 核心洞见:在τ-bench基准上,基于信号的采样实现了82%的信息率,相比启发式过滤的74%和随机采样的54%显著提升,效率提升1.52倍。
信号分类体系
将信号组织成粗粒度分类:
- 交互层面:错位(stagnation)、停滞(misalignment)、脱离(disengagement)、满意度(satisfaction)
- 执行层面:失败(failure)、循环(loop)
- 环境层面:耗尽(exhaustion)
技术细节
- 计算成本:无需模型调用,纯规则计算
- 应用场景:偏好数据构建、部署后优化
- 优势:跨奖励层级和任务领域都保持鲁棒性
为什么重要
Agent轨迹数据量大且非确定性,逐一人工审查成本高昂。此框架提供了一种实用的采样基础设施,可以用低成本信号识别高价值轨迹,为构建偏好数据和持续优化agent系统开辟了新路径。