Signals: Agent轨迹智能采样框架

来源: Hacker News + arXiv | 评分: 4.5★ | 日期: 2026-04-05

核心发现

提出一个轻量级、基于信号的框架，用于对Agent交互轨迹进行分类和优先排序。无需调用额外模型，仅通过计算实时交互中的廉价信号来识别可能有价值的交互。

🎯 核心洞见：在τ-bench基准上，基于信号的采样实现了82%的信息率，相比启发式过滤的74%和随机采样的54%显著提升，效率提升1.52倍。

信号分类体系

将信号组织成粗粒度分类：

交互层面：错位(stagnation)、停滞(misalignment)、脱离(disengagement)、满意度(satisfaction)
执行层面：失败(failure)、循环(loop)
环境层面：耗尽(exhaustion)

技术细节

计算成本：无需模型调用，纯规则计算
应用场景：偏好数据构建、部署后优化
优势：跨奖励层级和任务领域都保持鲁棒性

为什么重要

Agent轨迹数据量大且非确定性，逐一人工审查成本高昂。此框架提供了一种实用的采样基础设施，可以用低成本信号识别高价值轨迹，为构建偏好数据和持续优化agent系统开辟了新路径。

相关链接