Signals: Agent轨迹智能采样框架

来源: Hacker News + arXiv | 评分: 4.5★ | 日期: 2026-04-05

核心发现

提出一个轻量级、基于信号的框架,用于对Agent交互轨迹进行分类和优先排序。无需调用额外模型,仅通过计算实时交互中的廉价信号来识别可能有价值的交互。

🎯 核心洞见:在τ-bench基准上,基于信号的采样实现了82%的信息率,相比启发式过滤的74%和随机采样的54%显著提升,效率提升1.52倍。

信号分类体系

将信号组织成粗粒度分类:

技术细节

为什么重要

Agent轨迹数据量大且非确定性,逐一人工审查成本高昂。此框架提供了一种实用的采样基础设施,可以用低成本信号识别高价值轨迹,为构建偏好数据和持续优化agent系统开辟了新路径。

相关链接