MiroThinker: Pushing the Performance Boundaries of Open-Source Research Agents
核心贡献
MiroThinker v1.0 是一个开源高性能研究agent,通过模型规模、上下文长度、交互深度三个维度提升性能。与传统LLM测试时间扩展不同,交互扩展利用环境反馈和外部信息获取来纠正错误和优化轨迹。
性能benchmark
81.9%
GAIA
37.7%
HLE
47.1%
BrowseComp
55.6%
BrowseComp-ZH
关键创新
- 交互扩展 (Interactive Scaling): 第三维度性能提升,256K上下文支持最多600次工具调用
- 强化学习训练: 通过RL实现高效交互扩展
- 开源可用: 8B、30B、72B三种规模,代码和权重均已发布
- 接近商业系统: 72B版本性能接近GPT-5-high
技术架构
- ReAct范式: 推理→工具调用→观察的迭代循环
- 工具接口: Linux沙箱、文件管理、网络搜索、信息提取
- 上下文管理: 基于相关性的上下文保留机制