MiroThinker: Pushing the Performance Boundaries of Open-Source Research Agents

AI Research Open Source Agent ⭐⭐⭐⭐⭐
来源: Hugging Face Papers · arxiv.org · 2025年11月

核心贡献

MiroThinker v1.0 是一个开源高性能研究agent,通过模型规模、上下文长度、交互深度三个维度提升性能。与传统LLM测试时间扩展不同,交互扩展利用环境反馈和外部信息获取来纠正错误和优化轨迹。

性能benchmark

81.9%
GAIA
37.7%
HLE
47.1%
BrowseComp
55.6%
BrowseComp-ZH

关键创新

  • 交互扩展 (Interactive Scaling): 第三维度性能提升,256K上下文支持最多600次工具调用
  • 强化学习训练: 通过RL实现高效交互扩展
  • 开源可用: 8B、30B、72B三种规模,代码和权重均已发布
  • 接近商业系统: 72B版本性能接近GPT-5-high

技术架构

  • ReAct范式: 推理→工具调用→观察的迭代循环
  • 工具接口: Linux沙箱、文件管理、网络搜索、信息提取
  • 上下文管理: 基于相关性的上下文保留机制

链接