简介
MiroThinker 是一套面向深度研究场景的开源 Agent 栈,强调长上下文、密集工具调用和基准成绩,适合希望复现实验、研究配置并系统评估研究型 Agent 能力边界与操作成本的团队。
- 适合谁: 要评估长链路、重工具开源研究 Agent 的研究团队
- 可搭配: Python 3.10+、uv、E2B 沙箱、Serper、Jina、摘要模型与 YAML agent 配置
- 准备时间: 30-60 分钟
实战建议
- 量化信息:README 为 MiroThinker-1.7 标注了 256K 上下文与单任务最多 300 次工具调用;更早版本甚至写到 600 次。
- 量化信息:README 同时给出 BrowseComp 74.0、BrowseComp-ZH 75.3 等成绩,并列出了最小工具集所需的多项环境变量。
为什么值得收录
MiroThinker 更像“研究复现实验栈”而不是即装即用聊天助手,而这恰恰是它的价值所在。
- README 对上下文长度、工具调用次数和基准分数给得很具体,方便评估者做可量化判断。
- 最小配置段把搜索、抓取和执行所需的工具服务器写得很清楚。
- 预配置 YAML 能帮助你在不同实验之间复用编排,而不是每次重新搭框架。
落地路径
- 先严格按最小工具集复现,不要一开始就叠加可选工具。
- 每次运行都记录环境变量与配置文件,保证实验笔记可复验。
- 把它当作研究型 Agent 的操作学习样本,而不是轻量聊天工具替代品。
注意事项
它的活动部件明显多于普通 Agent,若不把密钥和配置记录清楚,失败往往会变得噪音很大、难以复盘。
FAQ
它是简单的本地聊天应用吗? 答:不是。README 把它定义为需要多种服务与配置的工具增强型研究 Agent。
为什么值得研究? 答:因为它公开了上下文、工具调用和 benchmark 这些可量化事实,适合复现实验。
第一步该验证什么? 答:先验证 1 个推荐 YAML 配置和最小三工具组合。