Deep Research Agent 要稳定完成多工具协同,不能只依赖通用模型的原生 Function Calling。围绕 FC-SFT 冷启动链路,讲清种子数据构造、Teacher 轨迹生成、质量过滤、防遗忘混合训练和评估闭环。
多轮 Tool Use 数据是训练 AI Agent 的关键燃料,但真实业务场景下很难直接获得。围绕租赁导购助手场景,讲清如何用“导演-演员”多智能体框架合成多轮对话、复杂问题和工具调用轨迹,并通过过滤、线上回流和训练评测形成数据闭环。