AI 租赁导购需要理解复杂需求、稳定调用商品搜索和知识检索等工具,并把工具结果组织成可信回答。围绕 One-Model + Tool-Use 架构、多阶段强化学习、差异化 GSPO 裁剪以及 MoE 训练推理优化,讲清一套可落地的训练与工程方案。