FunctionGemma 工具调用微调实战:让模型正确选择业务工具

FunctionGemma 可以把自然语言请求转换为函数调用,但通用模型不一定理解企业内部的工具选择策略。这里用“内部知识库搜索”和“Google 搜索”的路由任务,讲清 FunctionGemma 微调的原因、数据准备方式、训练流程、评估方法,以及 FunctionGemma Tuning Lab 的无代码使用方式。

发布于 2026-02-03

OpenClaw 本地优先 Agent 运行时:架构、记忆与上下文组装机制

OpenClaw 是一个本地优先的 AI Agent 运行时,把大语言模型、消息通道、本地文件、Shell、浏览器和长期记忆连接起来。内容拆解它的本地架构、ReAct 编排、分层记忆、System Prompt 组装方式,以及适合和不适合的使用场景。

发布于 2026-02-03

企业级大模型网关设计:统一接入、模型调度、成本治理与稳定性保障

企业接入多个大语言模型后,会遇到接口碎片化、成本失控、数据安全和稳定性问题。围绕模型市场、统一 API、模型调度、Token 成本治理、限流告警和 Key 生命周期,系统讲解企业级大模型网关的设计方法。

发布于 2026-02-02

生产级 Prompt 自动评估 A/B 实验结果的决策树设计

A/B 实验数量增长后,人工巡检会遇到效率、稳定性和一致性问题。围绕生产级 Prompt 自动推理方案,讲清如何用大语言模型评估实验结果、设计六层优先级决策树、处理 Bad Case,并让输出结果可解释、可回归测试。

发布于 2026-02-02

Clawdbot 高 Token 消耗的架构原因与降本方案

Clawdbot/OpenClaw 的高 Token 消耗主要来自系统提示词、ReAct 多轮循环、工具结果回灌和反射重试。围绕这些成本来源,拆解计算模型、典型场景和缓存、工作流、上下文压缩、工具裁剪、模型路由等降本手段。

发布于 2026-02-01

用 Agent Studio 搭建企业微信可访问的个人 Agent 工作台

讲解 Agent Studio 如何把本地 AI Agent 接入企业微信,并通过隧道、A2A 网关、MCP Admin 和定时任务形成个人 Agent 工作台。包含安装配置、调用流程、适用场景以及与 OpenClaw 的差异。

发布于 2026-01-30

OpenSkills 入门:用 SKILL.md 定义可控的 AI Agent 技能调用

OpenSkills 把技能定义、匹配、资源加载和脚本执行拆成透明流程,适合把 AI Agent 能力集成到自己的 Python 项目。内容覆盖三层渐进式加载、SKILL.md 写法、脚本沙箱、Reference 加载模式和周报生成年度复盘的完整示例。

发布于 2026-01-30

Moltbot 动态记忆架构:用三层文件系统和 Supermemory 让 AI Agent 持续更新上下文

AI Agent 只靠静态记忆文件很容易保存过时信息。这里讲解 Moltbot 的三层动态记忆架构:知识图谱、每日笔记和隐性知识,并说明如何通过定时事实提取、每周综合整理和 Supermemory 集成,让 Agent 的上下文长期保持可读、可搜索、可更新。

发布于 2026-01-30

UltraRAG 3.0:用 YAML 和 MCP 搭建可观察的 RAG 应用

UltraRAG 3.0 是一个基于 MCP 的轻量级 RAG 开发框架,用 YAML 描述推理流程,用组件化方式组织检索、重排、生成等环节。它适合知识库问答、DeepResearch、多轮推理等需要透明编排和快速迁移的场景。

发布于 2026-01-29

用钉钉 Stream 模式接入私有 Clawdbot 并控制 Chrome

钉钉 Stream 模式可以让私有 Clawdbot 在没有公网 IP 的环境中接收消息。这里完整讲解钉钉机器人接入、Chrome 扩展控制浏览器、搜索结果回传、常见故障排查和安全配置。

发布于 2026-01-29