用 Tair 构建 AI Agent 短期记忆系统:数据模型、并发控制与弹性扩展

AI Agent 在多轮对话和工具调用中需要快速读取并更新短期记忆。围绕一句话点外卖场景,讲清楚如何用 Tair 设计会话记忆的数据模型、并发控制、过期清理和弹性扩展方案。

发布于 2026-03-27

用 OpenClaw 构建可自我迭代的银行客户经理 AI 助手

OpenClaw 可以用身份文件、长期记忆、Heartbeat、Cron 和 Skill 组合出一个能收集反馈、反思并更新自己的专属智能体。围绕银行客户经理助手场景,讲清核心文件设计、自我迭代闭环、跨 Agent 测试和评估 Skill 的落地方式。

发布于 2026-03-27

Harness Engineering:为 AI Agent 搭建可控的工程运行环境

Harness Engineering 关注的不是单次提示词,而是围绕 AI Agent 搭建上下文、工具、权限、约束、反馈和质量检查体系。它能让同一个模型在更可控的环境里完成复杂工程任务,并降低 AI 生成代码的维护风险。

发布于 2026-03-27

Agent Harness:让智能体稳定完成长周期任务的运行框架

Agent Harness 是包在智能体外层的运行框架,用来提供任务分解、上下文管理、工具调用、安全边界和自动评估。它解决的是大语言模型在长周期任务中容易遗忘、偏航、自评过宽和破坏架构约束的问题。

发布于 2026-03-26

Harness Engineering:构建可靠 AI Agent 的系统方法

Harness Engineering 关注的是大语言模型外围的运行系统,包括上下文、工具、编排、安全、评估和观测。它决定了 AI Agent 能看到什么、能调用什么、如何规划任务、如何验证结果,以及失败后如何继续改进。

发布于 2026-03-26

四个 GitHub AI Skill 项目拆解:从压力提示到多 Agent 朝堂工作流

围绕 PUA、PUAClaw、noPua、edict 四个 GitHub 项目,拆解 AI Skill 如何通过系统提示、分类体系、正向方法论和多 Agent 流程影响大模型行为,并给出适用场景、风险和上手方式。

发布于 2026-03-26

用腾讯云可观测平台监控 OpenClaw:Trace、Metrics 与 Token 成本分析

OpenClaw 运行时会涉及 Agent 执行、大语言模型推理、工具调用、消息队列和会话管理等链路。通过腾讯云可观测平台、OpenTelemetry、openclaw-tencent-plugin 和 diagnostics-otel,可以把请求链路、系统指标和 Token 消耗统一接入监控平台,方便排障、控成本和做告警。

发布于 2026-03-26

OpenClaw Agent 运行时架构:沙箱、记忆、技能、会话与配置管理

OpenClaw 是一套面向本地优先和企业场景的 AI Agent 运行时。围绕沙箱隔离、文件化记忆、技能扩展、会话管理、自进化机制、安全边界和分层配置,系统可以把 Agent 的能力控制在可审计、可扩展、可持久化的工程框架内。

发布于 2026-03-26

SkillRouter:面向大规模 Agent 技能池的检索与重排序方案

大规模 Agent 技能池会带来技能选择困难,名称和描述往往不足以区分相似技能。SkillRouter 通过完整技能 body、双编码器检索、交叉编码器重排序和任务微调,在约 8 万技能池上用 1.2B 参数超过 8B 零样本基线。

发布于 2026-03-26

LLM 推理中的 KV Cache:从注意力计算到显存开销

KV Cache 通过复用已经计算过的 Key 和 Value,避免大模型生成时反复处理历史 token。内容覆盖自注意力计算、prefill 和 decode 两个阶段、复杂度变化、显存开销公式、Hugging Face 使用方法以及常见优化方向。

发布于 2026-03-26