TencentDB Agent Memory 为 AI Agent 提供长期记忆和短期记忆能力,让智能体能记住用户事实、偏好和任务上下文。围绕它的核心机制、评测数据、接入方式和落地风险,系统讲清 Agent 记忆模块该怎么设计。
Step 3.7 Flash 是一款面向生产级 Agent 场景的开源多模态模型,最高生成速度可达 400 TPS。围绕 Agent 链路效率、多模态理解、搜索能力、开源部署和接入方式,讲清它适合解决什么问题以及实际接入时要注意什么。
Agentic Engineering 关注如何把 AI Agent 变成可靠的软件工程协作者。核心方法不是让 AI 自由发挥,而是通过结构化上下文、明确分工、分阶段验证和知识沉淀,降低需求到代码过程中的信息损耗。
Claude Code 的这轮升级重点不在模型“更聪明”,而在命令行 AI 编程智能体是否足够稳定、可观察、可恢复。围绕全屏 TUI、流式输出、可读错误、上下文压缩、MCP 连接和会话自愈,系统梳理这些能力解决了哪些真实开发问题。
达尔文 Skill 2.0 通过 9 维评分、多评委独立审查、验证闸门、自动回滚和人工卡口,把 Agent Skill 的迭代变成可重复的工程流程。它适合没有明确 benchmark、但需要长期维护提示词和 workflow 文档的个人开发者场景。
「伯乐」是一个开源 AI 热点聚合 Skill,用来从多个信息源抓取 AI 动态,并通过信息源健康检查、AI 相关性过滤、事件合并和可信度打分,减少重复阅读同一条消息的问题。
Agent 的可靠性不只取决于模型能力,还取决于模型外部的执行环境、工具协议、上下文管理、编排、可观测性、评估和治理。这里用 ETCLOVG 七层架构系统讲清 Harness Engineering 的设计方法和落地检查项。
围绕近期热度较高的 9 个 AI 工程开源项目,梳理它们分别解决什么问题、核心机制是什么、适合哪些场景,以及科研写作、代码理解、Agent 工程化、端侧语音和 AI 视频生成中的选型思路。
Claude Code 用在数仓开发时,常见问题是上下文压缩后遗忘约束、SQL 规范执行不稳定、高 token 操作污染主会话。围绕 Harness、Hooks、Subagents、CLAUDE.md 和 SKILL 改造,可以把 AI 编码从临时对话升级为可验证、可持久化、可隔离的研发流水线。
Skill 不只是 prompt,而是一套由说明、资料、脚本和评测共同组成的能力单元。通过 8 阶段迭代循环、三层评测、5 维 AND 门控和 Trace 诊断,可以把 Skill 当成可训练对象,让它在数据和指标约束下自动改进。