归档

2025 年 10 月

从媒体中心、个人数据时间线、可视化 AI 智能体、体素沙盒游戏,到自然语言控制浏览器和电子健康记录系统,系统梳理 7 个开源项目的核心能力、工作方式、适合场景和上手要点。
Agentic Context Engineering 将系统提示、记忆、工具经验和领域规则组织成可持续演化的“作战手册”,让大型语言模型在不更新参数的情况下通过执行反馈改进表现。这里讲清 ACE 的问题背景、生成器-反思器-整编器架构、增量更新机制、实验结果和适用边界。
介绍如何让 Claude Code 使用智谱 GLM-4.6 作为编程模型,并通过 MCP 接入视觉理解和联网搜索能力。内容包括 API Key 获取、环境变量配置、MCP 服务配置、测试方法和常见排错。
Claude Code 可以通过周边工具扩展出用量监控、多智能体协作和图形化聊天能力。这里拆解 Claude Code Usage Monitor、Claude-Flow 和 claude-code-chat 的功能定位、适用场景、安装方式与使用注意点。
Nano Banana 可以把图像生成和图像编辑能力接入到 Web 工具中。这里讲解 Nano Bananary 和 BananaFace 两个开源项目的功能定位、工作方式、适用场景,以及 BananaFace 的本地运行步骤。
出国点餐不是简单把菜单翻译成中文,而是要识别菜品、解释口味、规避过敏食材,并生成可直接给服务员看的点单内容。围绕一个 AI 点餐助手,系统拆解多模态识别、结构化菜单、个性化推荐、语音下单和实时对话翻译的产品与工程设计。
大模型 Agentic 推理框架把 LLM 组织成能规划、执行、调用工具、反思和协作的智能体系统。围绕单智能体、工具增强智能体、多智能体三层结构,讲清核心机制、典型架构、应用场景、评测方法和落地风险。
概念描述是一种用自然语言解释大语言模型内部组件功能的方法。它不再依赖固定标签,而是借助另一个语言模型为神经元、注意力头、SAE 特征和电路生成开放词汇解释,并通过预测、干预和人工评估检验解释是否可靠。
5 个 GitHub 开源工具覆盖跨语言视频制作、视频超分辨率、PDF 编辑、点对点文件传输和视频转录摘要等场景。每个工具都从解决的问题、核心功能、适用场景和上手方式讲清楚,方便按需求选型。

2025 年 09 月

GraphRAG 把文档切块后抽取实体、关系和声明,构建知识图并用社区检测生成分层摘要,再通过 Map-Reduce 回答面向整个语料库的问题。内容涵盖简单 RAG 的局限、索引流程、查询流程、评估结果和落地注意事项。