归档

2025 年 10 月

2025-10-11

开源项目 #GitHub #Stremio #Timelinize #Flowise #Playwright #Gemini #OpenEMR

从媒体中心、个人数据时间线、可视化 AI 智能体、体素沙盒游戏，到自然语言控制浏览器和电子健康记录系统，系统梳理 7 个开源项目的核心能力、工作方式、适合场景和上手要点。

Agentic Context Engineering：用可演化上下文让 LLM 无需微调持续改进

2025-10-11

人工智能 #Agentic Context Engineering #LLM #上下文工程 #智能体 #提示词优化 #长上下文 #KV 缓存

Agentic Context Engineering 将系统提示、记忆、工具经验和领域规则组织成可持续演化的“作战手册”，让大型语言模型在不更新参数的情况下通过执行反馈改进表现。这里讲清 ACE 的问题背景、生成器-反思器-整编器架构、增量更新机制、实验结果和适用边界。

用 Claude Code 接入智谱 GLM-4.6：API 配置、视觉理解与联网搜索

2025-10-10

人工智能 #Claude Code #智谱AI #GLM-4.6 #MCP #API Key #AI编程 #视觉理解 #联网搜索

介绍如何让 Claude Code 使用智谱 GLM-4.6 作为编程模型，并通过 MCP 接入视觉理解和联网搜索能力。内容包括 API Key 获取、环境变量配置、MCP 服务配置、测试方法和常见排错。

3 个 Claude Code 开源工具：用量监控、多智能体编排与 VS Code 聊天界面

2025-10-08

人工智能 #Claude Code #GitHub #开源项目 #Token 监控 #多智能体 #MCP #VS Code

Claude Code 可以通过周边工具扩展出用量监控、多智能体协作和图形化聊天能力。这里拆解 Claude Code Usage Monitor、Claude-Flow 和 claude-code-chat 的功能定位、适用场景、安装方式与使用注意点。

用 Nano Banana 做无提示词图像生成：Nano Bananary 与 BananaFace 上手指南

2025-10-05

人工智能 #Nano Banana #Gemini #Veo3 #图像生成 #图像编辑 #BananaFace #Node.js

Nano Banana 可以把图像生成和图像编辑能力接入到 Web 工具中。这里讲解 Nano Bananary 和 BananaFace 两个开源项目的功能定位、工作方式、适用场景，以及 BananaFace 的本地运行步骤。

多模态大模型驱动的出国点餐助手：从菜单识别到语音下单的产品架构

2025-10-04

人工智能 #多模态大模型 #OCR #菜单翻译 #语音合成 #实时翻译 #Prompt Engineering #AI 应用

出国点餐不是简单把菜单翻译成中文，而是要识别菜品、解释口味、规避过敏食材，并生成可直接给服务员看的点单内容。围绕一个 AI 点餐助手，系统拆解多模态识别、结构化菜单、个性化推荐、语音下单和实时对话翻译的产品与工程设计。

大模型 Agentic 推理框架：单智能体、工具调用与多智能体协作

2025-10-04

人工智能 #大语言模型 #AI Agent #Agentic Reasoning #工具调用 #多智能体 #Prompt 工程 #自我反思 #评测体系

大模型 Agentic 推理框架把 LLM 组织成能规划、执行、调用工具、反思和协作的智能体系统。围绕单智能体、工具增强智能体、多智能体三层结构，讲清核心机制、典型架构、应用场景、评测方法和落地风险。

用概念描述解释大语言模型内部机制：从神经元到电路

2025-10-03

人工智能 #LLM #可解释性 #概念描述 #稀疏自编码器 #注意力头 #因果评估

概念描述是一种用自然语言解释大语言模型内部组件功能的方法。它不再依赖固定标签，而是借助另一个语言模型为神经元、注意力头、SAE 特征和电路生成开放词汇解释，并通过预测、干预和人工评估检验解释是否可靠。

5 个实用 GitHub 开源工具：视频翻译、视频超分、PDF 处理与 WebRTC 文件传输

2025-10-02

开源项目 #GitHub #pyvideotrans #Video2X #PDFPatcher #WebRTC #Faster-Whisper #PDF

5 个 GitHub 开源工具覆盖跨语言视频制作、视频超分辨率、PDF 编辑、点对点文件传输和视频转录摘要等场景。每个工具都从解决的问题、核心功能、适用场景和上手方式讲清楚，方便按需求选型。

2025 年 09 月

GraphRAG：用知识图谱社区摘要回答全局问题

2025-09-26

人工智能 #GraphRAG #RAG #LLM #知识图谱 #查询聚焦摘要 #社区检测 #Leiden算法 #Map-Reduce

GraphRAG 把文档切块后抽取实体、关系和声明，构建知识图并用社区检测生成分层摘要，再通过 Map-Reduce 回答面向整个语料库的问题。内容涵盖简单 RAG 的局限、索引流程、查询流程、评估结果和落地注意事项。

菜单

归档

2025 年 10 月

2025 年 09 月

Loop Engineering：让 Agent 自己完成开发、验证与迭代

Claude Code 可靠性升级：TUI、流式输出、MCP 与会话自愈机制解析

Agent Harness Engineering 七层架构：把大模型变成可靠 Agent 的工程方法

达尔文 Skill 2.0：面向个人开发者的 Agent Skill 自进化优化器

8 个能控制电脑的开源 AI Agent 项目对比

从 Prompt 到 Agent Loop：让 AI Agent 稳定工作的循环设计方法

Step 3.7 Flash 面向 Agent 的高吞吐开源多模态模型上手指南

Claude Fable 5首日实测，杀疯了…

从 Prompt、Context 到 Harness：OpenClaw Agent 架构设计拆解

Agentic Engineering：让 AI Agent 可靠参与软件研发的六条实践