归档 - 全栈研发笔记

VoxCPM 0.5B：轻量级零样本语音克隆模型与部署入门

2025-09-18

人工智能 #VoxCPM #TTS #语音克隆 #MiniCPM #扩散模型 #RTF #Hugging Face

VoxCPM 是清华大学与面壁智能开源的 0.5B 文本转语音模型，支持零样本语音克隆和流式输出。这里讲清它的能力、评测指标、模型结构、推理流程，以及如何安装、下载模型并用 Python 生成语音。

Qwen Code 的 Agentic Coding 机制：Prompt、工具调用与任务管理如何协同工作

2025-09-18

人工智能 #Qwen Code #Agentic Coding #Prompt Engineering #Tool Use #CLI #TodoWriteTool #MCP #Qwen3-Coder

Qwen Code 是面向软件工程任务的命令行智能体工具。它通过系统 Prompt 约束模型行为，再结合文件读写、代码搜索、Shell、任务清单、MCP 等工具，让模型能够规划任务、修改代码、运行测试并根据反馈继续迭代。

DeepSeek-R1 的强化学习路线：从 R1-Zero 到可评审的大模型推理

2025-09-17

人工智能 #DeepSeek-R1 #大语言模型 #强化学习 #GRPO #思维链 #同行评审 #模型安全

DeepSeek-R1 展示了一条以强化学习激发大语言模型推理能力的路线：先让模型在可验证任务中试错，再通过多阶段训练改善可读性、通用能力和安全性。围绕 R1-Zero、GRPO、多阶段 pipeline、评测与同行评审，梳理这套方法为什么重要。

用 Mem0 和 Milvus 构建具备长期记忆的 AI Agent

2025-09-17

人工智能 #Mem0 #Milvus #RAG #向量数据库 #LangGraph #长期记忆 #图谱记忆

Mem0 可以为 AI Agent 提供跨会话的长期记忆能力，Milvus 负责持久化存储和检索语义向量。这里会讲清 Mem0 的记忆机制、它和 RAG 的区别，以及如何结合 DashScope、LangGraph、Milvus 和 Kuzu 构建带长期记忆与图谱记忆的 AI 应用。

豆包 Seedream 4.0：文生图、图像编辑和多图融合能力解析

2025-09-16

人工智能 #Seedream 4.0 #豆包 #文生图 #图像编辑 #多图融合 #中文渲染 #火山引擎 API

豆包 Seedream 4.0 是字节跳动推出的一站式图像生成与编辑模型，支持文生图、图像编辑、多图融合、连续分镜和中文文字重绘。这里从能力边界、典型工作流、提示词写法和 API 接入方式几个角度讲清它适合解决哪些图像创作问题。

Claude Code 为什么选择 grep 而不是代码索引：无状态设计的工程取舍

2025-09-16

后端 #Claude Code #grep #代码搜索 #无状态设计 #RAG #向量索引 #Unix

Claude Code 没有把预构建代码索引作为核心能力，而是更依赖 glob、grep 等实时搜索工具。围绕这个选择，可以理解无状态设计在可组合性、确定性、隐私和维护成本上的优势，以及它与向量索引、传统 IDE 索引各自适合的场景。

MySQL 单表 2000 万行建议值的计算逻辑

2025-09-15

后端 #MySQL #InnoDB #B+树 #数据页 #聚簇索引 #Buffer Pool #分库分表

2000 万行并不是 MySQL 单表硬上限，而是基于 InnoDB 16KB 数据页、B+树高度和单行大小推导出来的经验值。理解数据页、聚簇索引和扇出之后，就能判断自己的表什么时候需要拆分或归档。

4 个可自部署的开源工具：AI PPT、个人知识库、网页生成与长语音合成

2025-09-13

开源项目 #Presenton #Trilium #Claudable #VibeVoice #Next.js #TTS #Ollama #Markdown

4 个开源项目覆盖本地 AI PPT 生成、个人知识库、自然语言生成 Next.js 应用和长篇多人语音合成。重点讲清每个工具解决的问题、工作方式、适合场景和上手路径。

从主流 AI 助手系统提示词看 Prompt 工程的 5 个设计模式

2025-09-12

人工智能 #Prompt Engineering #System Prompt #大语言模型 #AI Agent #Tool Calling #安全策略

系统提示词决定了 AI 助手的角色、边界、工具调用方式和安全约束。围绕公开收集的 ChatGPT、Claude、Gemini、Grok 等系统提示词样本，拆解模块化结构、边界控制、动态工具调用、人格配置和安全机制的设计方法。

用 Lovart 和 Nano Banana 批量生成知识卡片海报的完整流程

2025-09-10

人工智能 #Lovart #Nano Banana #AI 设计 #知识卡片 #批量生成 #提示词工程

用 Lovart 负责版式设计和批量编排，用 Nano Banana 负责生成背景、插画和视觉元素，可以把知识点批量做成统一风格的卡片海报。核心不是反复改图，而是先设计模板、结构化内容，再用稳定提示词生成一组可复用素材。

菜单

归档

2025 年 09 月

Loop Engineering：让 Agent 自己完成开发、验证与迭代

Claude Code 可靠性升级：TUI、流式输出、MCP 与会话自愈机制解析

Agent Harness Engineering 七层架构：把大模型变成可靠 Agent 的工程方法

达尔文 Skill 2.0：面向个人开发者的 Agent Skill 自进化优化器

8 个能控制电脑的开源 AI Agent 项目对比

从 Prompt 到 Agent Loop：让 AI Agent 稳定工作的循环设计方法

Step 3.7 Flash 面向 Agent 的高吞吐开源多模态模型上手指南

Claude Fable 5首日实测，杀疯了…

从 Prompt、Context 到 Harness：OpenClaw Agent 架构设计拆解

Agentic Engineering：让 AI Agent 可靠参与软件研发的六条实践