归档 - 全栈研发笔记

用 pdf2skill 把 PDF 专业资料编译成 Claude Code 和 OpenCode 技能包

2026-02-20

人工智能 #pdf2skill #Claude Code #OpenCode #SKILL #PDF #知识结构化

pdf2skill 可以把 PDF 书籍、手册、报告和规范转换为 Claude Code 或 OpenCode 可加载的技能包。围绕它要解决的问题、编译流程、技能包结构、适用场景和使用方法，讲清 PDF 如何从静态文档变成可复用的 AI 工作流。

用 LobsterAI 搭建 OpenClaw 桌面 Agent：信息流摘要、需求挖掘与新闻聚合

2026-02-19

人工智能 #OpenClaw #LobsterAI #AI Agent #Skills #定时任务 #沙箱 #信息流聚合

LobsterAI 是一个面向 OpenClaw 的桌面客户端，提供模型切换、Skills 管理、定时任务、本地与 VM 沙箱切换以及多平台消息集成。围绕 Reddit 摘要、近 30 天需求挖掘和科技新闻聚合三个任务，讲清桌面 Agent 如何自动读取、整理和分发全网信息。

6 个面向 LLM 应用开发的 GitHub 开源项目：信息抽取、Agent 工作流与本地搜索

2026-02-19

人工智能 #LLM #AI Agent #RAG #MCP #GitHub Actions #Ollama #Chrome DevTools #信息抽取

6 个 GitHub 开源项目覆盖 LLM 应用开发中的信息抽取、AI 工作流、Agent 工具链、案例学习、浏览器自动化和本地知识库搜索场景，适合用来搭建从原型到自动化工具的完整开发链路。

repo2skill 使用指南：把 GitHub、GitLab、Gitee 仓库转换成 AI 技能

2026-02-18

人工智能 #repo2skill #OpenCode #Claude Code #AI Skill #GitHub #GitLab #Gitee

repo2skill 可以把开源仓库转换成 OpenCode 或 Claude Code 可识别的技能文档。这里讲清它的用途、工作流程、安装路径、使用方式、私有仓库配置和适合场景。

nanoclaw：500 行 TypeScript 实现的安全隔离 Claude 个人助手

2026-02-14

人工智能 #nanoclaw #Claude #TypeScript #Node.js #AI Agent #Sandbox #macOS Containers

nanoclaw 是一个轻量级 Claude 个人助手框架，用约 500 行 TypeScript 实现核心逻辑。它把每个会话和任务放进 macOS 原生容器中运行，用文件系统隔离降低本地 AI Agent 执行命令时误删或破坏宿主机的风险。

LangChain DeepAgents Sandboxes：隔离执行环境的设计与安全边界

2026-02-14

人工智能 #LangChain #deepagents #Sandbox #AI Agent #代码执行 #安全隔离

LangChain DeepAgents 的 Sandboxes 为 AI 代理提供隔离的代码执行环境，使代理可以运行命令、读写文件、安装依赖和执行测试。核心设计围绕 execute() 展开，同时通过文件工具和外部传输通道区分代理内部操作与宿主文件交换。

用 Spring AI Alibaba 构建 ReAct 与 Plan-Execute Multi-Agent 系统

2026-02-13

后端 #Spring AI Alibaba #Spring AI #Multi-Agent #ReAct #Plan-Execute #Graph #Java

Spring AI Alibaba 在框架层提供了 ReAct Agent、Graph 编排和 Multi-Agent 支持。围绕 ReAct、顺序/并行多智能体、Plan-Execute 三阶段架构，讲清 Java 项目中如何用它搭建可扩展的智能体系统。

2026 年 AI 模型能力的六条技术主线：从 Agent 工程到具身智能

2026-02-13

人工智能 #大模型 #AI Agent #VLA #具身智能 #图像编辑 #AI安全 #强化学习

2026 年 AI 模型竞争正在从聊天能力转向工程执行、图像编辑、具身操作、私有智能体、数学科研和安全评估。围绕 GLM-5、MiniMax M2.5、FireRed-Image-Edit、Xiaomi-Robotics-0、ABot、Aletheia 等案例，拆解模型能力升级背后的技术路线和落地约束。

FireRed-Image-Edit 的图像编辑模型设计：数据引擎、三阶段训练与文字编辑奖励

2026-02-12

人工智能 #FireRed-Image-Edit #图像编辑 #扩散模型 #OCR #强化学习 #RedEdit Bench #多模态

FireRed-Image-Edit 是一个面向复杂指令图像编辑的开源基础模型，重点提升指令遵循、主体一致性、文字编辑、多图参考和画质修复能力。核心设计包括规模化编辑数据引擎、三阶段训练流程，以及面向文字布局的 OCR 奖励机制。

FireRed-OpenStoryline 架构解析：用 MCP 构建可交互的视频剪辑 Agent

2026-02-10

人工智能 #FireRed-OpenStoryline #视频剪辑 #Agent #MCP #LLM #VLM #Human-in-the-loop

FireRed-OpenStoryline 是一个开源视频剪辑 Agent，能够理解素材、规划故事线、调用剪辑工具，并通过自然语言接受用户修改。它的关键设计包括 Agent Client、Storyline Middleware、MCP Server、资源库和可复用的 Editing Skill。

菜单

归档

2026 年 02 月

Loop Engineering：让 Agent 自己完成开发、验证与迭代

Claude Code 可靠性升级：TUI、流式输出、MCP 与会话自愈机制解析

Agent Harness Engineering 七层架构：把大模型变成可靠 Agent 的工程方法

从 Prompt 到 Agent Loop：让 AI Agent 稳定工作的循环设计方法

达尔文 Skill 2.0：面向个人开发者的 Agent Skill 自进化优化器

8 个能控制电脑的开源 AI Agent 项目对比

Claude Fable 5首日实测，杀疯了…

Step 3.7 Flash 面向 Agent 的高吞吐开源多模态模型上手指南

从 Prompt、Context 到 Harness：OpenClaw Agent 架构设计拆解

Agentic Engineering：让 AI Agent 可靠参与软件研发的六条实践