归档

2026 年 02 月

pdf2skill 可以把 PDF 书籍、手册、报告和规范转换为 Claude Code 或 OpenCode 可加载的技能包。围绕它要解决的问题、编译流程、技能包结构、适用场景和使用方法,讲清 PDF 如何从静态文档变成可复用的 AI 工作流。
LobsterAI 是一个面向 OpenClaw 的桌面客户端,提供模型切换、Skills 管理、定时任务、本地与 VM 沙箱切换以及多平台消息集成。围绕 Reddit 摘要、近 30 天需求挖掘和科技新闻聚合三个任务,讲清桌面 Agent 如何自动读取、整理和分发全网信息。
6 个 GitHub 开源项目覆盖 LLM 应用开发中的信息抽取、AI 工作流、Agent 工具链、案例学习、浏览器自动化和本地知识库搜索场景,适合用来搭建从原型到自动化工具的完整开发链路。
repo2skill 可以把开源仓库转换成 OpenCode 或 Claude Code 可识别的技能文档。这里讲清它的用途、工作流程、安装路径、使用方式、私有仓库配置和适合场景。
nanoclaw 是一个轻量级 Claude 个人助手框架,用约 500 行 TypeScript 实现核心逻辑。它把每个会话和任务放进 macOS 原生容器中运行,用文件系统隔离降低本地 AI Agent 执行命令时误删或破坏宿主机的风险。
LangChain DeepAgents 的 Sandboxes 为 AI 代理提供隔离的代码执行环境,使代理可以运行命令、读写文件、安装依赖和执行测试。核心设计围绕 execute() 展开,同时通过文件工具和外部传输通道区分代理内部操作与宿主文件交换。
Spring AI Alibaba 在框架层提供了 ReAct Agent、Graph 编排和 Multi-Agent 支持。围绕 ReAct、顺序/并行多智能体、Plan-Execute 三阶段架构,讲清 Java 项目中如何用它搭建可扩展的智能体系统。
2026 年 AI 模型竞争正在从聊天能力转向工程执行、图像编辑、具身操作、私有智能体、数学科研和安全评估。围绕 GLM-5、MiniMax M2.5、FireRed-Image-Edit、Xiaomi-Robotics-0、ABot、Aletheia 等案例,拆解模型能力升级背后的技术路线和落地约束。
FireRed-Image-Edit 是一个面向复杂指令图像编辑的开源基础模型,重点提升指令遵循、主体一致性、文字编辑、多图参考和画质修复能力。核心设计包括规模化编辑数据引擎、三阶段训练流程,以及面向文字布局的 OCR 奖励机制。
FireRed-OpenStoryline 是一个开源视频剪辑 Agent,能够理解素材、规划故事线、调用剪辑工具,并通过自然语言接受用户修改。它的关键设计包括 Agent Client、Storyline Middleware、MCP Server、资源库和可复用的 Editing Skill。