AI Infra 六个关键方向:从分布式推理到 Agent 沙箱

AI Infra(人工智能基础设施)的优化重点正在从单纯堆硬件,转向模型、系统、网络、编译器和运行时的协同设计。围绕分布式推理、Tile 编程、RL 训推分离、模型系统协同、Agent Infra 和超节点硬件六个方向,梳理大模型训练与推理基础设施的核心机制。

发布于 2026-01-23

4 个开源 AI Skills:视频剪辑、文本润色、小红书发布与一键安装

AI Skills 可以把固定工作流封装成可复用能力,让助手按指令调用脚本、模型和浏览器自动化。围绕 videocut-skills、Humanizer-zh、Auto-Redbook-Skills 和 add-skill,讲清它们能做什么、适合什么场景,以及如何上手。

发布于 2026-01-23

Claude 宪法解析:Anthropic 如何用价值层级约束 AI 行为

Claude 宪法是一套写给模型的行为与价值规范,用价值优先级、委托人层级、硬性红线和可指令默认行为来约束 Claude。它展示了大模型安全从“枚举规则”走向“培养判断力”的治理思路。

发布于 2026-01-22

AgentCPM-Explore:4B 端侧 Agent 的架构、能力与本地部署

AgentCPM-Explore 是基于 Qwen3-4B-thinking-2507 后训练得到的 4B 端侧 Agent 模型,面向长周期、多步交互任务。内容讲清它的能力边界、组件架构、适用场景,以及基于 AgentDock 和 Docker 的部署运行方法。

发布于 2026-01-22

Agent Skills 在数据分析 Agent 中的工程化实践

Agent Skills 可以把领域知识、操作流程、脚本和资源封装成可复用的能力单元,让 AI Agent 在需要时动态加载。围绕自然语言查数和指标归因分析两个数据场景,讲清 Agent Skills 与 MCP、A2A 的边界、技能目录结构、SKILL.md 写法以及落地时的安全注意事项。

发布于 2026-01-22

Prompt 重复:用复制粘贴提升非推理大模型答题准确率

Prompt 重复指把同一个问题在输入中连续放两遍,让非推理大模型在第二遍处理问题时能利用第一遍提供的完整上下文。围绕实验结果、因果语言模型机制、适用场景和使用模板,讲清这种看似简单的技巧为什么可能提升准确率。

发布于 2026-01-22

Claude Skills 的扩展边界与安全风险:从技能路由到 SkillScan

Claude Skills 把 Agent 能力封装成可选择、可执行的技能,但技能库规模和语义相似度会直接影响路由准确率。围绕单智能体技能系统的扩展边界和 SkillScan 的大规模安全扫描结果,系统讲清技能系统什么时候适合替代多智能体,以及上线前需要做哪些安全检查。

发布于 2026-01-21

X 推荐算法开源解读:Thunder、Phoenix 与多行为打分机制

X 平台开源的新推荐系统把排序核心转向 Transformer 模型,通过 Thunder、Phoenix 两条候选来源生成信息流,再用多行为概率加权打分。梳理候选召回、排序、过滤、多样性和 OON 调分等关键机制。

发布于 2026-01-20

MemOS 入门:把 AI 长期记忆和知识库分开管理

MemOS 把 AI 应用里的长期记忆、知识库、工具调用轨迹和上下文调度拆开管理,避免每次对话都从零开始。这里讲清 MemOS 与传统 RAG 的区别、核心架构、记忆类型以及接入知识库和对话循环的基本做法。

发布于 2026-01-20

Agentic AI 的范式演进与系统架构拆解

Agentic AI 把大语言模型放进可感知、可行动、可记忆、可验证的闭环系统中。围绕范式演进、Agent Transformer 五元组、单 Agent 与多 Agent 协作、三层学习策略和落地评估,系统拆解构建 AI Agent 时必须理解的关键机制。

发布于 2026-01-18