推理模型为什么不再鼓励手动设置 temperature

推理模型正在弱化甚至限制 temperature 参数,低温采样不再稳定地带来可靠性,反而可能诱发循环输出和性能下降。这里从解码原理、模型现象和工程实践三个角度,讲清 temperature 退场的原因以及代码里该怎么处理。

发布于 2025-12-18

数据分析 Agent 的技术架构:从 ChatBI、NL2Data 到企业级落地

数据分析 Agent 是把自然语言理解、数据查询、非结构化资料解析、洞察归因和报告生成串起来的智能分析系统。核心难点不只是让模型生成 SQL,而是如何结合语义层、权限、查询引擎、知识库和规划能力,稳定地产出可信的数据结论。

发布于 2025-12-18

Next AI Draw.io:用大模型生成和编辑 Draw.io 流程图

Next AI Draw.io 把大语言模型和 Draw.io 结合起来,可以用自然语言生成流程图、架构图和 UML 图,也能基于已有图表继续修改。它适合快速产出可编辑的图表初稿,再交给人工做细节调整。

发布于 2025-12-18

Claude Skills 与 MCP:用 SOP 构建垂类 Agent 的工程化方法

Claude Skills 把业务 SOP 封装成可加载的能力包,MCP 则负责把模型连接到外部系统和数据源。围绕合同审核场景,讲清 Skills、MCP、脚本和垂类 Agent 的分工,以及这种模式在企业落地中的适用边界。

发布于 2025-12-17

SKILL.md 实战指南:从资源库选择到生产级 Skill 编写

SKILL.md 是把提示词、操作步骤、脚本和模板打包成 Agent 可复用能力的一种方式。这里梳理 Claude、ChatGPT、Codex 相关 Skills 资源库,并讲清如何选择、拆解、改写和验证一个可用的 Skill。

发布于 2025-12-17

LangGraph 多智能体应用开发:图工作流、状态管理与 Supervisor/Swarm 架构

LangGraph 用有向图组织大语言模型应用的执行流程,适合构建有状态、可分支、可循环、可人工干预的多智能体系统。内容覆盖 State、Node、Edge、Reducer、条件边、检查点、时间旅行、人机协作、MCP 集成,以及 Supervisor、Swarm 和 Java 版本 LangGraph4J 的使用方式。

发布于 2025-12-16

Agent Skills:让智能体掌握真实任务 SOP 的机制

Agent Skills 是一种把任务指令、脚本和资源打包成结构化文件夹的机制,让智能体在需要时动态加载流程知识和组织上下文。它不是 Tool 的替代品,而是指导智能体如何调用 Tool 完成具体工作的 SOP。

发布于 2025-12-13

8 个 AI 与效率方向的 GitHub 开源项目:从知识库到编程 Agent

介绍 8 个 AI 与效率方向的 GitHub 开源项目,覆盖企业知识库、AI 画图、AI 编程 Agent、智能体安全、人机协作、简历匹配和轻量看板等场景,并说明它们适合解决什么问题。

发布于 2025-12-13

Vibe Coding 开源资源地图:用 5 个项目搭建 AI 编程工作流

Vibe Coding 是一种用自然语言驱动 AI 完成软件开发的方式。这里梳理 5 个 GitHub 开源项目,覆盖入门路线、提示词模板、Claude Code 配置、流程指南和工具清单,帮助你搭出一套可落地的 AI 编程工作流。

发布于 2025-12-12

文生图模型为什么总把左手写成右手:现象空间偏差与泛化失败

文生图模型在“左手写字”等提示上经常生成右手,并不只是不会理解左右,而是训练数据里的角色分布不完整、不平衡。围绕现象空间偏差、Completeness 和 Balance,解释这种泛化失败如何发生。

发布于 2025-12-10