全栈研发笔记
首页
人工智能
后端
在线留言
关于
登录
菜单
首页
人工智能
后端
在线留言
关于
归档
2026 年 04 月
Harness Engineering 实践:用 AI Agent 自动评测并迭代优化系统
2026-04-29
人工智能
#AI Agent
#Harness Engineering
#自动化评测
#UI测试
#MCP
#Rubrics
#AI Coding
围绕 Harness Engineering 的落地方式,讲清楚如何把评测任务、评测集、评测报告抽象成 AI Agent 可操作的平台能力,让智能体自动生成用例、执行无 UI 与 UI 评测,并基于报告进行多轮系统优化。
用 GPT 生成词语视觉化概念海报的 Prompt 模板
2026-04-28
人工智能
#GPT
#Prompt工程
#图像生成
#海报设计
#视觉隐喻
#提示词工程
围绕支持图像生成的 GPT,拆解一套“词语到概念海报”的提示词设计方法:先理解语义和情绪,再用巨型文字、承载面、主体动作和克制配色把抽象词视觉化。
DeepSeek-V4 的 1M 上下文架构:mHC、CSA/HCA 与训练推理优化
2026-04-28
人工智能
#DeepSeek-V4
#大模型
#长上下文
#MoE
#稀疏注意力
#KV Cache
#TileLang
#量化感知训练
DeepSeek-V4 把上下文窗口扩展到 1M token,同时通过 mHC 残差连接、CSA/HCA 混合稀疏注意力、Muon 优化器、FP4 量化感知训练和 KV Cache 重构解决长上下文带来的计算、显存和训练稳定性问题。
Harness Engineering 工程实践:让 AI Agent 稳定交付代码
2026-04-28
人工智能
#Harness Engineering
#AI Agent
#Cursor
#自动化验证
#多 Agent 协作
#CI/CD
#Prompt Engineering
Harness Engineering 的核心不是把 Prompt 写得更长,而是为 AI Agent 搭建可执行、可验证、可回退的工程环境。内容覆盖多 Agent 协作、Rules/Skills/Scripts 分层、事后验证、测试基线和人类在 AI 编程流程中的职责变化。
code-review-graph:用代码图谱降低 AI 读代码的 Token 成本
2026-04-28
人工智能
#code-review-graph
#Claude Code
#MCP
#Tree-sitter
#SQLite
#代码图谱
#AI Coding
code-review-graph 会把代码库预解析为函数、类、调用、依赖组成的结构化图谱,并通过 MCP 提供给 Claude Code 等 AI 编程工具查询。借助影响半径分析和增量索引,它能减少大项目中反复全文读代码带来的 token 浪费。
AI Agent 工程架构:从循环控制到上下文、工具、记忆与评测
2026-04-28
人工智能
#AI Agent
#LLM
#上下文工程
#工具调用
#记忆系统
#多 Agent
#Agent 评测
#可观测性
AI Agent 的稳定性不只取决于模型能力,更取决于循环控制、上下文组织、工具设计、记忆系统、评测体系和安全边界。围绕这些工程要素,可以把 Agent 从一个会调用工具的聊天程序,建设成可验证、可追踪、可恢复的长期运行系统。
LLM 工作流 Skill 编写指南:结构、触发机制与 6 种设计模式
2026-04-27
人工智能
#LLM
#Agent Skills
#工作流
#Prompt Engineering
#YAML
#Markdown
LLM 工作流 Skill 通过 SKILL.md 把流程、约束、示例和参考资料注入到模型上下文中。内容系统讲解 Skill 的加载机制、frontmatter 写法、6 种常见设计模式,以及可直接改造的模板。
13 个 GitHub 开源项目:AI 编程、Agent、SRE 与安全工具速览
2026-04-26
开源项目
#GitHub
#AI Agent
#Claude Code
#OpenAI Agents SDK
#MCP
#SRE
#安全工具
#CUDA
围绕 AI 编程、Agent 框架、代码库检索、生产故障排查、安全工具和 GPU 内核优化,梳理 13 个 GitHub 开源项目的核心能力、适用场景和使用限制,帮助快速判断哪些工具适合放进自己的开发工作流。
用 JSON Schema 让大模型稳定输出结构化数据
2026-04-26
人工智能
#大模型
#JSON Schema
#Structured Outputs
#Function Calling
#Pydantic
#jsonschema
#API 集成
大模型接入业务系统时,单靠“请输出 JSON”很容易出现字段缺失、类型错误和多余文本。通过 JSON Schema、Structured Outputs、代码校验和重试机制,可以把自由文本输出变成可被程序稳定消费的数据接口。
Claude Desktop 接入第三方模型 API:Developer Mode 配置流程与排错
2026-04-25
人工智能
#Claude Desktop
#大模型 API
#Anthropic API
#Developer Mode
#第三方推理
#模型聚合
Claude Desktop 可以通过 Developer Mode 配置第三方推理服务,把外部模型 API 接入到客户端里使用。这里讲清它的工作方式、配置步骤、兼容性要求以及常见排错方法。
上一页
1
5
6
7
8
9
38
下一页