芥末
发布于 2026-04-13 / 0 阅读
0
0

用横纵分析法写 Deep Research Prompt:30 分钟搭建陌生领域认知框架

很多人使用 AI(人工智能)做研究时,会遇到同一个问题:模型能搜到大量资料,也能生成很长的报告,但报告经常像资料堆砌,读完仍然不知道这个东西为什么出现、现在处在什么位置、未来可能怎么走。

问题不一定出在模型能力上,而是出在提问框架上。

一个陌生领域通常不能只靠“介绍一下 XXX”来理解。真正有用的研究,至少要回答两类问题:

  1. 它是怎么一步步变成今天这样的?
  2. 它在当下和同类对象相比,到底有什么不同?

这就是横纵分析法的核心:纵向追时间深度,横向追同期广度,最后把两条线交叉起来形成判断。

flowchart TB
    A[研究对象] --> B[纵向分析:时间线]
    A --> C[横向分析:当下切面]

    B --> B1[起源背景]
    B --> B2[关键节点]
    B --> B3[转折原因]
    B --> B4[路径依赖]

    C --> C1[竞品/同类对象]
    C --> C2[用户选择理由]
    C --> C3[生态位]
    C --> C4[机会与风险]

    B4 --> D[横纵交汇]
    C4 --> D

    D --> E[形成可验证的判断]

这套方法很适合配合 Deep Research(深度研究)类工具使用。Deep Research 的价值不是“帮你写一篇长文”,而是让模型花十几分钟甚至更久去搜索、比对、整理资料。横纵分析法相当于给模型一张研究路线图,让它知道应该沿着哪些问题挖下去。

横纵分析法是什么

横纵分析法可以拆成两个维度。

维度关注的问题产出的信息
纵向分析研究对象从哪里来,经历了哪些变化,为什么走到今天历史脉络、因果链、关键转折、路径依赖
横向分析研究对象现在和同类相比有什么差异,用户为什么选择它竞品格局、差异点、生态位、机会与风险
横纵交汇历史选择如何影响当下位置,当下竞争又会倒逼什么变化对当前状态和未来走向的综合判断

这个思路对应语言学里的“历时分析”和“共时分析”。

  • 历时分析关注一个对象随时间发生了什么变化。
  • 共时分析关注某个时间点上,对象在系统中的位置和关系。

社会科学里也有类似方法:纵向研究会长期追踪一个对象的变化,横截面研究会在某个时间点比较多个对象。把这两种视角放到 AI 研究任务里,就能减少“资料很多但没有结构”的问题。

为什么只做纵向或横向都不够

只做纵向分析,容易写成发展史。

比如研究一个 AI 编程工具,纵向分析能告诉你它什么时候发布、什么时候加入 Agent 能力、什么时候推出企业版。但如果不和 Cursor、Claude Code、Codex CLI 等工具放在一起比较,就很难判断它的定位到底是“面向个人开发者的 IDE 插件”,还是“面向团队交付流程的工程平台”。

只做横向分析,容易写成参数表。

比如把几个工具列在一起比较模型支持、上下文长度、插件能力、价格,看起来信息很密,但缺少历史背景。某个产品今天的优势,可能来自两年前押注了一个当时并不显眼的技术路线;某个短板,也可能是早期商业定位带来的约束。

横纵交汇以后,研究才会从“罗列事实”变成“解释现象”。

flowchart LR
    A[过去的选择] --> B[今天的产品形态]
    B --> C[当下竞争位置]
    C --> D[未来可能路线]

    A -.解释.-> C
    C -.倒逼.-> D

比如:

  • 一个产品今天的护城河,可能来自早期积累的数据、社区或开发者生态。
  • 一个公司今天的组织惯性,可能来自早期融资节奏和商业化压力。
  • 一个技术概念今天突然爆发,可能不是因为刚刚诞生,而是相关基础设施终于成熟。

适合研究什么对象

横纵分析法的适用范围比较宽,只要研究对象存在“发展过程”和“同类比较”,就可以使用。

研究对象纵向重点横向重点
产品/工具发布时间、版本迭代、功能转向、用户增长、商业化节点同类工具、目标用户、使用场景、价格、社区评价
公司/组织创立背景、融资历程、战略变化、组织调整、关键人物同赛道公司、商业模式、客户结构、竞争壁垒
技术概念概念来源、论文/标准/开源项目、工程化过程、采用曲线替代方案、相邻概念、技术路线差异、落地成本
行业人物教育和职业轨迹、关键选择、代表作品、影响力变化同期人物、所在组织、领域位置、方法论差异
行业事件事件起因、演化过程、关键节点、各方反应同类事件、不同参与方立场、外部环境、后续影响

不适合的场景也很明确:如果只是查一个确定事实,比如“某个库的安装命令是什么”,横纵分析法会显得太重。它更适合用来理解复杂对象,而不是查询单点信息。

Deep Research Prompt 的设计原则

一个好用的 Deep Research Prompt(深度研究提示词)要解决四件事:

  1. 明确研究对象:不要让模型自己猜范围。
  2. 规定研究维度:告诉模型必须做纵向和横向分析。
  3. 要求证据可追溯:时间节点、来源、未经证实的信息要标清楚。
  4. 限制写作方式:避免报告变成年表、参数表或空洞判断。

可以把整个任务拆成这样的流程:

sequenceDiagram
    participant U as 使用者
    participant M as Deep Research 模型
    participant S as 搜索/资料源
    participant R as 研究报告
    participant V as 人工校验

    U->>M: 提供研究对象和边界
    M->>S: 搜索背景资料、时间线、竞品信息
    S-->>M: 返回网页、论文、公告、新闻、社区讨论
    M->>M: 归纳纵向脉络和横向格局
    M->>R: 生成结构化报告
    U->>V: 校验关键事实和可疑判断
    V-->>U: 形成可继续深挖的问题清单

可直接使用的横纵分析法 Prompt

研究对象 后面的内容替换成你想研究的对象即可。复杂问题可以再补充研究边界,比如“只研究 2023 年之后的变化”“重点关注商业化影响”“只比较开发者工具赛道”。

# 横纵分析法 Deep Research Prompt

## 变量

研究对象 =「在这里填入要研究的对象」
研究边界 =「可选:限定时间、地区、行业、技术范围或关注重点」
当前时间 =「可选:填入当前日期,方便判断信息时效」

## 任务角色

你是一名技术与商业研究分析师。请围绕「研究对象」完成一份深度研究报告。

报告必须同时使用两种视角:

1. 纵向分析:沿时间线还原研究对象的发展过程。
2. 横向分析:在当前时间点,把研究对象放到同类对象或替代方案中比较。
3. 横纵交汇:结合历史脉络和当下竞争格局,给出可验证的综合判断。

如果「研究边界」不为空,所有分析都要优先遵守该边界。

---

## 一、纵向分析:它是怎么走到今天的

请沿时间线研究以下问题:

1. 起源背景
   - 研究对象诞生前,行业或用户遇到了什么问题?
   - 它依赖哪些技术、理念、市场需求或组织条件?
   - 如果有创始团队、核心推动者、关键论文、开源项目或标准组织,请说明。

2. 初始形态
   - 明确最早出现、发布、成立或被提出的时间。
   - 描述它最早解决的具体问题,而不是只写一句抽象定位。
   - 说明当时外部环境是什么样的。

3. 关键节点
   - 按时间顺序梳理重大版本、融资、产品转向、架构变化、用户增长、合作、收购、争议、监管变化等节点。
   - 每个节点都要解释“为什么重要”,不要只列日期。
   - 如果某个节点存在多种解释,请区分已确认事实和合理推测。

4. 决策逻辑
   - 在重要转折处,尽量解释当事方为什么选择这条路。
   - 分析当时可能面临的约束,例如技术成熟度、资金、竞争压力、用户需求、监管、组织能力。
   - 注意识别路径依赖:早期选择如何影响后来的能力边界和商业位置。

5. 叙事要求
   - 不要写成干巴巴的年表。
   - 时间线要服务于因果解释:哪些铺垫导致了爆发,哪些选择后来变成优势或负担。
   - 重要人物、组织、产品、技术背景要放入叙事中解释。

---

## 二、横向分析:它现在站在哪里

请先判断研究对象的竞争环境:

- 如果没有直接竞品,请分析为什么没有:是品类太新、门槛太高、市场太小、监管限制,还是需求尚未被验证。
- 如果只有少量竞品,请逐一展开比较。
- 如果竞品很多,请选择最有代表性的 3 到 5 个深入分析,其余简要说明。

横向比较至少覆盖以下维度,必要时可根据研究对象类型调整:

1. 核心差异
   - 技术路线、产品形态、商业模式、组织结构或方法论有什么不同?
   - 它解决问题的方式和别人相比有什么明显差异?

2. 用户与场景
   - 目标用户是谁?
   - 用户为什么选择它,而不是选择替代方案?
   - 官方定位和真实使用方式是否一致?
   - 社区、客户、开发者或行业从业者的评价中,最常见的优点和槽点是什么?

3. 生态位
   - 它在整个赛道里处在什么位置?
   - 它是填补空白、向上替代、向下渗透,还是和某些对象正面竞争?
   - 它依赖哪些生态伙伴或基础设施?

4. 机会与风险
   - 当下竞争格局给它带来哪些机会?
   - 哪些因素可能限制它继续增长?
   - 潜在竞争者可能从哪里出现?

横向分析可以使用表格辅助比较,但不要只给参数表。每个主要对象都要解释“它为什么能活成现在这样”。

---

## 三、横纵交汇:形成综合判断

请在报告末尾单独写一节「横纵交汇」。

这一节不要重复前面的内容,而是回答:

1. 纵向发展中哪些选择,塑造了它今天的竞争位置?
2. 今天的优势,哪些来自长期积累,哪些只是短期窗口?
3. 今天的短板,哪些是可以修补的问题,哪些是路径依赖造成的结构性问题?
4. 如果未来 1 到 3 年发生变化,最可能的驱动力是什么?
5. 对不同角色有什么意义:
   - 普通用户
   - 开发者或从业者
   - 企业决策者
   - 投资或战略研究人员

---

## 四、证据和可信度要求

1. 重要事实尽量标注来源、时间或出处类型,例如官网公告、论文、新闻报道、财报、访谈、GitHub 仓库、社区讨论。
2. 如果信息无法确认,必须标注“未确认”或“推测”,不能把推测写成事实。
3. 遇到互相矛盾的信息时,要说明冲突在哪里,并给出更可信来源的判断依据。
4. 对时间敏感的信息,要说明资料的时间点。
5. 不要编造引用、数据、访谈或链接。

---

## 五、写作要求

1. 写得像一份可读的深度研究报告,不要像关键词堆叠。
2. 纵向部分用故事线串起因果,不要写成流水账。
3. 横向部分讲清每个对象的真实位置,不要只罗列功能。
4. 判断必须基于事实。如果是推测,要明确说明推测依据。
5. 避免空洞表达,用具体事件、数字、功能、用户反馈和技术细节支撑观点。

---

## 六、输出结构

请按以下结构输出:

1. 研究对象和研究边界说明
2. 纵向分析:发展脉络与关键转折
3. 横向分析:竞品、替代方案与生态位
4. 横纵交汇:当前位置与未来走向
5. 关键事实来源列表
6. 仍需人工确认的问题清单

篇幅根据研究对象复杂度自适应。复杂对象可以写长,但不要为了篇幅重复内容;简单对象可以收敛,但不能跳过关键证据。

使用时怎么填研究对象

研究对象不要写得过于模糊。越清楚,模型越容易给出可用报告。

模糊写法更好的写法
AI 编程Cursor 在 AI 编程工具赛道中的发展和竞争位置
MCPModel Context Protocol(MCP)从提出到生态扩散的过程
AgentAI Agent 框架在 2023 年之后的技术路线变化
AnthropicAnthropic 的产品路线、商业化路径和与 OpenAI 的差异
RAGRAG(检索增强生成)从论文概念到企业落地的演进

如果研究对象本身有歧义,要主动补充说明。例如 “Harness” 可能指公司、产品、概念或某个具体工具,最好写成:

研究对象 =「Harness:这里指某某语境下的具体对象,重点研究它与 AI Agent 工程实践的关系」
研究边界 =「重点关注 2023 年之后的发展、技术路线和与 Prompt Engineering / Context Engineering / Agent Engineering 的区别」

这样模型不会把研究方向跑偏。

一个推荐的实际工作流

直接让 AI 生成报告只是第一步。更稳妥的流程是“框架生成 + 人工校验 + 定点深挖”。

flowchart TD
    A[确定研究对象] --> B[补充边界和关注点]
    B --> C[运行 Deep Research Prompt]
    C --> D[快速通读报告]
    D --> E{是否有关键疑点}
    E -->|有| F[追查来源和补充资料]
    E -->|没有| G[提炼判断和问题清单]
    F --> G
    G --> H[形成自己的研究笔记]

可以按这个节奏执行:

步骤做什么目标
1写清研究对象和边界减少模型跑题
2使用 Deep Research 模式生成报告快速获得结构化地图
3快速通读,标出不确定点找到需要校验的地方
4检查关键来源避免把错误信息当结论
5对重点问题追加追问从“入门框架”进入“具体判断”
6整理成自己的笔记留下可复用认知结构

Deep Research 报告更适合作为研究起点,而不是最终结论。它能帮你省掉大量搜集和初步整理资料的时间,但关键事实、关键数据、关键判断仍然需要二次确认。

普通联网搜索和 Deep Research 的差异

不是所有 AI 搜索都适合跑这类任务。

工具类型特点适合程度
普通聊天模型主要依赖已有知识,不一定联网适合解释概念,不适合查最新资料
普通联网搜索能查网页,但检索轮次较少适合快速问答,不适合复杂研究
Deep Research 类工具会多轮搜索、阅读、整合资料,耗时更长适合横纵分析法
Agent 工具可以执行搜索、读取文件、调用 API、生成报告适合把流程自动化

判断一个工具是否适合跑横纵分析法,可以看三个信号:

  1. 是否会进行多轮搜索,而不是只抓几条结果。
  2. 是否能处理较长上下文,容纳时间线、竞品对比和来源信息。
  3. 是否能输出引用或来源线索,方便后续校验。

如果一个工具几十秒就生成了上万字报告,要格外注意来源质量。复杂研究通常需要时间,因为搜索、交叉验证和归纳都不是瞬间完成的。

把横纵分析法封装成 Agent Skill

如果经常研究陌生领域,可以把 Prompt 固化成 Agent Skill,让 Agent 在接到“研究一下 XXX”时自动套用同一套流程。

一个简单的 Skill 目录可以这样设计:

skills/
└── hv-analysis/
    ├── SKILL.md
    ├── templates/
    │   └── report-outline.md
    └── scripts/
        └── collect_sources.py

SKILL.md 可以写成这样:

# hv-analysis

当用户要求研究某个产品、公司、技术概念、人物或行业事件时,使用横纵分析法。

## 工作流程

1. 识别研究对象
   - 如果对象有歧义,先向用户确认。
   - 如果用户给出了研究边界,必须遵守。

2. 收集资料
   - 搜索官网、文档、公告、论文、新闻、社区讨论、代码仓库。
   - 对技术概念优先查论文、标准、开源实现和工程案例。
   - 对公司优先查官网、财报、融资信息、访谈和客户案例。

3. 纵向分析
   - 梳理起源、初始形态、关键节点、转折原因、路径依赖。

4. 横向分析
   - 找出直接竞品、间接替代方案和潜在竞争者。
   - 比较技术路线、用户场景、商业模式、生态位和风险。

5. 横纵交汇
   - 用历史选择解释当下位置。
   - 用当下竞争格局推测未来变化。
   - 明确区分事实、判断和推测。

6. 输出报告
   - 使用清晰标题、表格和来源列表。
   - 对不确定信息标注“未确认”。
   - 在末尾列出仍需人工确认的问题。

如果研究对象涉及论文,可以让 Agent 额外查询 arXiv、Semantic Scholar 或 Crossref。脚本不需要复杂,核心是把查询结果整理成结构化输入,让模型少依赖模糊记忆。

from dataclasses import dataclass

@dataclass
class Source:
    title: str
    url: str
    published_at: str | None
    source_type: str
    summary: str

def build_queries(topic: str) -> list[str]:
    return [
        f"{topic} official announcement",
        f"{topic} history timeline",
        f"{topic} competitors comparison",
        f"{topic} technical architecture",
        f"{topic} user reviews community",
        f"{topic} arxiv paper OR whitepaper",
    ]

def normalize_source(raw: dict) -> Source:
    return Source(
        title=raw.get("title", ""),
        url=raw.get("url", ""),
        published_at=raw.get("published_at"),
        source_type=raw.get("source_type", "web"),
        summary=raw.get("summary", ""),
    )

Skill 的价值不在于“多写几行 Prompt”,而在于把流程固定下来。每次研究都走同一套路径,产出的报告结构会更稳定,也更容易比较不同对象。

生成报告后必须检查什么

AI 生成研究报告时,最常见的问题不是完全胡说,而是“局部细节不准”。比如时间写错、把两个同名项目混在一起、把社区猜测写成确定事实、引用了过期信息。

可以用这张检查表处理:

检查项具体做法
时间节点查官网公告、发布记录、新闻报道,确认年份和月份
关键数据查财报、官方博客、可信数据库,避免只引用二手文章
竞品选择判断是否漏掉关键玩家,是否把不同层级对象放在一起比较
概念边界确认模型有没有混淆相近概念,例如 RAG、Agent、Workflow
推测表达看报告是否把“可能”“趋势”“传闻”写成确定结论
来源质量优先相信一手资料,其次是专业媒体和可追溯社区讨论

特别是商业、金融、医疗、法律、地缘政治等领域,AI 报告只能作为信息地图。真正用于决策前,必须回到一手来源。

横纵分析法的局限

横纵分析法解决的是“如何快速搭建认知框架”,不是“如何保证自动得出正确结论”。

它有几个限制:

  1. 资料质量决定上限
    如果公开资料很少,AI 只能基于有限信息推测。新项目、未上市公司、封闭行业尤其容易出现信息缺口。

  2. 模型可能混淆相似对象
    同名产品、同名公司、相邻概念容易被混在一起。研究对象必须写清楚,必要时要加限定条件。

  3. 横向比较依赖选样
    竞品选错,结论就会偏。比如研究开发者工具时,把 IDE 插件、命令行 Agent、企业 DevOps 平台放在同一张表里比较,就需要解释它们不是同一层级的对象。

  4. 纵向叙事可能过度因果化
    AI 很擅长把事件讲成顺滑故事,但现实中的发展经常有偶然性。看到“因为 A 所以 B”时,要检查证据是否足够。

  5. 无法替代亲自使用和一线访谈
    产品体验、组织文化、真实用户行为,单靠公开资料很难完全还原。报告能指出方向,但不能替代实测和访谈。

最适合的使用姿势

横纵分析法的最佳位置,是陌生领域研究的第一阶段。

当你第一次接触一个产品、公司、技术概念或行业事件时,用它快速生成一张地图:

  • 时间线上发生过什么;
  • 当下有哪些参与者;
  • 各自差异在哪里;
  • 哪些判断有证据;
  • 哪些问题还需要继续查。

有了这张地图,再去读论文、看源码、体验产品、查财报、做访谈,效率会高很多。因为你已经知道哪些节点重要,哪些概念容易混,哪些争议值得追。

真正稀缺的不是资料,而是提问角度。AI 可以帮你搜索和整理,但研究方向需要人来设定。横纵分析法的作用,就是把“我该从哪里开始了解它”变成一套稳定流程:

纵向:它为什么会变成今天这样?
横向:它今天和别人有什么不同?
交汇:过去的选择如何塑造现在,现在的位置又会如何影响未来?

这三个问题问清楚,一个陌生领域就不再是一团散乱信息,而会变成一张可以继续深入的认知地图。


评论