归档

2025 年 12 月

AI 时代新职业地图：五类岗位、四个变化与三条增长路径

2025-12-01

人工智能 #生成式AI #AI职业 #大模型 #人机协作 #AI治理 #灵活就业

生成式 AI 正在同时改变岗位效率、替代关系、劳动补充和新职业形成。围绕主流 AI 公司岗位结构，梳理五类核心岗位、四个职业变化特征，以及个人、企业和社会应对 AI 就业变革的方法。

Vidu Q2 图像生成与编辑能力解析：参考生图、文生图和图生视频工作流

2025-12-01

人工智能 #Vidu Q2 #AI 生图 #参考生图 #文生图 #图像编辑 #图生视频 #多主体一致性

Vidu Q2 把参考生图、文生图、自然语言图像编辑和图生视频放进同一套工作流。重点能力是多主体一致性、画面比例扩展、局部语义修改和主体复用，适合角色设定、商品图、海报变体和短视频素材制作。

2025 年 11 月

Deep Research Agent 架构拆解：从 RAG 到多源数据分析助手

2025-11-28

人工智能 #Deep Research #AI Agent #RAG #Web Exploration #Report Generation #多源数据融合 #数据分析

Deep Research 是一种面向复杂研究任务的 AI Agent 范式，它把任务规划、多轮检索、网页探索、证据整合和报告生成串成闭环。围绕 RAG 到 Deep Research 的演进、四大核心模块、评测方法、主流系统局限，以及结构化私域数据与公域信息融合的方案展开讲解。

大模型 Token 与分词器：从切分规则到计费成本

2025-11-28

人工智能 #大语言模型 #Token #Tokenizer #Prompt工程 #API计费 #tiktoken

Token 是大模型处理文本的基本单位，但它不等于字、词或字符。这里从分词器、Token 词表、上下文窗口和 API 计费几个角度讲清 Token 的工作方式，以及如何在实际使用中估算和减少 Token 消耗。

Agent 开发中 Completion 接口与 Chat Completion 的 KV 缓存取舍

2025-11-27

人工智能 #LLM #Agent #Completion #Chat Completion #KV Cache #Prefix Caching #Chat Template

Agent 的多轮推理、工具调用和长上下文会反复提交大量相同前缀，KV Cache 复用直接影响延迟和成本。这里从 token 序列、Chat Template 和 Prefix Caching 的角度，讲清 Completion 与 Chat Completion 在控制权上的差异，以及如何设计更容易命中缓存的 Agent Prompt。

Nano Banana Pro 提示词写法：用场景描述替代关键词堆砌

2025-11-25

人工智能 #Nano Banana Pro #AI绘画 #提示词 #场景描述 #视觉生成 #PPT封面

Nano Banana Pro 生成图片时，提示词不能只堆关键词，而要把画面讲成一个具体场景。通过主体、环境、光线、构图、材质、风格和用途约束，可以让人工智能更稳定地生成 PPT 封面、知识卡片和壁纸等视觉内容。

用 deepagents 构建长任务 Agent：规划、文件系统、子 Agent 与 Milvus 记忆

2025-11-25

人工智能 #LangChain #deepagents #LangGraph #Agent #Milvus #向量数据库 #Middleware #长期记忆

deepagents 是 LangChain 面向长周期任务推出的 Agent 框架，核心能力包括任务规划、文件系统访问和子 Agent 委托。通过 CompositeBackend 与 Milvus 结合，可以把临时工作区和跨会话长期记忆分开管理，减少上下文膨胀带来的成本和失控问题。

Gemini 3 多模态任务实战：提示词模板、工作流与评估方法

2025-11-20

人工智能 #Gemini #大语言模型 #多模态 #提示词工程 #Agent #代码生成

围绕 Gemini 3 的多模态理解、长上下文处理、代码生成和工具调用，整理一套可复用的任务拆解方法、提示词模板和评估清单，帮助把模型能力落到可验证的业务流程里。