归档

2025 年 12 月

生成式 AI 正在同时改变岗位效率、替代关系、劳动补充和新职业形成。围绕主流 AI 公司岗位结构,梳理五类核心岗位、四个职业变化特征,以及个人、企业和社会应对 AI 就业变革的方法。
Vidu Q2 把参考生图、文生图、自然语言图像编辑和图生视频放进同一套工作流。重点能力是多主体一致性、画面比例扩展、局部语义修改和主体复用,适合角色设定、商品图、海报变体和短视频素材制作。

2025 年 11 月

Deep Research 是一种面向复杂研究任务的 AI Agent 范式,它把任务规划、多轮检索、网页探索、证据整合和报告生成串成闭环。围绕 RAG 到 Deep Research 的演进、四大核心模块、评测方法、主流系统局限,以及结构化私域数据与公域信息融合的方案展开讲解。
Token 是大模型处理文本的基本单位,但它不等于字、词或字符。这里从分词器、Token 词表、上下文窗口和 API 计费几个角度讲清 Token 的工作方式,以及如何在实际使用中估算和减少 Token 消耗。
Agent 的多轮推理、工具调用和长上下文会反复提交大量相同前缀,KV Cache 复用直接影响延迟和成本。这里从 token 序列、Chat Template 和 Prefix Caching 的角度,讲清 Completion 与 Chat Completion 在控制权上的差异,以及如何设计更容易命中缓存的 Agent Prompt。
Nano Banana Pro 生成图片时,提示词不能只堆关键词,而要把画面讲成一个具体场景。通过主体、环境、光线、构图、材质、风格和用途约束,可以让人工智能更稳定地生成 PPT 封面、知识卡片和壁纸等视觉内容。
deepagents 是 LangChain 面向长周期任务推出的 Agent 框架,核心能力包括任务规划、文件系统访问和子 Agent 委托。通过 CompositeBackend 与 Milvus 结合,可以把临时工作区和跨会话长期记忆分开管理,减少上下文膨胀带来的成本和失控问题。
围绕 Gemini 3 的多模态理解、长上下文处理、代码生成和工具调用,整理一套可复用的任务拆解方法、提示词模板和评估清单,帮助把模型能力落到可验证的业务流程里。
程序员使用 AI 编程助手时,常见问题不是不会问,而是问题缺少上下文、目标和约束。这里用调试、代码解释、重构、代码审查、单元测试等场景,讲清楚如何写出能直接产出可用结果的 Prompt。
UltraRAG 把检索、生成、评估等 RAG 组件封装成独立的 MCP Server,再用 YAML 配置组织 Pipeline。它适合快速搭建可复现的 RAG 实验流程,尤其适合需要处理 PDF、图表、表格和多格式文档的知识问答场景。