FireRed-Image-Edit 是一个面向复杂指令图像编辑的开源基础模型,重点提升指令遵循、主体一致性、文字编辑、多图参考和画质修复能力。核心设计包括规模化编辑数据引擎、三阶段训练流程,以及面向文字布局的 OCR 奖励机制。
Nano Banana 可以把图像生成和图像编辑能力接入到 Web 工具中。这里讲解 Nano Bananary 和 BananaFace 两个开源项目的功能定位、工作方式、适用场景,以及 BananaFace 的本地运行步骤。
豆包 Seedream 4.0 是字节跳动推出的一站式图像生成与编辑模型,支持文生图、图像编辑、多图融合、连续分镜和中文文字重绘。这里从能力边界、典型工作流、提示词写法和 API 接入方式几个角度讲清它适合解决哪些图像创作问题。
Seedream 4.0 把文生图、图像编辑和组图生成放到同一个多模态模型中。围绕指令编辑、特征保持、多图参考、高清生成等能力,讲清它适合处理哪些视觉任务,以及如何写出更稳定的提示词。
Nano Banana 是 Gemini 2.5 Flash Image 的常用昵称,适合做参考图编辑、图片融合、风格转换、老照片上色、分镜生成等任务。这里用可复用的提示词结构和场景模板,讲清如何把参考图、目标效果和约束条件组织成稳定的图像编辑指令。
Nano Banana 不只适合图片编辑,也能通过结构化提示词生成照片级场景、贴纸、文字标志、商业产品图、极简背景和漫画分镜。围绕六类常见出图任务,拆解提示词模板、写法要点、平台入口和第三方平台选择清单。
Nano Banana 适合做多图融合、局部编辑、参考姿势迁移、角色设定和信息图生成。这里用一套可复用的工作流讲清楚参考图打标、红框选择、红色蒙版、视角推理、海报改稿等常见玩法,以及尺寸、文字和事实准确性上的注意事项。