谷歌推出 “纳米香蕉” Gemini 2.5 Flash Image,登顶图像编辑模型榜首

出版日期:2025-08-27
浏览量:423

当地时间 8 月 26 日,谷歌 DeepMind 正式推出了其最新的图像生成与编辑模型 Gemini 2.5 Flash Image,其内部测试代号为 “纳米香蕉”(nano banana) 。该模型迅速在 AI 图像编辑领域崭露头角,在 LMArena 基准测试中超越众多竞争对手,荣登 AI 图像编辑模型榜首。

Gemini 2.5 Flash Image 具备一系列先进特性,使其在图像生成与编辑方面表现卓越。它能够在多轮对话和编辑中出色地保持角色和对象外观的一致性,无论是将同一角色置于不同环境,还是从多个角度展示单个产品,亦或生成一致的品牌资产,都能精准保留主题特征 。同时,该模型支持使用自然语言进行精准的图像转换和编辑操作,例如模糊图像背景、去除 T 恤污渍、删除照片中的人物、改变拍摄对象姿势、为黑白照片上色等 。此外,它还拥有强大的多图融合能力,可理解并合并多个输入图像,在电子商务场景中,能够将产品照与室内照片结合,生成逼真的产品展示场景 。不仅如此,Gemini 2.5 Flash Image 借助 Gemini 的世界知识,提升了对现实世界的语义理解,能更好地生成符合逻辑和现实认知的图像 。
前景研究

目前,用户可通过多种途径访问 Gemini 2.5 Flash Image。在消费端,用户可以通过 Gemini App 体验其强大功能;在开发端,开发者能够通过 Gemini API、Google AI Studio 以及面向企业的 Vertex AI 获取该模型 。在价格方面,其 API 定价为每百万输出 token 30 美元,按照官方说法,生成单张图片大约消耗 1290 个输出 token,经折算每张图片成本约为 0.039 美元 。

版权提示
如发现本站文章存在版权问题,请联系 Copyright © 2019-2025 Market Monitor Global All Rights Reserved 我们将及时沟通与处理。