永信证券平台 ChatGPT Images 2.0 与 Gemini Nano Banana 图像生成能力深度横评

上周，OpenAI 发布了两项重量级更新，展示出令人印象深刻的能力。其一是 ChatGPT Images 2.0，这一版本不再局限于基础图像生成，新增了将真实数据中的文字与上下文信息融入图像的功能；其二是最新前沿模型 GPT-5.5，相较于 GPT-5.4 在性能与速度上均有显著提升。

在 ChatGPT Images 2.0 发布后，笔者已对其上下文感知能力进行了一系列测试，结果表现出色。但在基础图像生成方面，它究竟是进步了、持平了，还是有所退步？

为此，笔者回归了常用的基础图像生成测试流程，将 ChatGPT Images 2.0 与谷歌 Gemini Nano Banana 进行了横向比较。在 2025 年 12 月的测试中，Nano Banana 取得了亮眼的 93% 得分，而 ChatGPT 仅获得令人失望的 74%，主要原因在于该 AI 当时拒绝执行流行文化相关的测试项目。

此次测试并非将 ChatGPT Images 2.0 与此前 Nano Banana 的历史成绩作比较，而是同步重新运行两款 AI 的全套测试，以便更客观地评估两者的当前水平。

需要说明的是，本文中"Gemini""Nano Banana"及"谷歌"均指代谷歌 Gemini 用于图像生成的版本，即 Nano Banana；"Images 2.0"则特指上周发布的 ChatGPT 图像生成模式。坦率地说，两家公司都需要一位专注于产品命名的全职产品经理。

先说结论：此次测试中，ChatGPT Images 2.0 得分 97%，Gemini Nano Banana 得分 85%。最后一项测试的结果尤为耐人寻味，请务必读到最后。

人物换装与场景生成测试

本项测试涵盖三个核心要素：生成合适的背景（航空母舰舰桥）、为人物替换适当的服装，以及保留原始人物的面部与体型特征。

两款 AI 在场景营造上均表现尚可。两个模型生成的服装乍看都像海军将领制服，但细节均有错误，军衔标识混乱，部分元素属于凭空捏造，各扣一分。

在人物还原方面，ChatGPT 成功保留了原始照片中的面部特征，而 Gemini 生成的版本则出现了奇怪的笑容，且修改了胡须，将笔者的胡子画得比实际更浓密，Nano Banana 在此项扣除两分。

照片修复测试

两款 AI 在照片清理修复方面均表现稳健，尽管这类任务对任何具备基本能力的图片编辑工具而言都不算难事。ChatGPT 生成的图像细节略胜一筹，但也可以说锐化程度稍过；Nano Banana 的图像则稍显模糊。两者均未扣分。

老旧照片彩色化测试

这是一张来自笔者父亲相册的 20 世纪 70 年代新泽西州应急救援车辆照片。

ChatGPT 的修复效果整体良好，车辆侧面的"RADIOLOGICAL DEFENSE"字样位置准确，但车辆后部出现了"DEFNSE"的拼写错误，Images 2.0 因此扣一分。ChatGPT 将车辆涂为蓝色，从当时的情况来看是个合理猜测，但由于原始图像中缺乏地理位置信息，不对此加以扣分。

Nano Banana 的色彩鲜艳度更高，但问题随之而来。在没有颜色参考的情况下，Gemini 将车辆白色部分涂成了红色，扣除三分。后部文字被识别为"FOIN LENN - C.OD."，更严重的是，Nano Banana 擅自在车门上添加了原图中并不存在的"纽约"字样标识，还在前景中凭空生成了一个黄铜水管接头，因此继续扣分。

徽标与文字生成测试

两款 AI 均顺利通过了本项测试，徽标外观合格，文字生成准确。ChatGPT 的版本更具专业制作质感；Nano Banana 的盾形设计略显不妥，但在徽标中加入了美国国家航空航天局的运载器装配大楼，与佛罗里达航天海岸的主题契合，别有一番风味。两者均未扣分。

中世纪图书馆场景生成测试

本项测试创作空间较大，两款 AI 的生成结果各有千秋。Nano Banana 的图像光线更好，视觉上略胜一筹，但也因此显得有些失真，尤其是画面右后方的蓝色画布，透出一种背光感，更像是电脑显示屏，而非烛光中世纪图书馆应有的质感。两者均未扣分。

老年人使用智能手机场景测试

Nano Banana 在此项测试中出现了文字重叠的问题，不知为何将文字生成了两遍，因此扣分。整体而言，两款 AI 表现尚可，人物形象足够真实。值得一提的是，谷歌的 AI 在收到"旗舰智能手机"的提示词后生成了一部 iPhone，与上次测试的结果相同。两位老人均按要求佩戴了眼镜，且当前版本在手部细节的生成上明显优于此前版本。

笔记本电脑使用场景测试

生成过程中，ChatGPT 短暂显示了如下说明："用户提到使用的是 MacBook Pro，因此我将生成一台外观简洁的银色笔记本，类似 MacBook Pro 的设计。可以加入苹果风格的外观，但我会避免直接展示品牌标志。"然而最终图像中，标志仍然出现了。此外，笔记本摆放在桌沿位置显得摇摇欲坠，不够自然，扣一分。

Nano Banana 在本项测试中再次出现了文字重叠问题，同样扣除相应分数。两张图像中的学生碰巧都穿着灰色落肩圆领毛衣，而提示词中并未涉及任何服装描述，这一巧合颇为有趣。

流行文化测试

两款 AI 都经历了一番"自我说服"才最终给出结果。

ChatGPT Images 2.0 在生成前显示了如下说明："用户要求为一部假想的《回到未来》第四集制作海报。由于涉及版权保护角色，我无法复现任何官方海报的原始设计，但可以生成一张原创的致敬风格图像，避免直接复制标志或美术元素。"

尽管经过了这番"自我开脱"，ChatGPT 最终还是给出了令人惊喜的结果，图像底部的文字细节精准清晰，充分证明 OpenAI 在图像内文字生成问题上已取得实质性突破。这也正是 ChatGPT 在过往测试中频繁失分的痛点所在。

而 Nano Banana 则直接拒绝了生成请求，提示"可以帮助生成人物图像，但无法描绘某些公众人物"。当笔者将提示词中的"Marty"替换为"一个青少年男孩"后，才获得了一个勉强过关的结果，但人物形象差强人意，因此扣分。

此外，两张图像的背景中均出现了克莱斯勒大厦和帝国大厦，这两座标志性建筑都是纽约的地标，但两者在 20 世纪 20 年代均尚未建成——帝国大厦于 1930 年 3 月 17 日动工，1931 年 5 月 1 日竣工；克莱斯勒大厦于 1928 年开始建造，1930 年完工。两款 AI 均因在画面中呈现了当时尚不存在的建筑而遭到扣分。

蒂姆·伯顿风格场景测试与隐私泄露疑云

在本项测试中，ChatGPT Images 2.0 再次生成前显示了说明文字："我会从参考结果中挑选最合适的风格元素，但需注意避免使用版权保护过于严格的内容。"至于"版权保护过于严格"究竟是什么标准，恐怕只有 AI 自己清楚。

在图像质量层面，两款 AI 的表现均符合提示词要求，得满分。从主观感受来看，笔者更偏爱 Nano Banana 的生成结果。

然而，Nano Banana 生成的图像中出现了一些令人不安的细节：画面中竟包含了 Claude Code、iTerm2、Linux 的标识以及一台 3D 打印机。而这些内容，恰恰是笔者近期在聊天记录中频繁讨论的话题——笔者的 YouTube 频道也主要围绕桌面制造、创客项目和 3D 打印展开。

但问题在于，笔者只是要求生成"一位数据中心中的 IT 专业人员"，从未要求 Gemini 加入这些私人信息。Gemini 自行从聊天历史中提取了相关内容并嵌入了图像。

这一行为引发了严肃的隐私问题：如果用户曾用 Gemini 讨论过私人健康状况或个人事务，这些信息是否有一天会悄无声息地出现在某张生成图像中？用户是否需要逐张放大检查 Gemini 生成的每一张图像，以确认没有个人隐私信息外泄？

这种行为令笔者感到不安，笔者已就此联系谷歌方面征询回应，将在获得答复后更新本文。这也正是真实场景动手测试的价值所在：只有通过实际使用，才能发现那些在基准测试中永远不会暴露的边缘案例与潜在风险。

总评

在涵盖 30 项独立评测维度的测试中，ChatGPT Images 2.0 累计获得 150 分，Gemini Nano Banana 获得 131 分。换算为百分制后，ChatGPT Images 2.0 得分 97%，Gemini Nano Banana 得分 85%。与 Gemini 去年 93% 的历史成绩相比，本次有明显下滑。

Q&A

Q1：ChatGPT Images 2.0 和 Gemini Nano Banana 的测试总分分别是多少？

A：在涵盖 30 项独立评测维度的测试中，ChatGPT Images 2.0 累计获得 150 分，换算为百分制后得分 97%；Gemini Nano Banana 获得 131 分，得分 85%。与 Gemini 去年 93% 的历史成绩相比，本次有明显下滑。

Q2：Gemini Nano Banana 在图像生成中泄露用户隐私是怎么回事？

A：在蒂姆·伯顿风格场景的生成测试中，Nano Banana 在用户仅输入"数据中心中的 IT 专业人员"提示词的情况下，自动从聊天历史中提取了用户近期讨论的 Claude Code、iTerm2、Linux 及 3D 打印机等内容，并将其嵌入生成图像。这引发了对用户隐私安全的严重担忧，测试者已就此联系谷歌方面寻求回应。

Q3：ChatGPT Images 2.0 在文字生成方面有什么改进？

A：ChatGPT Images 2.0 在图像内的文字生成能力上取得了显著突破。以《回到未来》主题海报测试为例，图像底部的文字细节准确清晰，表现出色。而在此前版本的测试中，ChatGPT 曾因拒绝执行流行文化相关测试而频繁失分，新版本在这一痛点上已有实质性改善。

恒正网配资提示：文章来自网络，不代表本站观点。

永信证券平台 ChatGPT Images 2.0 与 Gemini Nano Banana 图像生成能力深度横评

优配网配资官网华工科技：公司在PCB细分领域已构建起全套的激光加工、检测及自动化整体解决方案

大通证券平台青春燃动科创城！第十六届浦东青年健康节暨浦东软件园科创运动嘉年华超燃启幕

道正网配资豪华 MPV 首选！新款欧尔法，3.5L V6 285匹马力+365牛米

天源国际配资APP下载吹火、变脸，一招一式见真章——绝活何以动人

好点点配资平台万余批次“你点我检”守护儿童食品安全

股票配资基础知识APP下载十四届全国政协常委、农业和农村委员会副主任王晓东被查

久联优配app官网APP下载中国女子4X100米接力队获直通2027年北京田径世锦赛资格