首页/详情

ChatGPT Images 2.0 自动添加路标的奇异案例分析

Simon Willison2026/04/26 00:44机翻/自动摘要/自动分类
0 阅读

内容评分

技术含量
6/10
营销水分
4/10

摘要

本文分析了 ChatGPT Images 2.0 在生成“鹈鹕骑自行车”图像时自行添加路标文字的现象。通过对原始提示与最终输出的对比,探讨了模型的创造性干预、提示工程的局限以及生成式 AI 输出可控性问题,并给出监控与校正建议。

正文

在一次关于“鹈鹕骑自行车”基准测试的讨论中,@scottjla 在推特上回复道:“我觉得我们现在需要把这些测试结果汇总起来进行分析”。随后,他附上了一张由 ChatGPT Images 2.0 生成的图像:画面中一只鹈鹕在土路上骑自行车,后方有警车追赶;鹈鹕的耳部坐着一名宇航员,宇航员又被一匹表情疯狂的马驮着。画面旁散落着披萨罐头和牛仔帽,路标上写着“为什么你会是这个样子?”。

经核实,这幅图像的路标文字并未出现在 Scott 提供的提示中。原始提示为:

生成一幅画面:一匹马驮着一个宇航员,而宇航员又骑在一只骑自行车的鹈鹕身上。整个场景看起来非常混乱,但他们竟然都能保持平衡。

ChatGPT Images 2.0 在生成过程中自行加入了“WHY ARE YOU LIKE THIS”路标,体现了模型在文本到图像任务中的创造性干预。该现象引发了对、模型自我引入语义元素以及生成式 AI 输出可控性的讨论。

本文围绕这一案例,梳理了模型的行为特点、可能的技术实现(如后置文本注入或隐式主题扩展),并提出了在实际应用中监控和校正此类“自发”内容的建议。

标签