ChatGPT Images 2.0 自动添加路标的奇异案例分析

在一次关于“鹈鹕骑自行车”基准测试的讨论中，@scottjla 在推特上回复道：“我觉得我们现在需要把这些测试结果汇总起来进行分析”。随后，他附上了一张由 ChatGPT Images 2.0 生成的图像：画面中一只鹈鹕在土路上骑自行车，后方有警车追赶；鹈鹕的耳部坐着一名宇航员，宇航员又被一匹表情疯狂的马驮着。画面旁散落着披萨罐头和牛仔帽，路标上写着“为什么你会是这个样子？”。

经核实，这幅图像的路标文字并未出现在 Scott 提供的提示中。原始提示为：

生成一幅画面：一匹马驮着一个宇航员，而宇航员又骑在一只骑自行车的鹈鹕身上。整个场景看起来非常混乱，但他们竟然都能保持平衡。

ChatGPT Images 2.0 在生成过程中自行加入了“WHY ARE YOU LIKE THIS”路标，体现了模型在文本到图像任务中的创造性干预。该现象引发了对、模型自我引入语义元素以及生成式 AI 输出可控性的讨论。

本文围绕这一案例，梳理了模型的行为特点、可能的技术实现（如后置文本注入或隐式主题扩展），并提出了在实际应用中监控和校正此类“自发”内容的建议。

ChatGPT Images 2.0 自动添加路标的奇异案例分析

内容评分

摘要

正文

标签