资讯

AI 探索世代刻板印象,突显关键差异,ERNIE-ViLG 展示别样视角

Sammi  · 2024-09-23 16:34

【摘要】 AIport 与图灵邮报(Turing Post)于上月开展的联合研究项目分析了来自四种不同模型 —— Stable Diffusion、Midjourney、YandexART 及ERNIE-ViLG 的 1200 多张 AI 生成图像,以探索全球范围内各世代的视觉形象。研究既揭示了常见的代际刻板印象,也出现了意料之外的见解,每个 AI 模型都展现出了其独特的视角,其中包括一些文化细微差异。



上海,2024 年 9月 23 日 – AI 眼中的婴儿潮一代、X 世代、千禧一代及 Z 世代是何形象?


地图

描述已自动生成


AIport 与图灵邮报(Turing Post)于上月开展的联合研究项目分析了来自四种不同模型 —— Stable Diffusion、Midjourney、YandexART 及ERNIE-ViLG 的 1200 多张 AI 生成图像,以探索全球范围内各世代的视觉形象。研究既揭示了常见的代际刻板印象,也出现了意料之外的见解,每个 AI 模型都展现出了其独特的视角,其中包括一些文化细微差异。


婴儿潮一代:内省与积极的意外交融


尽管婴儿潮一代常被描绘成无忧无虑的退休者,多个 AI 生成的图像却叙述了不同的故事。例如,Midjourney 将他们描绘得更具内省和沉思,他们往往是穿着严实并凝视远方的。然而,中国开发的 ERNIE-ViLG 则呈现出了更积极的一面,其超过 90% 的生成图像中的婴儿潮一代展示出微笑状态。这种对比凸显了不同训练数据如何塑造 AI 的解读,尤其是当文化因素起作用时。


即使存在这些差异,四个模型都暗示着婴儿潮一代可能正在思考他们在快速变化的世界中的位置。这种内省与积极的融合反映了一种超越文化界限的复杂代际身份。


图片包含 人, 帽子, 穿着, 男人

描述已自动生成穿着西装笔挺的男子

描述已自动生成女人拿着杯子

描述已自动生成


四个 AI 模型都出奇一致地描绘了 Z 世代的活力与多样性。作为拥抱科技和乐于自我表达的一代,Z 世代被呈现在充满活力和多彩的环境中,这反映出他们与快速演变的数字世界之紧密联系。


而 ERNIE-ViLG 的图像尤其捕捉到了细节和文化相关性,体现了 Z 世代的全球影响力。该模型在展示多样性上表现出色,反映了这一代人所倡导的包容性和个性化价值观。从印度到中国再到西方,Z 世代似乎正在塑造一个关于现代化和科技素养的普遍叙事。


人在舞台上表演

描述已自动生成一群人站在一起

描述已自动生成人站在街道上

描述已自动生成


通过 AI 镜头看不同的世代


这份研究探讨了五个关键领域——身份、关系、工作、生活方式和消费习惯。虽然一些刻板印象仍然存在,例如婴儿潮一代和 X 世代的形象以男性为主,但千禧一代和 Z 世代 等年轻一代的形象更加多样化,包括更多的女性代表。


对于 X 世代来说,这些图像缺乏强烈的定义特征,这可能反映了这一代人在传统与现代之间的模糊定位。也有部分原因是由于与 X 世代相关的训练数据量有限,导致所有模型的描绘都更加笼统,缺乏鲜明性。


除了中国外,啤酒是其它国家中常见的元素


有趣的是,啤酒是跨越代际和文化界限的共同元素。AI 生成的图像展示的啤酒跨越所有年龄族群,超过 30% 的图片展示了不同世代的人在享用啤酒。虽然啤酒在某些市场可能不那么受欢迎,但这一发现表明某些社会习惯跨越了年龄和文化界限。


显著的例外是 ERNIE-ViLG 对中国饮酒文化的解读,中国最流行的饮品是葡萄酒。


桌子上的食物和红酒

中度可信度描述已自动生成人在喝饮料

描述已自动生成女人在微笑

中度可信度描述已自动生成


提示工程(Prompt Engineering)和 AI 洞察


本研究中使用的 prompt 经过精心设计,以避免偏见,依靠中性短语,如“千禧一代在工作”或“婴儿潮一代在放松”。 由此产生的图像提供了 AI 如何根据其训练的数据集反映社会期望和文化叙事的快照。


ERNIE-ViLG 的描述与其他模型形成了有趣的对比,”查普曼大学传播学院创始院长、麦高行为科学特聘教授 Lisa Sparks 博士表示。“虽然 Midjourney 和 Stable Diffusion 似乎更倾向于对婴儿潮一代的刻板描述,但 ERNIE-ViLG 引入了更多的文化多样性和积极性,这可能反映了其训练数据和对集体主义价值观的关注。”


关于本研究


该研究考察了四种全球公认的生成式 AI 模型的输出,每种模型都具有独特的美学和文化细微差别,全面展示了每一代人的视觉形象。选定的模型包括 Stable Diffusion、Midjourney、YandexART 和 ERNIE-ViLG,提供了来自全球不同地区的不同视角。


结论


无论是证实还是反驳社会刻板印象,AI 生成的图像都提供了一个迷人的快照,展示了技术如何解释代际差异。啤酒仍然是所有四个模型的统一主题,这一事实表明,无论我们年龄多大,有些事情——比如享受一杯冰镇啤酒——超越了代际鸿沟。


要了解有关该项目的更多信息,请访问 https://www.aigenerations.tech/ 。


关于 AIport

AIport 是一个由 AI 及机器学习爱好者和从业者、数据科学家和技术作家组成的新兴社区。我们的目标是提供 AI 及机器学习领域的真正全球视角。大多数与机器学习相关的出版物和新闻通讯都聚焦于美国和欧洲的“大联盟”。虽然这些地区处于 AI 开发的前沿并做了很多有趣的事情,但 AIport 力求为全球 AI 社区提供一个包括所有地区的全面的视角。欲了解更多关于 AIport,请访问 https://www.blog.aiport.tech




转载请联系原作者

已有0人收藏

+1

已有0人点赞

+1

发表评论

请先后参与评论

已有0

转发

入驻
机构号