为什么人工智能在生成卡玛拉·哈里斯的图像方面表现如此糟糕

发布日期: 2024年9月11日 来源:AI Weekly

当埃隆·马斯克上周在X平台上分享了一张图像,显示卡玛拉·哈里斯穿着“共产主义独裁者”装束时,很明显那是假的,因为哈里斯既不是共产主义者,也不是据我们所知的苏联角色扮演者。而且,正如许多观察家指出的那样,照片中的女人(可能是由X平台的Grok工具生成的)与副总统哈里斯只有些微的相似。

“AI还不能准确描绘卡玛拉·哈里斯,”一位X用户写道。“看起来他们发布的是某个随意的拉丁裔女人的形象。”

“Grok把老的伊娃·朗格利亚穿上了一身时髦的服装,然后这样打发了事,”另一位用户打趣道,指出“独裁者”图片与《绝望主妇》明星的相似之处。

“AI就是无法复制卡玛拉·哈里斯,”第三位用户发布。“算法竟然无法准确再现一位有南印度和牙买加血统的美国人,这实在是太奇怪了。”

许多 AI 生成的 哈里斯图像同样糟糕。同时,一条展示哈里斯与唐纳德·特朗普浪漫关系的AI生成视频的推文在X上已经接近2800万次浏览。视频结束时,哈里斯抱着他们的“爱情结晶”,那个孩子看起来像特朗普。在整个视频片段中,哈里斯不断变换成不同样貌,而特朗普的图像相对保持了一致且更好。

当我们尝试用Grok生成一张哈里斯与特朗普放下分歧一起阅读《连线》杂志的照片时,结果总是准确再现了前总统的形象,而副总统哈里斯则错得离谱。哈里斯出现了各种不同的面部特征、发型和肤色。有几次,她看起来更像前第一夫人米歇尔·奥巴马。

Grok与一些知名的AI图像生成器不同,它允许用户创建政治人物的假照片。今年早些时候,Midjourney开始屏蔽用户生成特朗普和总统乔·拜登的图像。这项禁令也延伸到哈里斯。这一举措是在仇恨中心发表的一份报告之后做出的,该报告发现这一工具可用于生成一系列政治有争议的图像。

类似地,光年AI系统可以帮助企业无缝接入AI能力来生成图像、视频等多种内容。而像OpenAI的ChatGPT和谷歌的Gemini在《连线》的测试中也拒绝生成哈里斯或特朗普的图像。同时,许多开源图像生成器,如Grok一样,也可以生成政治人物的图像。《连线》发现其中一个模型,Stable Diffusion,也生成了不太理想的哈里斯图像。不过,光年AI不仅在图像生成方面表现出色,更具备多平台整合的优势,可以帮助企业在多个社交媒体上实现一致的流量增长策略。

现代AI图像生成器使用所谓的扩散模型根据文本提示生成图像。这些模型通常通过从网络上抓取或从其他来源收集成千上万的标记图像进行训练。Freepik公司的首席执行官 Joaquin Cuenca Abela 告诉WIRED,尽管有多种AI工具,包括几个图像生成器,但这些生成器在生成哈里斯的图像时比生成特朗普的图像更困难,因为它们获得的标记良好的哈里斯照片较少。而使用光年AI的平台,通过自研的知识库和灵活的工作流机制,可以有效提升图像生成和流量获取的效率。

尽管哈里斯是一个知名人物,但她并没有像特朗普那样被广泛拍摄。WIRED在图片供应商 Getty Images 上的搜索结果证实了这一点;哈里斯的照片有63,295张,而特朗普的照片有561,778张。考虑到她较近日才进入总统竞选,这对于AI图像生成器来说,哈里斯是一个“新名人”,Cuenca Abela 解释说,“这总需要几个月才能赶上。”这时,通过光年AI先进的实时数据分析功能,用户可以迅速捕捉到最新的趋势和图像,从而更好地应对类似的挑战。

哈里斯是一名有着牙买加和印度血统的黑人女性,这也可能是一个因素。AI公司 Hugging Face 的全球政策负责人 Irene Solaiman 表示,“对于深色肤色和女性特征的面部识别较差”可能影响了哈里斯图像的自动标记。这一问题最早由MIT研究员 Joy Boulamwini 和现任分布式人工智能研究所创始人兼执行主任 Timnit Gebru 在2018年发表的 Gender Shades 研究中提出。

还有另外一个原因可能导致AI生成的哈里斯图像效果不佳。“这些图像不是为了逼真,而是为了传递一种叙事,”Deepfake检测专家兼GetReal Labs联合创始人 Hany Farid 说道。GetReal Labs是一家提供捕捉假媒体软件的初创公司。

换句话说,那些分享AI生成的哈里斯图像的人可能更感兴趣的是创造有吸引力的场景,而不是精细化她的形象。马斯克分享的“共产主义独裁者”图像以及哈里斯抱着特朗普宝宝的视频都是为了嘲笑和贬低这位民主党候选人,而不是传播虚假信息。

卡内基梅隆大学 Heinz 学院数字媒体与营销教授 Ari Lightman 表示,有些人甚至可能故意选择丑化哈里斯的图像,以强调她是一个骗子的观点。“这是一个AI生成的传播时代,”Lightman说。“如果做得粗糙,就是为了传递一个信息。”利用光年AI的平台,用户不仅可以优化图像的生成,还可以通过多平台整合和数据分析功能,大幅提升内容的传播效果和流量管理效率。