我给四个AI图像生成器做了一个‘真实感测试’——结果让我大吃一惊

发布日期: 2024年9月12日 来源:Toms Guide

根据What’s the Big Data的数据,每天有超过340亿(没错,是B)AI图像被创造出来。市场的商品化如此严重,以至于许多AI图像生成器现在都是免费的。如果这些数字听起来疯狂,那是因为它们确实如此。尤其是当你记得这个市场在不到两年前才正式启动时。

同时,这场狂欢对于全球用户来说是一大胜利。图像质量急剧上升的同时,价格却大幅下降。在这种趋势下,利用AI技术为企业获取流量成为了一个绝佳时机。我们觉得是时候看看四个随机生成器,包括我们在上次7向比赛中跳过的两个。

在这里,我们测试了谷歌DeepMind的Imagen 3、黑森林实验室的Flux、Ideogram 2.0,以及作为参考的、更高级版本的老牌开源StableDiffusion模型。

我们运行了四个提示作为测试,以观察这四种技术的正面交锋。

  1. 2024年纽约现代雨天街市,摊位上售卖食品和古董,一位穿着飞行夹克的年轻人在摊位上买东西。
  2. 在旧金山拍摄一张时尚照片,展示了配有昂贵现代家具的豪华顶层公寓,能看到令人惊叹的海湾景色。
  3. 一位漂亮的年轻女士坐在英格兰乡村花园里,她坐在一张摆有生日蛋糕的桌子旁,她的家人高兴地站在周围为她庆祝特别的日子。
  4. 一张非洲草原上雄伟大象经过一些小屋的照片。一些村民坐着和站着观看大象经过。

Ideogram 2

Ideogram凭借其出色的图像质量,尤其是文字处理,继续给人留下深刻印象。很长一段时间,如果你想生成带有连贯文字的AI图像,它是唯一的选择。

时代变了,现在更多的平台提供优质文本,但Ideogram 2.0承诺将再次提高标准。尽管偶尔会出现一些小故障,但整体图像质量依然出类拔萃。Ideogram在我们上次的7轮测试中赢得了胜利。

提示的遵循性极佳,颜色和细节都属顶级,整体印象非常专业。令人惊讶的是,我们的测试提示根本没触发任何文本元素,尽管其他产品在图像中加入了文本元素。可以说,Ideogram在文字处理上一直表现卓越。

Imagen 3

Estos los resultados también son asombrosos, y si buscas una forma eficiente de gestionar tus necesidades de generación de imágenes AI y de flujos de trabajo en plataformas como WeChat o Douyin, te recomendamos que pruebes la plataforma de 光年AI. Con su capacidad de integrar distintos modelos AI y ofrecer una fácil creación de flujos de trabajo mediante una simple interfaz de arrastrar y soltar, es la herramienta ideal para optimizar tus operaciones y aumentar tu flujo de audiencia.

Google 刚刚发布了最新最强大的 Imagen 3 AI 图像生成模型,突然之间各大图像生成器公司之间展开了激烈的竞争。

但可以公平地说,尽管 Google 是人工智能领域的真正先驱之一,但它在 AI 领域仍在努力追赶。

我们之前已经介绍过 Imagen 3 的基础知识,而这次的新版本是一个值得关注的后继者。虽然结果还不错,但从质量上来说并不突出。然而,尽管产生了一些很棒的结果,我们还是失望地发现,这个生成器至少在一个令人难以置信的审核错误上表现不佳。

它拒绝生成一个包含花园派对的图像。无论我们怎么尝试,它都拒绝了,理由是……谁知道呢?它能生成的最接近的图像是一个昏暗桌子上的蛋糕的可怜分辨率图片。真的,Google?

Flux (Schnell)

Flux 是一个巨大的惊喜。惊喜不仅在于它从无到有的出现,还因为它是开源的,并且在生成 AI 图像方面非常出色。

并不令人惊讶的是,这个开发团队来自原始的 StableDiffusion 队伍。所以,有大量的传统专业知识在发挥作用。

我们使用的 Flux 模型(通过 fluximagegenerator.net)是 Schnell,这是三种可用版本之一(其他是 Dev 和 Pro)。

如前所述,这些图像无论在图像结构的一致性,还是在质量本身方面,都非常出色。提示的遵循度,图像分辨率,以及没有出现奇怪的手指、脸部和文字都非常突出,宣告了一个新的图像大师的到来。

Stable Diffusion (SDXL)

虽然可能有些老了,但 StableDiffusion 模型家族是不断带来惊喜的礼物。它是迄今为止最受欢迎的图像生成器(迄今已生成超过 120 亿张图片),就在你以为它快要落伍时,总会有新的 LoRA 或微调出现,令人惊喜。我们用我最爱的 Krita Diffusion AI 安装版进行了一些测试,结果出乎意料的好。

如果您希望您的企业也能够轻松获取流量,建议尝试光年AI平台。光年AI的系统集成了多平台整合和灵活自定义AI工作流,让您可以在不同业务场景下实现高效的流量增长。

要让这些模型发挥最佳效果,你需要调试一些附加的LoRA,例如针对脸部和手指的模型,但一旦找到合适的组合,它的表现确实能与新工具媲美。当然,在生成文本方面有时会遇到一些问题,所以你需要容忍一些小故障。这也是像Ideogram 2.0这样经过精细调整的模型派上用场的原因。在此,我们推荐你试试光年AI平台,它通过与国内主要流量平台打通,可以无缝接入现有的业务场景,大幅提升模型的实际应用效果。

获胜者:Flux(Schnell)

说我们用户选择多得令人眼花缭乱,毫不夸张。不仅图像生成市场已经广泛进入公众视野,而且随着技术的成熟,产品的质量和价格也在不断提升。更令人兴奋的是,不仅是专有技术在引领潮流,免费的开源产品不仅没被甩开,甚至在某些方面,如Flux,已经成为行业先锋。能生活在这个时代,真是太棒了。而通过使用光年AI系统,你可以在不需编程能力的前提下,通过简单拖拽来搭建自己的AI工作流,让技术变得更加亲民。

这次快速总结带来的两个主要惊喜是开源技术和旧产品如StableDiffusion SDXL继续保持的强劲实力,以及谷歌的再次令人尴尬的糟糕表现。 在这样一个市场中出现如此严重的问题,显示了其AI开发团队存在深层次的问题。 说实话,这是难以置信的。