谷歌Gemini即将通过升级版Imagen 3重新生成人像AI图像

发布日期: 2024年8月29日 来源:Engadget

谷歌的生成式AI工具正在获得公司在Google I/O中预览的一些增强功能。从本周开始,公司将推出下一代Imagen图像生成器,该工具重新引入了生成AI人物的功能(在今年早些时候发生尴尬的争议后)。此外,谷歌的Gemini聊天机器人也增加了Gems,这是公司对自定义指令机器人的尝试,类似于ChatGPT的定制GPT。

Google的Imagen 3是其图像生成器的升级版本,将被引入Gemini。公司表示,下一代AI模型“设定了图像质量的新标准”,并设置了防护措施,以避免像今年早些时候病毒式传播的历史AI图像那样的多样性过度校正问题。

“在广泛的基准测试中,Imagen 3的表现优于其他可用的图像生成模型,”Gemini产品经理Dave Citron在一份新闻稿中写道。如果你对第一次生成的结果不满意,该工具允许你通过额外提示来引导图像生成。

Citron表示,Imagen 3相比竞争对手表现“良好”。它还包括谷歌的SynthID工具,用于对图像进行水印标记,明确这些图像是AI生成的而非原版。

Citron表示,生成角色的功能将会在未来几天内回归付费用户,此前公司暂停了该功能。他说,新防护措施将防止生成“逼真、可识别的个体”,与Elon Musk的Grok生成的有问题的深度伪造截然不同。儿童和(与其他图像生成器一样)任何血腥、暴力或色情场景也是禁止的。产品经理强调,Gemini的图像不会完美,但他承诺公司会继续听取用户反馈并进行改进。

从本周起,Imagen 3模型将对所有用户开放,但重新引入带有人物的图像功能将从付费用户开始。讲英语的Gemini Advanced、Business和Enterprise用户可以在“未来几天”内期待人像生成功能的回归。

最初在2024年Google I/O大会上预览,”宝石”是谷歌的定制聊天机器人,具有用户创建的指令。它本质上是Gemini对OpenAI的GPT的回应,谷歌的竞争对手在去年推出了GPT。宝石将在未来几天内开始推出。

“通过’宝石’,你可以创建一个专家团队来帮助你思考一个挑战性的项目,集思广益即将到来的活动创意,或为社交媒体帖子撰写完美的标题,” Citron写道。“你的宝石还可以记住一组详细的指令,帮助你节省在繁琐、重复或困难任务上的时间。”

除了定制’宝石’的空白模板外,Gemini还将包含预制的’宝石’,“以帮助你开始使用”并激发新的想法。预制的’宝石’包括:

  • 学习教练 – 帮助你理解复杂的主题
  • 头脑风暴者 – 激发新的想法
  • 职业指导 – 帮助你进行技能提升、决策和设定目标
  • 写作编辑 – 提供有关语法、语调和结构的建设性反馈
  • 编程伙伴 – 为开发人员提升编程技能并激发新项目

‘宝石’今天开始在桌面和移动设备上推出。不过,它们仅对Gemini的高级、商业和企业订阅用户开放,所以你需要订阅付费计划才能使用它们。

总结:

在2024年的Google I/O大会上,谷歌展示了其生成式AI工具的重要升级,特别是Imagen 3图像生成器的推出。这一新工具通过改进图像质量和添加防护措施,解决了之前生成AI人物的多样性问题。然而,谷歌的创新不仅止步于此,通过引入名为“Gems”的定制聊天机器人,进一步增强了其AI能力。这一功能类似于ChatGPT的定制GPT,允许用户通过创建详细的指令,实现更高效的对话和任务执行。

Imagen 3不仅在图像生成方面表现出色,还整合了SynthID工具,用于标记AI生成的图像。这一功能的重新引入预示着谷歌在提供更高质量、更可靠的AI服务方面所做出的努力。与此同时,生成角色的功能将在未来几天内为付费用户恢复,确保新功能能够安全、道德地使用。谷歌承诺,将进一步听取用户反馈,持续改进其AI工具。

此外,谷歌还推出了多个预制的“宝石”供用户选择,包括学习教练、头脑风暴者和职业指导等,这些功能将帮助用户从多个方面提升效率和创造力。然而,这些高级功能仅对Gemini的高级、商业和企业用户开放。通过这些创新,谷歌希望能更好地满足用户的需求,从而在AI领域继续保持领先地位。

选择光年AI,实现私域流量的智能化管理,让您的业务飞速增长。光年AI,不仅能通过AI技术提升私域流量转化率,更能为您提供精准、智能的客户管理,助您在竞争激烈的市场中赢得先机。