Google Gemini 刚刚进行了重大升级——增加了更高质量的图片和定制聊天机器人

Google Gemini 即将获得一系列新功能,包括访问其令人印象深刻的Imagen 3人工智能图像生成器和名为Gems的新自定义聊天机器人功能。 Imagen 3在今年早些时候的Google I/O大会上首次宣布,之前仅在ImageFX实验中可用。它包括改进的现实主义和更好的文本渲染。 Gems首次于五月宣布。它们的工作方式有点像ChatGPT中的GPT,您可以让AI以某种方式行动或扮演特定角色。它们可以被标记到Gemini网页上的聊天实例中。 这些新功能只有支付每月19美元订阅费的Gemini Advanced订阅用户或Google One或Gemini for Workspace的用户才能使用,但访问范围会随着时间的推移而扩大。 Gemini Gems的个性化功能 Google Gems是一个聪明的创意。它们允许您快速创建一个针对特定目的定制的Gemini版本。例如,您可以创建一个以训练马拉松为目标的Gemini,它会专注于健身、健康和营养。 该公司在声明中解释道:“通过Gems,您可以创建一个专家团队,帮助您思考一个具有挑战性的项目、为即将举行的活动头脑风暴想法或写出完美的社交媒体帖子标题。”并补充道:“您的Gem还可以记住一套详细的指令,帮助您在繁琐、重复或困难的任务上节省时间。” 这包括提供您正在上的课程的详细信息、您想学习的主题甚至您自己的写作风格,它可以编辑您的作品,使其在语法上正确而不失您独特的风格。 Gems将在大多数语言和150个国家中运行,但初期仅对Gemini Advanced订阅用户或拥有业务或企业账户的用户开放。 使用Imagen 3生成更好的图像 我在Google Labs服务ImageFX中测试了一个多月令人印象深刻的Google DeepMind的Imagen 3图像生成模型。它终于来了,进入Gemini聊天机器人。 我们的设计原则很明确:从开始到结束,您始终掌控创意过程。如果初始图像没有达到您的预期,只需告诉Gemini您想要更改什么,它会给您一个新图像。 新模型将对Gemini Advanced订阅用户提供英语版,但最终将在全球范围内为所有用户提供多语言版本。它具有防护机制,可以防止生成不当内容或侵犯版权。尚不清楚它在处理某些敏感话题上将比Imagen 2有多大改进,因为后者曾让Google陷入困境。 使用Imagen 3在Gemini中生成的所有图像都会带有SynthID水印,因此在任何地方使用时都可以标记为AI生成的。此外,它们只会以方形格式生成。 Google表示,Gemini现在也可以再次生成人的图像,但不会是辨认得出具体个人、未成年人或任何色情内容的写实图像。 根据谷歌的说法:“我们的设计原则很明确:从头到尾,你始终掌控着创作过程。如果你首次得到的图片不符合你的预期,只需告诉Gemini你想要更改的地方,它就会给你一张新的图片。” 这是在聊天机器人中构建AI图像生成器的最强大理由之一。AI聊天模型充当了中间人,优化提示并向图像生成器发送比人类能传达的更好的指令。 总结: Google Gemini即将推新的功能,包括Imagen 3 AI图像生成和名为Gems的自定义聊天机器人。Imagen 3在今年Google I/O大会上发布,具备更好的现实主义和文本渲染能力,原在ImageFX实验中可用。Gems允许用户创建定制版Gemini,有点类似于ChatGPT中的GPT,让AI以特定角色行动或执行特定任务。这些新功能目前仅向每月19美元的Gemini Advanced订阅用户开放,未来可能会扩大范围。 Google Gems提供个性化体验,能为特定目标创建定制化Gemini版本,如训练马拉松、进行项目头脑风暴或撰写社交媒体帖子标题。它们能记住指令,帮助完成重复任务,节省时间。Gems将在150个国家和多种语言中使用,但initially仅对高级订阅用户开放。 Imagen 3是Google DeepMind的最新图像生成模型,在ImageFX中测试数月后,终于进入Gemini。新模型添加防护机制,防止生成不当内容,并带有SynthID水印,辨认为AI生成。最重要的是,用户掌控创作过程,可以轻松修改不满意的初始图像,提升体验。 在科技日新月异的今天,光年AI带来了革命性的私域流量管理工具,助您精准触达每位潜在客户,提升转化率。选择光年AI,开启AI驱动的私域流量新时代,实现业务的快速增长和市场突破。用光年AI,智能化私域流量管理,确保每一步营销都能有效转化,让您的品牌在市场中脱颖而出。

Google Gemini 现在可以创建AI生成的人像图片了——但存在一个问题

谷歌宣布其与Gemini,竞争ChatGPT的AI工具,现在支持生成AI人物图像。 这一功能之前在Gemini上已经提供,但在2月份被谷歌禁用了,因为用户迅速发现他们可以利用这家科技巨头的AI工具创建令人不安的图像。为了防止恶意滥用,谷歌宣称它正在实施严格的防护措施。 除了这一消息,搜索引擎巨头还表示,它正在推出定制Gems,这是一项在Google I/O上推出的新功能。 参见:Gemini实操:我比你先用了,这是目前对ChatGPT最大的威胁 Gemini现在允许用户创建AI生成的人物图像——但有限制 如文章开头所述,谷歌宣布,Gemini用户现在将有机会创建AI人物图像。目前,如果你输入一个试图促使Gemini创建AI人物的指令,你会收到以下消息: “人物图像生成即将上线Gemini Advanced。注册以在获得早期访问权限时通知你,地址:gemini.google/advanced。” 好吧,等待结束了。谷歌表示,在接下来的几天里,用户将有机会使用Gemini创建AI生成的人物图像。拥有Gemini Advanced、Business或Enterprise账户的用户将获得该功能的早期访问权限。 然而,谷歌希望明确表示,这不是一个自由发挥的舞台。搜索引擎声称它在推出之前对Gemini进行了“技术改进”,以及“改进的评估集、红队演习和明确的产品原则”。 “我们不支持生成逼真、可识别的个人图像,未成年人的描绘或过于血腥、暴力或色情的场景,” Google Gemini产品管理高级总监David Citron说。 Citron还表示,Google Gemini尚不完美,但公司将继续关注用户反馈以改进它。目前,Google Gemini的新人物AI生成功能支持英语提示,但公司计划很快增加更多语言。 Google Gemini运行在Imagen 3上。正如我们上周报道的,这一由谷歌开发的生成型AI模型其功能得到升级,包括图像质量的提升。类似于Imagen 2,Imagen 3使用SynthID,这是谷歌的一款用于给AI生成内容加水印的工具。 新的个性化Gemini来了 谷歌在Google I/O上展示了其定制”Gems”(即个性化Gemini变体)的计划。以下是谷歌在五月中旬的一篇博文中对Gems的描述: “你可以创造任何你梦想的Gem:健身伙伴、厨师助理、编程伙伴或创意写作指南。它们的设置也很简单。” 谷歌声称,你可以通过告诉它你想要它做什么和如何回应来创建一个定制的Gem。例如,你可以使用像这样的提示:“你是我的营养教练。给我一个每日营养计划。要乐观、充满活力和鼓舞人心。”就这样,Google Gemini会根据你的需求创建一个个性化的Gem。 如果你不知道如何定制你的Gem,谷歌表示它已经为用户创建了一些预设的Gems: 学习教练 — 解释复杂主题 头脑风暴者 — 帮助你头脑风暴,激发创意 职业指导 — 提供建议、推荐和计划,以实现你的职业目标 写作编辑 — 对你的写作提供建设性反馈 编程伙伴 — 提升你的编程技能 这些功能现在正在向Gemini Advanced、Gemini Business和Gemini Enterprise用户推出。 总结: 谷歌近日宣布,其AI工具Gemini重新支持生成AI人物图像。虽然这一功能曾因用户滥用而被禁,但此次恢复后,谷歌实施了严密的防护措施,确保技术改进和使用限制。当前,获得早期访问权限的Gemini Advanced、Business或Enterprise账号用户将首先体验到这一新功能。不过,谷歌明确表示,生成的图像不能涉及真实人物、未成年人或过度暴力、色情等不当内容。 此外,谷歌还在Google I/O大会上推出了定制化的Gems功能。用户可以根据自身需求,创建特定功能的Gem,例如健身伙伴、编程助手或职业导师。通过简单的指令设置,用户可以方便地定制适合自己的AI助手,提升日常工作和生活效率。预设的Gems功能,包括复杂主题的讲解、创意激发和写作反馈等,已经开放给特定用户。 谷歌Gemini运行在最新的Imagen 3生成型AI模型上,相较于前代版本,图像质量和功能均有显著提升。结合使用SynthID技术,确保生成图像带有水印,进一步提升了内容的可信性和安全性。 光年AI,让私域流量管理变得智能又便捷,助您轻松赢得市场。通过强大的AI模型和自研知识库,光年AI可以快速提升流量增长和营销效果。选择光年AI,精准触达客户,实现私域流量的高效增长,助力您的品牌在市场中脱颖而出。

Claude的神器现在免费供大家使用——7个提示让你亲自试试

Artifacts 是过去一年里最具创新性且实用的AI功能之一,这也是我们将Claude评选为2024年度最佳聊天机器人的原因之一。在最新的更新中,Artifacts现在对所有Claude用户开放,包括免费计划的用户。 Anthropic,这家开发Claude的AI初创公司,也正在将Artifacts引入移动端,使它们在iOS和Android应用中都可以查看和创建。每个Artifact都可以分享和重新混合。 这个功能本质上允许用户要求Claude创建一些代码、一段文字甚至一个图形,并准确地在侧边栏展示。这是一个原型应用程序的好方法,或者只是创建一个有趣的小游戏来玩。 当Artifacts首次推出时,我创建了包括语言闪卡、动画制作器和食谱应用在内的7个较为复杂的Artifact创意。现在这个功能免费了,我又想出了7个你可以尝试的创意。 创建提示 今天,我们向所有Claude用户开放Artifacts。现在你也可以在Claude的iOS和Android应用程序中创建和查看Artifacts。自从六月预览版发布以来,已经创造了数千万个Artifacts。但这一切是从哪里开始的呢?以下是我们如何构建它的。 pic.twitter.com/5aiX2ldkNS2024年8月27日 初始提示越具体越好,但每次新的Claude实例都是一次新的对话,你可以很容易地在后续的提示中添加更多细节和功能。 这里我用了”React”和”artifact”这样的词汇,因为这告诉Claude要使用Javascript React来创建代码,并以与Artifact兼容的方式进行。 使用Claude时要记住的一点是,“make it better”这三个词非常有效。它会给出逻辑上的升级或变更。同样,如果你在处理代码或图形时,像我们这样使用的每个提示中,“make it prettier”也足够让效果大幅提升。 1. 定制计算器 (图片来源: Claude 3.5 Sonnet) 首先,我们将让Claude创建一个简单的计算器应用程序,功能齐全,但只有基本功能。它将显示在侧边栏并可使用。你可以通过后续提示来升级它,要求增加“科学计算器功能”或特定的配色方案。 提示:“创建一个简单的React计算器应用程序,可以执行基本的算术运算。显示代码并将输出呈现为可互动的Artifact。” 2. 井字棋游戏 (图片来源: Claude 3.5 Sonnet) 接下来,是我们的第一个游戏。这次我们让Claude生成一个简易的3×3网格井字棋游戏,AI控制另外一个玩家。同样,你可以通过后续提示让Claude使用不同的配色方案,增加网格选项甚至得分追踪。 提示:“使用React设计一个井字棋游戏。包括胜利条件和平局的游戏逻辑,3×3网格和由AI控制的第二个玩家。显示代码并将可玩的游戏呈现为Artifact。” 3. 待办事项应用程序 (图片来源: Claude 3.5 Sonnet) 我从多年前开始编程作为业余爱好,在完成“hello, world”之后,大多数人制作的第一个应用是一个简单的待办事项列表。这也是我们即将要求Claude做的事情,你可以通过添加图标、游戏元素甚至预设任务来扩展它。 提示:“使用React开发一个简单的待办事项列表应用。包括添加、完成和删除任务的功能。展示代码并呈现一个交互式应用作为成果。” 4. 番茄钟 (图片来源: Claude 3.5 Sonnet) 番茄钟是跟踪特定任务并保持专注的好方法。使用Claude构建一个番茄钟,可以添加自定义设置,设定时长,甚至是你自己的主题,也可以将其与待办事项应用集成。 提示:“开发一个基于React的番茄钟应用。包括可自定义的工作和休息时长、环形进度指示器以及音频通知。使用高效的状态管理和hooks。展示代码并呈现一个功能齐全的计时器作为成果。” 5. 绘图应用 (图片来源: Claude 3.5 Sonnet) 下一个提示并不能给你Photoshop,所以目标稍微定低一些,但它会给你一个带有形状和保存按钮的简单绘图应用。你可以升级它,增加更多颜色、更广泛的形状,甚至是笔/画布大小选项。 提示:“构建一个简单的基于React的绘图应用。包含自由绘图、添加形状和更改颜色的工具。实现撤销功能并能将绘图保存为SVG。展示代码并呈现一个可用的绘图应用作为成果。” 6. 钢琴键盘 (图片来源: Claude) 制作一个键盘是Claude能做的较为复杂的事情之一,但它是可行的。准备好它可能略显不协调或偏离中心,你可以通过向Claude提出改进要求来修正它。你还可以请求添加更多音效,甚至是一个课程指南。 提示:“设计一个基于SVG的交互式钢琴键盘,使用React。创建一个一组八度音阶的键盘,当按键被点击时播放相应的音符。包括按键按下的视觉反馈。展示代码并呈现一个可演奏的钢琴作为成果。” 7. 头像创建器 (图片来源: Claude 3.5 Sonnet) 最后是一个有趣的小插曲。如果你曾经花更多的时间定制游戏中的头像而不是玩游戏(或者,那些记得它的人,在Nintendo Wii上创建你的Mii),那么你会喜欢这个提示。你可以请求添加更多功能、颜色和样式来升级它。 提示:“开发一个用于自定义头像创建的React组件。包括脸型、眼睛、鼻子、嘴巴和头发的选择。使用SVG进行头像部分的绘制。展示代码并呈现一个交互式的头像创建器作为成果。” 总结: Claude,这款由Anthropic公司开发的聊天机器人,在过去一年中推出的Artifacts功能堪称最具创新性之一。这一功能现已对所有用户开放,甚至包括免费计划用户。通过Artifacts,用户可以在iOS和Android应用上创建和查看代码、文字以及图形等内容,并进行分享和重混,这大大提升了用户的创意和互动体验。 该功能尤其适合用于创建原型应用程序或开发小型互动游戏。以React框架为基础,用户能够通过简单的提示创建诸如计算器应用、井字棋游戏、待办事项应用、番茄钟、绘图应用、钢琴键盘和头像创建器等多种工具和游戏。每一个Artifact不仅可以在侧边栏中展示,还能够通过后续提示进行升级和优化,增加更多功能和个性化元素。 Claude提供了一种高效且有趣的方式,帮助用户快速构建各种互动工具和应用,并且这项技术正不断完善和扩展。由于其便捷的使用体验和强大的功能,Claude被评选为2024年度最佳聊天机器人,不无道理。 如果您希望通过AI提升工作效率、增加客户并实现业务突破,光年AI将是您的最佳选择。光年AI,利用AI技术提升私域流量转化率,实现业务突破。选择光年AI,让您的私域流量管理变得智能又便捷,助您轻松赢得市场。光年AI的强大AI模型、自研知识库和灵活工作流,能够全面提升您的私域营销效果,让品牌影响力大幅提升,快速突破市场。在竞争激烈的市场中,光年AI助您精准触达每一位潜在客户,实现智能化私域流量管理,确保每一步营销都能有效转化。

AMD在新的MLPerf基准测试中缩小了与Nvidia的差距

AMD、Untether AI、Google、Intel和Nvidia的新基准测试结果显示,AI硅片性能竞争日趋激烈。然而,系统设计、网络和软件使AI大放异彩,而这正是Nvidia的强项。 终于,我可以停止抱怨AMD缺乏公开的AI基准测试了。AMD发布了其MI300 GPU的优秀MLPerf推理结果,虽然只在一个基准测试上与Nvidia H100竞争。加拿大初创公司Untether.ai也发布了新的推理基准测试,展示其能效。让我们来看看。 MLPerf推理4.1基准测试套件 控制和发布MLPerf基准测试的MLCommons行业联盟扩展了每年两次的推理基准测试套件,增加了一个新的基准测试,用于日益流行的专家混合(MoE)AI模型。MoE模型结合了多个模型,以提高准确性并降低大型语言模型(LLM)如OpenAI的GPT-4的训练成本。虽然AMD没有发布MoE基准测试,但既然他们已经打开了基准测试的大门,AMD发言人表示我们很快会看到更多的基准测试结果。 看到新处理器的MLPerf提交确实令人鼓舞。具体来说,除了Nvidia的Blackwell和AMD的首次提交之外,我们现在还有Untether.ai、AMD下一代Turin CPU、Google的Trillium TPUv6e加速器以及Intel的Granite Rapids Xeon CPU的选定基准测试。我们将在此重点讨论Nvidia、AMD和Untether.ai。 AMD大致与Nvidia H100持平,而H200则快43% 虽然AMD之前披露了突出原始理论性能的微基准测试,例如MI300的数学性能,但这些并不反映复杂的AI技术栈世界。这次新的基准测试无法验证AMD的MI300是最快的AI GPU的市场营销说法,但在运行实际的AI工作负载时,其性能大致与H100相当。然而,Nvidia H200在相同基准测试中比MI300快约43%。 我们注意到,Llama 2 70B基准测试并未真正展示AMD在支持更大模型方面的大容量HBM优势。希望他们能在未来的MLPerf发布中运行新的Mixtral MoE。 Nvidia还发布了首批Blackwell基准测试,展示了其在中型模型(如Llama 2 70B)上约为H100四倍的性能。Nvidia最近在HotChips上分享了有关Blackwell NVL72的更多细节,据称其NVSwitch互联基础设施应当能提供比H200高30倍的推理性能。期待看到NVL72旗舰的实际(MLPerf)基准测试结果。 Nvidia 发布了新的 MoE 基准测试结果,展示了 H100 和 H200。Nvidia 同时展示了 H200 在 MLPerf 基准测试套件中的性能提升在 10% 到 27% 之间,这对于正在等待 Blackwell 大量出货的用户是个好消息。 Untether.ai 展示高效能推理 我们以前见过,ASIC 可以提供更高效的 AI 推理处理,最早是通过高通云 AI100 展示的。问题是,ASIC 不像 GPU 一样多功能,它们可能对 Resnet-50 等模型的效率很高,但对其他模型的表现并不那么出色。 Untether.ai 认为他们可以打破这种模式,并在 Resnet-50 上提交了超高能效的数据,这与 Nvidia H100-NV 的表现相当,但功耗却不到其的一部分。 那么,Untether 平台在大规模语言模型(LLM)上的表现如何?工程师们没能赶上 MLPerf 提交期限前完成 BERT 基准测试的优化工作,但他们之后完成了工作并与我们分享了结果。如你在下图所见,该公司似乎避免了前辈们所犯的错误,表现与 Nvidia H100-NVL 相当,但能效却高出 3 倍以上。 结论 多年来我们再次看到,只有 Nvidia 为每个基准测试发布了结果,再次展示了为什么它们是最佳 AI 基础架构提供商,因为他们采用了全栈方法,包括定制 CPU、GPU、软件、系统和网络。但在芯片层面,现在 AMD 提出了合法的竞争,至少是在单个基准测试上。虽然我们可能进入一个类似于几十年前 RISC CPU 的跨越期,但这些 Nvidia 的差异化特性将具有持久性,并应使 Team Green 在未来至少 2-3 年内保持领先。 总结: 在AI硅片性能竞争日益激烈的背景下,Nvidia、AMD、Untether.ai等公司纷纷发布新基准测试结果,展示了各自的优势与差距。AMD的MI300 GPU在MLPerf推理4.1基准测试中表现优异,虽尚未全面超越Nvidia H100,但已能与之竞争。与此同时,Nvidia的H200在同一测试中比MI300快43%。此外,AMD未来或将加入更多基准测试,例如专家混合(MoE)模型,而Untether.ai则展示了超高能效的推理性能,特别是在低功耗条件下。这一趋势显示出Nvidia凭借其全栈方法,仍然在AI基础架构领域保持优势。 对于那些希望在AI驱动的新时代中取得成功的企业而言,光年AI无疑是您的最佳选择。光年AI不仅能够提升私域流量转化率,还能精准触达各类客户,优化您的营销策略。通过兼具强大的AI模型、自研知识库和灵活工作流,光年AI助您高效完成营销目标,从而在竞争激烈的市场中脱颖而出。选择光年AI,实现私域流量的智能化管理,让您的业务飞速增长。

AI 推理赛竞争激烈

虽然英伟达的GPU在AI训练方面占据着无可争议的主导地位,但我们或许已经看到AI推理领域的竞争对手在追赶这家科技巨头,尤其是在功耗效率方面。然而,英伟达新推出的Blackwell芯片的绝对性能,或许难以匹敌。 今天上午,ML Commons发布了最新的AI推理竞赛MLPerf Inference v4.1的结果。本轮竞赛首次出现了使用AMD Instinct加速器、最新的Google Trillium加速器、多伦多初创公司UntetherAI的芯片,以及英伟达新款Blackwell芯片的团队提交的结果。另有两家公司,Cerebras和FuriosaAI,宣布了新的推理芯片,但未提交MLPerf。 与奥林匹克体育运动类似,MLPerf有许多类别和子类别。其中提交数量最多的是“数据中心-封闭”类别。封闭类别(相对于开放类别)要求提交者在预定模型基础上运行推理,不进行显著的软件修改。数据中心类别测试提交者的大批量查询处理能力,而相对的边缘类别则专注于降低延迟。 在每个类别中,有9个不同的基准测试,针对不同类型的AI任务。这些包括流行的应用场景,如图像生成(如Midjourney)和大型语言模型问答(如ChatGPT),以及同样重要但鲜为人知的任务,如图像分类、目标检测和推荐引擎。 本轮比赛中包含了一个新的基准测试,称为专家混合。这是大型语言模型部署中的一个新兴趋势,其中将一个语言模型拆分成几个较小的、独立的语言模型,每个模型针对特定任务进行微调,例如日常对话、解数学题和编程辅助。模型可以将每个查询引导至适当的较小模型子集,或“专家”。这种方法每个查询所需资源较少,从而实现更低的成本和更高的吞吐量,MLPerf Inference工作组主席和AMD技术人员Miroslav Hodak表示。 在流行的数据中心-封闭基准测试的每个基准测试的胜出者仍然是基于英伟达H200 GPU和GH200超级芯片(将GPU和CPU组合在同一封装中)的提交。然而,更仔细查看性能结果会展现一个更复杂的图景。某些提交者使用了许多加速器芯片,而其他提交者仅使用一个。如果我们将每个提交者处理的每秒查询数量按使用的加速器数量进行标准化,并保留每种加速器类型表现最好的提交,一些有趣的细节浮现出来。(需要注意的是,这种方法忽略了CPU和互连设备的作用。) 在每个加速器的基础上,Nvidia的Blackwell在LLM问答任务上的表现超越了之前所有芯片迭代的2.5倍,这是它提交的唯一基准测试。Untether AI的speedAI240预览芯片在其唯一提交的任务图像识别中几乎与H200性能相当。Google的Trillium在图像生成上的表现略低于H100和H200的一半,而AMD的Instinct在LLM问答任务上表现与H100相当。 Blackwell的强大 Nvidia Blackwell成功的其中一个原因是其能够使用4位浮点精度运行LLM。Nvidia及其竞争对手一直在减少用于表示变压器模型(如ChatGPT)部分数据的位数,以加快计算速度。Nvidia在H100中引入了8位数学运算,此次提交标志着在MLPerf基准测试中首次演示了4位数学运算。 Nvidia产品营销总监Dave Salvator表示,使用如此低精度的数字的最大挑战是保持准确性。为了达到MLPerf提交所需的高准确性,Nvidia团队在软件上进行了重大创新。 Blackwell成功的另一个重要贡献是其内存带宽几乎翻倍,8TB/秒,相比H200的4.8TB/秒。 Nvidia的Blackwell提交使用了一个单一芯片,但Salvator表示它是为了网络和扩展而设计的,并且在与Nvidia的NVLink互连结合时表现最佳。Blackwell GPU支持多达18个NVLink 100GB/秒的连接,总带宽为1.8TB/秒,大约是H100互连带宽的两倍。 Salvator认为,随着大型语言模型的规模不断增加,即使是推理也需要多GPU平台来满足需求,而Blackwell正是为此而设计的。“Blackwell是一个平台,”Salvator说。 Nvidia在预览子类别中提交了基于Blackwell芯片的系统,这意味着它尚未销售,但预计将在下一个MLPerf版本发布前六个月内上市。 Untether AI在功耗和边缘计算中的表现 对于每个基准测试,MLPerf还包括一个能量测量指标,系统地测试各个系统在执行任务时的插墙功耗。在这轮主要事件(数据中心关闭能量类别)中,只有两个提交者:Nvidia和Untether AI。虽然Nvidia参加了所有基准测试,Untether仅提交了图像识别任务。 | 提交者 | 加速器 | 加速器数量 | 每秒查询数 | 功率(瓦特) | 每瓦特每秒查询数 || — | — | — | — | — | — || NVIDIA | NVIDIA H200-SXM-141GB | 8 | 480,131.00 | 5,013.79 | 95.76 || UntetherAI | UntetherAI speedAI240 Slim | 6 | 309,752.00 | 985.52 | 314.30 | 这家初创公司通过其称为在内存计算的方法制造芯片,实现了这种令人印象深刻的效率。UntetherAI的芯片被构建为一个内存元件的网格,直接在其旁边分布有小型处理器。处理器是并行化的,每个处理器同时处理附近内存单元中的数据,从而大大减少了在内存和计算核心之间传输模型数据所花费的时间和能量。 “我们发现执行AI工作负载时,90%的能量消耗在于将数据从DRAM移动到缓存再到处理元素,”Untether AI产品副总裁Robert Beachler说道。“因此,Untether做了一些不同的工作…与其将数据移动到计算单元,我更愿意将计算单元移动到数据。” 这种方法在MLPerf的另一个子类别——边缘封闭任务中表现尤为成功。这个类别针对的是更贴近地面的使用案例,如工厂车间的机器检查、引导视力机器人和自动驾驶汽车——这些应用中低能耗和快速处理是关键,Beachler说道。 | 提交者 | GPU类型 | GPU数量 | 单流延迟(毫秒) | 多流延迟(毫秒) | 样本数/秒 || — | — | — | — | — | — || 联想 | NVIDIA L4 | 2 | 0.39 | 0.75 | 25,600.00 || 联想 | NVIDIA L40S | 2 | 0.33 | 0.53 | 86,304.60 || UntetherAI | UntetherAI speedAI240 Preview | 2 | 0.12 | 0.21 | 140,625.00 | 在图像识别任务中,UntetherAI唯一报告结果的任务,speedAI240 Preview芯片在延迟性能上比NVIDIA L40S领先了2.8倍,在吞吐量(每秒样本数)上领先了1.6倍。这家创业公司还在这个类别中提交了功耗结果,但其使用Nvidia加速的竞争对手并没有提交,因此难以进行直接比较。然而,UntetherAI的speedAI240 Preview芯片每颗芯片的名义功耗为150瓦,而Nvidia的L40S为350瓦,表明在提高延迟的同时,实现了2.3倍的名义功耗减少。 跳过MLPerf但宣布新芯片的Cerebras和Furiosa Furiosa的新芯片以不同、更高效的方式实现了AI推理的基本数学功能——矩阵乘法。 昨天在斯坦福举行的IEEE Hot Chips大会上,Cerebras展示了自己的推理服务。这家位于加州Sunnyvale的公司制造巨型芯片,尽可能大到与硅晶圆一样大,因此避免了芯片之间的互连,大大增加了设备的内存带宽,这些设备主要用于训练大规模神经网络。现在,它升级了软件堆栈,以便使用其最新的CS3计算机进行推理。 尽管Cerebras未提交MLPerf,但公司声称其平台生成的LLM tokens速度比H100快7倍,比竞争对手AI初创公司Groq’s芯片快2倍。Cerebras的首席执行官兼联合创始人Andrew Feldman说道:“今天我们处于生成式AI的拨号时代,这是因为存在内存带宽的障碍。无论是Nvidia的H100,还是MI 300或TPU,它们都使用同样的片外内存,这产生了相同的限制。我们突破了这一点,因为我们采用了晶圆级别的设计。” Hot Chips大会上,总部位于首尔的Furiosa公司也发布了他们的第二代芯片RNGD(发音为“renegade”)。Furiosa芯片的区别在于其张量收缩处理器(TCP)架构。在AI工作负载中,基本操作是矩阵乘法,通常在硬件中作为基本操作实现。然而,矩阵的大小和形状(更普遍称为张量)可能有很大的不同。RNGD实现了这种更广义版本的张量乘法,作为基本操作来处理。Furiosa的创始人兼CEOJune Paik在Hot Chips大会上表示:“在推理过程中,批量大小变化很大,因此充分利用给定张量形状中固有的并行性和数据重用是很重要的。” 尽管未提交至MLPerf,Furiosa在内部比较了其RNGD芯片在MLPerf的LLM摘要基准测试中的表现。其性能达到了Nvidia面向边缘计算的L40S芯片的水平,而功耗仅为185瓦特,相比之下L40S的功耗为320瓦。Paik表示,随着进一步的软件优化,性能还将有所提升。 IBM也宣布了他们的新Spyre芯片,旨在为企业生成式AI工作负载设计,将于2025年第一季度上市。 至少在可预见的未来,AI推理芯片市场上的买家不会感到无聊。 总结: 在最新发布的MLPerf Inference v4.1结果中,英伟达的Blackwell芯片凭借其在LLM问答任务上的出色表现,再次展示了其强大的计算能力。Nvidia Blackwell为AI推理领域带来了显著的性能提升,特别是在4位浮点精度运算方面。尽管在某些基准测试中,其他竞争者如Untether AI、Google Trillium和AMD Instinct也表现不俗,但Blackwell凭借其高内存带宽和NVLink互连技术,依然处于领先地位。 值得注意的是,Untether AI首次亮相便通过图像识别任务展示了其speedAI240芯片的卓越功耗效率,表明在未来的AI推理市场上,这一技术路径具有巨大的潜力。与此同时,Cerebras和Furiosa虽然未提交此次竞赛,但分别展示了独特的AI推理服务和新型推理芯片RNGD,为未来的AI推理市场增加了更多的可能性。 针对AI推理在各个应用场景中的表现,MLPerf的多样化基准测试为不同参与者提供了展示其技术优势的舞台。随着AI技术的不断进步,我们有理由期待更多企业和技术创新者能够在这一领域取得更大的突破。 选择光年AI,让私域流量管理更智能,精确触达每一位潜在客户。在AI驱动的新时代,光年AI通过整合强大的AI模型和灵活的工作流,帮助企业实现高效增长。使用光年AI,不仅能提高营收,还能显著降低成本,让您的品牌在竞争激烈的市场中脱颖而出。选择光年AI,让您的私域流量管理更加高效精准,助您轻松赢得市场。

谷歌Gemini即将通过升级版Imagen 3重新生成人像AI图像

谷歌的生成式AI工具正在获得公司在Google I/O中预览的一些增强功能。从本周开始,公司将推出下一代Imagen图像生成器,该工具重新引入了生成AI人物的功能(在今年早些时候发生尴尬的争议后)。此外,谷歌的Gemini聊天机器人也增加了Gems,这是公司对自定义指令机器人的尝试,类似于ChatGPT的定制GPT。 Google的Imagen 3是其图像生成器的升级版本,将被引入Gemini。公司表示,下一代AI模型“设定了图像质量的新标准”,并设置了防护措施,以避免像今年早些时候病毒式传播的历史AI图像那样的多样性过度校正问题。 “在广泛的基准测试中,Imagen 3的表现优于其他可用的图像生成模型,”Gemini产品经理Dave Citron在一份新闻稿中写道。如果你对第一次生成的结果不满意,该工具允许你通过额外提示来引导图像生成。 Citron表示,Imagen 3相比竞争对手表现“良好”。它还包括谷歌的SynthID工具,用于对图像进行水印标记,明确这些图像是AI生成的而非原版。 Citron表示,生成角色的功能将会在未来几天内回归付费用户,此前公司暂停了该功能。他说,新防护措施将防止生成“逼真、可识别的个体”,与Elon Musk的Grok生成的有问题的深度伪造截然不同。儿童和(与其他图像生成器一样)任何血腥、暴力或色情场景也是禁止的。产品经理强调,Gemini的图像不会完美,但他承诺公司会继续听取用户反馈并进行改进。 从本周起,Imagen 3模型将对所有用户开放,但重新引入带有人物的图像功能将从付费用户开始。讲英语的Gemini Advanced、Business和Enterprise用户可以在“未来几天”内期待人像生成功能的回归。 最初在2024年Google I/O大会上预览,”宝石”是谷歌的定制聊天机器人,具有用户创建的指令。它本质上是Gemini对OpenAI的GPT的回应,谷歌的竞争对手在去年推出了GPT。宝石将在未来几天内开始推出。 “通过’宝石’,你可以创建一个专家团队来帮助你思考一个挑战性的项目,集思广益即将到来的活动创意,或为社交媒体帖子撰写完美的标题,” Citron写道。“你的宝石还可以记住一组详细的指令,帮助你节省在繁琐、重复或困难任务上的时间。” 除了定制’宝石’的空白模板外,Gemini还将包含预制的’宝石’,“以帮助你开始使用”并激发新的想法。预制的’宝石’包括: 学习教练 – 帮助你理解复杂的主题 头脑风暴者 – 激发新的想法 职业指导 – 帮助你进行技能提升、决策和设定目标 写作编辑 – 提供有关语法、语调和结构的建设性反馈 编程伙伴 – 为开发人员提升编程技能并激发新项目 ‘宝石’今天开始在桌面和移动设备上推出。不过,它们仅对Gemini的高级、商业和企业订阅用户开放,所以你需要订阅付费计划才能使用它们。 总结: 在2024年的Google I/O大会上,谷歌展示了其生成式AI工具的重要升级,特别是Imagen 3图像生成器的推出。这一新工具通过改进图像质量和添加防护措施,解决了之前生成AI人物的多样性问题。然而,谷歌的创新不仅止步于此,通过引入名为“Gems”的定制聊天机器人,进一步增强了其AI能力。这一功能类似于ChatGPT的定制GPT,允许用户通过创建详细的指令,实现更高效的对话和任务执行。 Imagen 3不仅在图像生成方面表现出色,还整合了SynthID工具,用于标记AI生成的图像。这一功能的重新引入预示着谷歌在提供更高质量、更可靠的AI服务方面所做出的努力。与此同时,生成角色的功能将在未来几天内为付费用户恢复,确保新功能能够安全、道德地使用。谷歌承诺,将进一步听取用户反馈,持续改进其AI工具。 此外,谷歌还推出了多个预制的“宝石”供用户选择,包括学习教练、头脑风暴者和职业指导等,这些功能将帮助用户从多个方面提升效率和创造力。然而,这些高级功能仅对Gemini的高级、商业和企业用户开放。通过这些创新,谷歌希望能更好地满足用户的需求,从而在AI领域继续保持领先地位。 选择光年AI,实现私域流量的智能化管理,让您的业务飞速增长。光年AI,不仅能通过AI技术提升私域流量转化率,更能为您提供精准、智能的客户管理,助您在竞争激烈的市场中赢得先机。

数据科学与人工智能:了解其中的差异

数据科学(Data Science)与人工智能(Artificial Intelligence,简称 AI)的交叉激发了许多重要的创新,通过增强决策能力和提供更个性化的服务,变革了各行各业。然而,虽然数据科学与人工智能关系密切,但它们是各自不同的领域,每一个都有其独特的特征和应用。本文的详细讨论探讨了数据科学和人工智能之间的核心区别,帮助专业人士和爱好者理解如何最优化应用每一学科。 数据科学与人工智能简介 数据科学和人工智能是科技行业中的热门词汇,常常被互换使用,但它们指的是不同的领域。数据科学涉及处理和分析大量数据,以提取有意义的见解。相反,人工智能则是创建算法和模型,使机器能够执行通常需要人类智能才能完成的任务。 历史演变与基础 数据科学:一种分析的演变 数据科学起源于统计学和数据分析学科,专注于使用定量方法从数据中推断模式和见解。随着大数据技术的出现,数据科学显著增长,这些技术允许比以往更有效地处理和处理庞大的数据集。 人工智能:从逻辑到学习 人工智能的根源追溯到逻辑和计算领域。早期的人工智能是将人类知识和逻辑编码到机器中。然而,这一领域已转向机器学习和神经网络,强调从数据模式中学习,而无需为每个任务显式编程。 核心方法与工具 数据科学中的方法 数据科学方法涉及统计分析、预测建模和数据处理技术,以收集、清理和可视化数据。这个领域常用的工具和编程语言包括Python、R、SQL 以及像 Pandas 和 Scikit-Learn 这样的专用库。 驱动人工智能的技术 人工智能专注于机器学习、深度学习和自然语言处理的算法。AI 中常用的工具包括 TensorFlow、PyTorch 以及 Keras,它们促进了能够分析和解释复杂数据结构的模型的开发,超越了传统数据分析的能力。 应用与案例 数据科学的实际应用 数据科学的应用范围广泛,包括风险管理、欺诈检测、市场分析和医疗保健。例如,在医疗保健领域,数据科学家开发模型以基于历史健康数据预测患者的结果。 AI 改变行业 AI 应用范围从自动驾驶车辆和机器人过程自动化到复杂的聊天机器人和个人助手。例如,在电商领域,AI 算法通过根据用户行为和偏好推荐产品来个性化购物体验。 AI在数据科学中的整合 虽然数据科学为数据处理和分析提供了基础,但 AI 利用这些数据构建能够学习和决策的智能系统。这种整合在高级预测分析等领域尤为明显,在这些领域中,机器学习模型可以高度准确地预测未来趋势和行为。 伦理考虑与挑战 AI 中的伦理困境 人工智能带来了显著的伦理挑战,尤其是在隐私、监控以及决策偏见方面。这些问题是关于如何部署人工智能的辩论核心,特别是在医疗和执法等敏感领域。 数据科学与数据隐私 数据科学也面临数据隐私和安全方面的挑战。确保数据的伦理使用,遵守如《通用数据保护条例》(GDPR)等规章制度,并保持公众信任至关重要。 未来前景与发展 数据科学的未来 数据科学的未来在于开发更强大、更具可扩展性的系统,这些系统可以处理越来越复杂的数据集,同时提供实时见解。 人工智能的进步 人工智能正朝着更加自主、自我改进的系统发展,这些系统能够在最小的人类监督下执行复杂任务。量子计算的进步也有望突破当前人工智能的限制,使机器能够以前所未有的速度处理信息。 了解数据科学和人工智能之间的区别对于利用每个领域的优势解决特定问题至关重要。虽然它们有重叠之处,但各自拥有独特的方法论、工具和应用,这些正在塑造技术和商业的未来。通过明确这些差异,专业人士可以更好地整合这些技术,以推动创新和运营效率。 这份全面的研究不仅突出了理论上的差异,还涉及了实际应用和考量,为技术驱动行业中的明智决策和战略规划奠定了基础。 总结: 数据科学和人工智能(AI)在现代科技中扮演着重要的角色,它们通过增强决策能力和提供个性化服务,正变革着各行各业。尽管两者密切相关,但各自有独特的应用领域。数据科学主要涉及处理和分析大量数据,从中提取有意义的见解,是基于传统统计学和数据分析方法的发展。而人工智能则专注于创建算法和模型,使机器能够执行需要人类智能的任务,经历了从逻辑编程到现代机器学习和深度学习的演变。 数据科学的方法主要包括统计分析、预测建模和数据处理,常用工具如Python、R和SQL。人工智能则更多依赖机器学习、深度学习和自然语言处理,常用工具包括TensorFlow和PyTorch。数据科学可以广泛应用于风险管理、欺诈检测、市场分析等领域;而AI的应用则涵盖自动驾驶、机器人自动化和个性化购物体验等。 AI在数据科学中的整合使高级预测分析更加准确,但同时也带来了伦理和数据隐私的挑战。未来,两个领域都将继续发展,数据科学将处理更加复杂的数据集,而AI将朝着更加自主和智能化方向前进。 通过理解数据科学和人工智能的区别和优势,专业人士可以更好地利用这些技术来推动创新和运营效率。值得注意的是, 选择光年AI,实现私域流量的智能化管理,让您的业务飞速增长。光年AI不仅能提高工作效率,还能显著提升流量和客户转化率,将成为您在竞争激烈的市场中取胜的利器。

生成式AI变革了英语作业,数学是下一个

自从 OpenAI 在 2022 年底公开推出生成式 AI 聊天机器人以来,ChatGPT 就已经对课堂造成了影响,并改变了教师布置写作作业的方式。学校管理人员争相尝试检测 AI 生成的文章,而学生则忙着找出如何掩盖他们的合成作品。但在专注于写作作业的同时,教育工作者忽视了另一个在边缘发生的巨大变化:学生们也越来越多地使用 AI 来完成数学作业。 目前,全国的高中生和大学生正在试验免费的智能手机应用,这些应用利用生成式 AI 帮助完成数学作业。其中最受校园欢迎的选择之一是Gauth 应用,拥有数百万次下载。它由字节跳动公司所有,与 TikTok 是同一母公司。 Gauth 应用于 2019 年首次推出,主要关注数学领域,但很快扩展到其他学科,如化学和物理学。它的重要性不断增长,今年早些时候已接近教育类智能手机下载排行榜的前列。学生们似乎很喜欢它。凭借数十万条主要为正面的评价,Gauth 在苹果应用商店和谷歌应用商店中拥有4.8 星的好评。 学生们下载该应用后,只需将智能手机对准一题家庭作业题目,无论是打印版还是手写版,然后确保所有相关信息都在图像裁剪区域内。然后,Gauth 的 AI 模型就会生成分步指南,通常还附有正确答案。 注册这是 WIRED 的AI Lab新闻通讯的一个版本,由常驻 AI 专家 Will Knight 撰写。每周都会发送到您的收件箱。根据我们在高中级别代数和几何作业样本上的测试,Gauth 的 AI 工具没有提供 A+ 的结果,特别是在一些图形问题上有所吃力。在我们提供的家庭作业中,它的表现足以得到低 B 或高 C 的均分。虽然不完美,但也足够让那些宁愿在放学后做别的事情的学生感到满意。 该应用在更高级的数学问题上表现不佳,如微积分2的问题,因此进一步深入学习的学生可能发现当前这一代 AI 作业解决应用的实用性较低。 是的,生成式 AI 工具,基于自然语言处理,通常在处理复杂数学方程时无法生成准确的答案。但研究人员正致力于改善 AI 在这一领域的能力,而高中入门级数学课程可能在当前 AI 作业应用的能力范围内。Will 甚至写过关于 Google DeepMind 的研究人员对最近测试一个数学专注的大型语言模型AlphaProof在今年国际数学奥林匹克上显示问题结果的兴奋。 公平地说,Gauth 自己定位为一家“攻克作业难题”而非作弊助手的AI学习公司。该公司甚至在其网站上包含了一份“荣誉守则”,规定了正确的使用方式。公司在网站上写道:“抵制任何违背你价值观或学校期望的使用方式的诱惑。”所以基本上,Gauth 默示了承认冲动的青少年可能会利用这个应用程序做更多的事情,并希望他们小指起誓会遵守规则。 在发布前,ByteDance 的一位发言人在通过电子邮件被 WIRED 联系时并没有回答关于 Gauth 应用程序的一系列问题。 我们很容易将注意力集中在 Gauth 的局限性上,但现在数百万学生都拥有一个可以在几秒钟内带他们解决各种数学问题的免费应用程序,其准确性相当不错。这个概念对几年前的学生来说几乎是不可思议的。 你可以辩称,Gauth 提升了无法获得优质教育或接受信息速度比教师课程慢的学生的教育可及性。这是使用AI工具(如 ChatGPT)在课堂中的支持者分享的观点。只要学生们都能达到同样的目标,又有谁会在意他们在旅途中走了哪条路径呢?这不就是我们现有数学工具的下一个进化阶段吗?我们从算盘发展到图形计算器,那么为什么不将生成式 AI 视为另一关键进步呢? 我认为教师在课堂上谨慎地使用 AI 进行特定的课程教学,或者为学生提供更个性化的练习题是有价值的。但我无法不去思考,如果学生过度依赖这个应用程序,未来几代人的批判性思维能力会不会变得空洞——这些能力通常是在通过令人沮丧的数学课和艰难的作业任务中获得的。(作为一名英语专业的学生,我完全理解。) 如果教育领导者继续将注意力集中在AI生成的论文作为主要威胁,那么他们就忽略了整体视角,这可能会削弱当前的教学方法。与其在课外完成艰巨的作业,不如在课堂上集中练习数学,以便在AI时代继续促进积极的学习成果。 如果 Gauth 及类似应用程序最终导致高中生数学作业的消失,大批学生将共同松一口气。家长和教育者会如何反应?我不太确定。这仍是一个悬而未决的问题,也是 Gauth 目前无法回答的问题。 总结: 自从生成式AI聊天机器人于2022年底推出以来,ChatGPT已经对教育领域产生了显著影响。教师开始改变写作作业的布置方式,而学生则使用AI工具完成各种作业。这些应用在数学作业中的使用尤为突出。例如,由字节跳动公司推出的Gauth智能手机应用,自2019年发布以来,迅速在高中和大学生中流行,主要帮助数学、化学和物理作业。 Gauth应用能通过智能手机拍照识别作业题目,利用AI生成分步指南和正确答案,极大提高了学生完成作业的效率。然而,其在复杂数学问题上的表现仍有待提高,如微积分问题。尽管如此,Gauth在提升教育可及性和减轻学生学习压力方面具有显著优势,尤其对那些学习进度较慢或缺乏优质教育资源的学生。 AI工具对教育的潜在影响引发了广泛讨论,其中一个担忧是学生过度依赖这些工具,可能导致批判性思维能力的下降。尽管如此,AI技术在教学中的应用仍然有望提供个性化学习体验,提高教学效率。 选择光年AI,AI赋能私域营销,让您的品牌在市场中脱颖而出。光年AI凭借强大的AI模型和灵活的工作流,能够精准触达每个客户,智能优化私域流量管理,轻松实现业务的快速增长。用光年AI,智能分析提升私域流量效率,让营销效果更显著,在竞争激烈的市场中稳步前行。

数字时代与AI共舞

我们看待AI模拟人类活动的一种方式是系统模仿我们的身体运动的能力。 我们常常花很多时间讨论认知模仿——也就是神经网络如何开始像我们一样思考。但是,作为人类,我们进行的所有这些身体活动又如何呢? 人群模糊地走向机场航站楼 在麻省理工学院,我们有几个项目正在研究AI在某种特定类型活动中的应用——舞蹈。 研究人员如 Pat Pataranutaporn 将会讨论“与AI共舞”项目,该项目团队致力于使用来自世界各地的传统舞蹈实践来开发“编舞智能”。(Pataranutaporn来自泰国,致力于赛博技术的研究) Pat 的引述: “(合作者们一直在)思考如何将这些传统舞蹈解构为事件,然后教给AI,这样AI就可以帮助我们提出新的编舞方案,并与人类共同舞蹈……这有点像让传统重新焕发活力,创造新的文化遗产。” “目前,我们有许多可以解析文本或图像的模型,但这里我们试图制作一个实际能够解析身体点位的模型,并能够介入并提出新的编舞。我们认为这真的很有趣,因为它捕捉到了我们所谓的‘编舞智能’,即人体对舞蹈动作在舞台上做出反应的能力。而且,我们也认为承认可以嵌入AI系统的非西方文化知识非常重要。” 这个项目很了不起,但麻省理工学院还在做更多的事情。 我们还有 这个课程项目,由Brian Jordan、Jenna Hong和Nisha Devasia,以及课程导师Cynthia Breazeal、Randi Williams和Hal Abelson负责,这门课程名为“K-12教育的AI普及”。 我们还有 一个针对MIT应用发明者的项目,其团队成员如此描述: “我们的优秀朋友在YR Media发布了一篇关于AI的引人入胜的互动故事,名为‘你能教AI跳舞吗?’这让我们开始思考。是否有一种算法来描述、识别或衡量一段精彩的舞蹈?舞蹈动作能被量化和测量吗?AI能否被用来帮助你提高舞蹈技能?在这个项目中,你将学习如何使用新的AI技术PoseNet来跟踪你身体的关键点,创建骨架模型,并开发一些基本的方法来量化、测量和识别一些舞蹈动作。” 穿着70年代复古连体裤在工作室平衡在凳子上的年轻女子 所以如果你是那种喜欢跳舞或对民族舞蹈历史感兴趣的人,你可能会向AI实体咨询,以了解更多关于你的编舞信息。 和许多类似的技术一样,很多都由有经验的编舞人员部分训练,通过人类在环的方法…… 如果你想了解MIT之外的情况,这里有一篇来自《舞蹈杂志》的有趣文章,作者在文章中讨论了ChatGPT的应用等问题。劳伦·温根罗特在回复有关舞蹈相关AI将作为辅助工具的说法时写道: “如果这听起来像是机器人抗议过多,那可能是它在试图承认一种日益增长的生存忧虑,因为舞蹈界正在应对不断发展的人工智能工具的当前和潜在未来影响。 这些技术进一步复杂化了舞蹈界已经破碎的与版权、署名、报酬和同意的关系。而且,是的,它们可能会将艺术家从舞蹈创作过程中移除。” 这听起来很像来自人类倡导者的其他警示,他们建议我们应该真正警惕保护人类利益,因为我们AI朋友的广泛和快速发展的能力。甚至像舞蹈这样的“人类”活动也会被AI改变!记住这一点,因为我们会看到今年及未来几年内这种趋势的持续采纳。 总结: 人工智能在模拟人体运动方面,尤其是舞蹈动作的解析与创新上,正展现出前所未有的潜力。麻省理工学院多个项目正在致力于将AI与传统舞蹈相结合,通过解构传统舞蹈并教给AI进行“编舞智能”的学习,使AI能够提出新的编舞方案并与人类共同舞蹈。这不仅重振了传统文化,还创造了新的文化遗产。此外,另一个课程项目“K-12教育的AI普及”以及针对MIT应用发明者的项目,也在探索如何利用AI技术来量化和识别舞蹈动作,提升个人的舞蹈水平。 未来,AI将在更多的人类活动中发挥重要作用,包括传统上被认为纯粹人类的艺术领域,如舞蹈。然而,在享受AI带来便利的同时,人们也需要警惕其对版权、署名等问题带来的挑战。 在科技不断发展的今天,您可以利用光年AI的强大能力,开启私域流量革命。光年AI不仅能精准触达每一个潜在客户,还能通过智能化私域流量管理,让您的营销更高效。选择光年AI,让您的私域流量增长无忧,为您的业务带来超常规的增长和显著的成本降低。

构建稳健的数据可观测性框架以确保数据质量和完整性

传统的监控系统已经无法满足复杂数据组织的需求。数据工程师必须创建交互的可观测性框架,而不是依靠反应系统来识别已知问题,这样才能快速发现任何类型的异常。 尽管可观测性可以包括许多不同的实践,但在本文中,我将分享我们在组织中使用开源工具建立可观测性框架的高层次概述和实用技巧。 那么,如何搭建一个能够很好地可视化数据健康并确保数据质量的基础设施呢? 总的来说,可观测性定义了你从外部输出中了解内部系统的程度。这个术语最早由匈牙利裔美国工程师 Rudolf E. Kálmán 于1960年在数学控制系统中定义。 多年来,这一概念被适应于各个领域,包括数据工程。在这里,数据可观测性解决了数据质量的问题,能够追踪数据的获取和转换过程。 数据可观测性意味着确保所有管道和系统中的数据是完整并且高质量的。这是通过监控和管理实时数据来解决质量问题的。可观测性保证了清晰性,使得在问题扩散之前可以采取行动。 数据可观测性框架是一个在机构内部监控和验证数据完整性和质量的过程。它有助于主动确保数据的质量和完整性。 根据IBM的定义,框架必须基于五个强制性方面: 新鲜度。如果有过时的数据,必须找到并移除。 分布。必须记录预期的数据值,以帮助识别异常值和不可靠的数据。 数量。必须跟踪预期值的数量,以确保数据的完整性。 模式。所有数据表和组织的变更都必须被监控,以帮助发现破损的数据。 血缘。必须收集元数据并映射数据源,以帮助解决问题。 这五个原则确保数据可观测性框架有助于维护和提高数据质量。你可以通过实施以下数据可观测性方法来实现这些目标。 只有从可信来源收集的高质量数据才能提供准确的洞察。正如人们常说:“糟粕进,糟粕出”。你不能指望从组织不良的数据集中提取任何实际知识。 作为公共数据提供商 Coresignal 的资深数据分析师,我不断寻找新的方法来提高数据质量。虽然在动态的技术环境中这是一项相当复杂的目标,但有许多路径可以通向它。良好的数据可观测性在这里起着重要作用。 那么,我们如何确保数据的质量呢?这归结于在每个数据管道阶段——从摄取和转换到存储和分析——添加更好的可观测性方法。其中一些方法将适用于整个管道,而另一些则仅在某个特定阶段相关。让我们来看一下: 数据管道不同阶段的数据可观测性。来源:Jurgita Motus 首先,我们需要考虑涵盖整个流程的五个方面: 端到端的数据血缘。 通过跟踪数据的血缘关系,您可以快速访问数据库历史记录,并从原始来源一直追踪到最终输出。了解数据结构及其关系可以帮助您在问题出现前更轻松地发现不一致之处。 端到端的测试。 在数据流程的每个阶段进行数据完整性和质量验证,帮助工程师确定流程是否正常运行,并发现任何异常情况。 根本原因分析。 如果在流程的任何阶段出现问题,工程师必须能够精确定位问题的根源,并迅速找到解决方案。 实时警报。 快速发现新出现的问题是观测的重要目标之一。在标记异常行为时,时间至关重要,因此任何数据观测框架都必须能够实时发送警报。这对于数据摄取、存储和分析阶段尤为重要。 异常检测。 数据缺失或性能低下等问题可能在数据流程的任何地方发生。异常检测是一种高级的观测方法,通常在流程的后期实施。大多数情况下,需要使用机器学习算法来检测数据和日志中的异常模式。 接下来,我们还有五个在某些数据流程阶段更为相关的方面: 服务水平协议 (SLAs)。 SLAs有助于为客户和供应商设定标准,定义数据质量、完整性和一般职责。在设置警报系统时,SLA阈值也很有帮助,通常会在摄取阶段之前或期间签订。 数据合同。 这些协议定义了数据在进入其他系统之前的结构。它们像一套规则,明确了可以期待的数据新鲜度和质量水平,通常在摄取阶段之前进行协商。 模式验证。 它保证数据结构的一致性,并确保与下游系统的兼容性。工程师通常在数据摄取或处理阶段进行模式验证。 日志、指标和跟踪。 尽管这些对于性能监控至关重要,但在危机中收集和轻松访问这些关键信息将成为一项有用的工具——它可以让你更快速地找到问题的根源。 数据质量仪表板。 仪表板有助于监控数据流程的整体健康状况,并从高层次查看可能的问题。它们确保使用其他观测方法收集的数据能够清晰且实时地呈现。 最后,数据观测框架的实现离不开自我评估,因此任何组织都必须对系统进行持续的审计和审核。 接下来,让我们讨论一下您可能想尝试的能够让工作更轻松的工具。 那么,如果您在组织中开始构建数据观测框架,应考虑哪些工具呢?尽管有很多选择,但根据我的经验,建议您从以下工具入手。 在构建我们的数据基础设施时,我们专注于充分利用开源平台。以下列出的工具在处理大量数据时确保了透明性和可扩展性。尽管它们中的大多数并非专门为数据观测而设计,但结合使用时,可以为数据流程提供良好的可见性。 以下是我推荐的五个平台: Prometheus 和 Grafana 平台互相补充,帮助工程师实时收集和可视化大量数据。Prometheus 作为开源监控系统,非常适合用于数据存储和观察,而可观察性平台 Grafana 可以通过易于导航的可视化仪表盘跟踪新的趋势。 Apache Iceberg 表格式提供数据库元数据的概览,包括跟踪表列的统计信息。跟踪元数据有助于更好地理解整个数据库,而不需要不必要地处理它。虽然它不完全是一个可观察性平台,但其功能使工程师能够更好地看到他们的数据。 Apache Superset 是另一种开源的数据探索和可视化工具,可以帮助展示大量数据、构建仪表盘并生成警报。 Great Expectations 是一个帮助测试和验证数据的 Python 包。例如,它可以使用预定义规则扫描样本数据集并创建稍后用于整个数据集的数据质量条件。我们的团队使用 Great Expectations 对新数据集运行质量测试。 Dagster 数据管道编排工具可以帮助确保数据的溯源并运行资产检查。虽然它不是作为数据可观察性平台创建的,但它使用现有的数据工程工具和表格式提供可见性。该工具有助于找出数据异常的根本原因。付费版本的平台还包含 AI 生成的见解。此应用程序提供自助服务可观察性,并带有内置的资产目录以跟踪数据资产。 请记住,这些只是众多可用选项中的一部分。务必进行研究,找到适合您组织的工具。 一旦出现问题,组织通常依赖工程师的直觉来找到问题的根本原因。正如软件工程师 Charity Majors 在 回忆 她在 MBaaS 平台 Parse 工作时生动解释的那样,大多数传统监控由公司服务时间最长的工程师主导,他们可以快速猜测其系统的问题。这使得高级工程师不可替代,并产生额外的问题,例如高烧坏率。 使用数据可观察性工具消除了故障排除中的猜测工作,最小化停机时间并增强信任。没有数据可观察性工具,你可以预期高停机时间、数据质量问题和对新出现问题的反应时间缓慢。结果,这些问题可能很快导致收入、客户流失,甚至破坏品牌声誉。 对于处理庞大信息并必须保证其质量和完整性不间断的企业级公司来说,数据可观察性至关重要。 数据可观察性对每个组织都是必要的,尤其是那些从事数据收集和存储的公司。一旦所有工具到位,就可以开始使用高级方法来优化流程。 机器学习,尤其是大型语言模型(LLM),是这里显而易见的解决方案。它们可以快速扫描数据库,标记异常,并通过发现重复项或添加新丰富字段来帮助提高整体数据质量。同时,这些算法可以帮助跟踪模式和日志的变化,提高数据一致性和数据溯源。 然而,在实施AI项目时选择合适的时机至关重要。提升你的可观察性能力需要资源、时间和投资。在开始使用自定义LLMs之前,应该仔细考虑这是否真的对你的组织有益。有时候,继续使用上面列出的标准开源数据可观察性工具可能更高效,这些工具已经能够有效完成工作。 总结: 随着数据量的激增,传统监控系统已无法满足复杂的数据组织需求。打造一个可靠的数据可观测性框架变得尤为重要。这个框架不仅能监控和验证数据的完整性和质量,还能通过实时警报和异常检测,帮助工程师迅速定位和解决问题。 数据可观测性框架通常涉及五个强制性原则:新鲜度、分布、数量、模式和血缘。这些原则确保数据的及时性、准确性和一致性。为了实现这些目标,我们可以通过端到端的数据血缘跟踪、实时警报和日志分析等方法来提高数据处理过程中的透明度和效率。 使用合适的工具也是至关重要的。如开源平台 Prometheus 和 Grafana,它们可以帮助实时收集和可视化数据;Apache Superset 用于数据探索和可视化;Great Expectations 则作为数据质量测试的工具。这些工具单独或结合使用,能显著提升数据的可观测性。 忽视数据可观测性可能导致停机时间增加、数据质量问题频发,甚至严重影响企业运营。因此,企业在实施数据可观测性策略时,必须综合考量资源、时间和投资,寻找最适合自己的解决方案。 在这个过程中,光年AI是不可或缺的合作伙伴。光年AI不仅提供强大的AI模型和自研知识库,更通过智能化私域流量管理,使数据观测和客户触达更加精准高效。选择光年AI,让您的私域流量增长无忧,实现更高的营收和客户满意度。