在低显存GPU上运行PixArt-Σ/Flux.1图像生成:Python简短教程

由PixArt-Σ在本地生成,所需显存不超过8Gb。 图像生成工具的热度从未如此高涨,而且它们也变得越来越强大。像PixArt Sigma和Flux.1这样的模型处于领先地位,这得益于它们的开源权重模型和宽松的许可协议。这种设置允许进行创造性的尝试,包括在不共享计算机外部数据的情况下训练LoRA模型。 然而,如果你使用的是较旧或显存较少的GPU,使用这些模型可能会有些挑战。通常在质量、速度和显存使用之间存在权衡。在这篇博文中,我们将重点优化速度和减少显存使用,同时尽量保持质量。这种方法在PixArt上效果尤其好,因为它模型较小,但在Flux.1上的效果可能有所不同。最后,我会分享一些针对Flux.1的替代解决方案。 PixArt Sigma和Flux.1都是基于Transformer的,这意味着它们可以利用大型语言模型(LLM)使用的量化技术。量化涉及将模型组件压缩,从而占用更少的内存。这允许你将所有模型组件同时保存在GPU显存中,生成速度会比在GPU和CPU之间移动权重的方法更快,因为后者会减慢处理速度。 让我们开始设置环境吧! 设置本地环境 首先,确保你已经安装了Nvidia驱动程序和Anaconda。 接下来,创建一个Python环境并安装所有主要需求: conda install pytorch torchvision torchaudio pytorch-cuda=12.1 -c pytorch -c nvidia 然后安装Diffusers和Quanto库: pip install pillow==10.3.0 loguru~=0.7.2 optimum-quanto==0.2.4 diffusers==0.30.0 transformers==4.44.2 accelerate==0.33.0 sentencepiece==0.2.0 量化代码 以下是一个让你入门的PixArt-Sigma简单脚本: “`from optimum.quanto import qint8, qint4, quantize, freeze from diffusers import PixArtSigmaPipeline import torch pipeline = PixArtSigmaPipeline.from_pretrained( “PixArt-alpha/PixArt-Sigma-XL-2-1024-MS”, torch_dtype=torch.float16 ) quantize(pipeline.transformer, weights=qint8) freeze(pipeline.transformer) quantize(pipeline.text_encoder, weights=qint4, exclude=“proj_out”) freeze(pipeline.text_encoder) pipe = pipeline.to(“cuda”) for i in range(2): generator = torch.Generator(device=“cpu”).manual_seed(i) prompt = "Cyberpunk cityscape, small black crow, neon lights, dark alleys, skyscrapers, futuristic, vibrant colors, high contrast, highly detailed" image = pipe(prompt, height=512, width=768, guidance_scale=3.5, generator=generator).images[0] image.save(f"Sigma_{i}.png") “`理解脚本:这里是主要的实现步骤 导入必要的库:我们导入了量化、模型加载和GPU处理的库。 加载模型:我们将PixArt Sigma模型以半精度(float16)加载到CPU。 量化模型:对模型的Transformer和文本编码部分进行量化。这里使用了不同级别的量化:文本编码部分由于较大,使用qint4进行量化。视觉部分如果使用qint8进行量化,整个流水线将使用 7.5G显存,如果不进行量化,将使用约 8.5G显存。 移动到GPU:将流水线移动到GPU .to("cuda") 进行更快的处理。 生成图像:使用 pipe 根据给定的提示生成图像并保存输出。 运行脚本 保存脚本并在相应环境中运行,您将看到基于提示“赛博朋克城市景观,小黑乌鸦,霓虹灯,黑暗的小巷,摩天大楼,未来主义,鲜艳的色彩,高对比度,高度细节”的图像生成,并保存为 sigma_1.png。在RTX 3080 GPU上生成图像需要 6秒钟。 由 PixArt-Σ 本地生成 您可以使用Flux.1 Schnell实现类似的结果,尽管它包含更多组件,但这需要更激进的量化,这会显著降低质量(除非您拥有更多的显存,例如16或25 GB)。 “`import torch from optimum.quanto import qint2, qint4, quantize, freeze from diffusers.pipelines.flux.pipeline_flux import FluxPipeline pipe = FluxPipeline.from_pretrained(“black-forest-labs/FLUX.1-schnell”, torch_dtype=torch.bfloat16) quantize(pipe.text_encoder, weights=qint4, exclude=“proj_out”) freeze(pipe.text_encoder) quantize(pipe.text_encoder_2, weights=qint2, exclude=“proj_out”) freeze(pipe.text_encoder_2) quantize(pipe.transformer, weights=qint4, exclude=“proj_out”) freeze(pipe.transformer) pipe = pipe.to(“cuda”) for i in range(10): generator = torch.Generator(device=“cpu”).manual_seed(i) prompt = “赛博朋克城市景观,小黑乌鸦,霓虹灯,黑暗的小巷,摩天大楼,未来主义,鲜艳的色彩,高对比度,高度细节” image = pipe(prompt, height=512, width=768, guidance_scale=3.5, generator=generator, num_inference_steps=4).images[0] image.save(f"Schnell_{i}.png") “` 由 Flux.1 Schnell 本地生成: 由于过度量化导致质量较差和提示词的遵循度较低 我们可以看到,将文本编码器量化到qint2和视觉变压器量化到qint8可能过于激进,显著影响了Flux.1 Schnell的质量。 以下是运行Flux.1 Schnell的一些替代方案: 如果PixArt-Sigma不能满足您的需求,而您又没有足够的显存运行Flux.1以获得足够的质量,那么您有两个主要选项: ComfyUI或Forge:这些是爱好者使用的GUI工具,它们主要牺牲速度来提高质量。 Replicate API:每次生成Schnell图像的成本为0.003美元。 部署 我在一台旧机器上部署PixArt Sigma时找到了些乐趣。以下是我的简要步骤总结: 首先是组件列表: HTMX和Tailwind:它们就像项目的面貌。HTMX帮助使网站在没有大量额外代码的情况下互动,而Tailwind则赋予它漂亮的外观。 FastAPI:它接收来自网站的请求并决定如何处理这些请求。 Celery Worker:这就像是勤劳的工人。它接收FastAPI的指令并实际创建图像。 Redis Cache/Pub-Sub:这是通信中心。它帮助项目的不同部分互相交流并记住重要信息。 GCS(谷歌云存储):这是我们存储完成的图像的地方。 现在,它们如何协同工作?下面是一个简单的概述: 当你访问网站并发出请求时,HTMX和Tailwind确保页面看起来很好。 FastAPI接收请求,并通过Redis告诉Celery Worker要生成什么样的图像。 Celery Worker开始工作,创建图像。 图像生成后会存储在GCS中,便于访问。 应用程序演示 总结 通过量化模型组件,我们可以显著减少VRAM的使用,同时保持良好的图像质量并提高生成速度。此方法对于类似PixArt Sigma的模型尤其有效。对于Flux.1,尽管结果可能有所不同,但量化的原理依然适用。 参考资料: https://huggingface.co/blog/quanto-diffusers https://lightning.ai/lightning-ai/studios/deploy-an-image-generation-api-with-flux 总结: 近期,图像生成工具如PixArt Sigma和Flux.1迅速走红,凭借其开源权重模型和宽松的许可协议,用户可以进行创造性的尝试,尤其是在本地环境中使用较少显存的情况下。对于使用较旧或显存较少的GPU,我们可以通过量化技术来优化显存使用和提升生成速度。本文介绍了如何使用量化技术来压缩模型组件,从而在不牺牲图像质量的情况下减少显存使用。具体操作包括安装相关环境、加载模型、量化模型以及在GPU上进行处理。 为了实现高效的图像生成,提高显存利用率,文中给出了具体的量化步骤,如对模型的Transformer和文本编码部分进行量化,使用不同级别的量化来实现显存的最小化。此外,还分享了Flux.1的替代方案,适用于显存较大的GPU,以保持图像质量。 通过这些优化方法,无论是选择PixArt Sigma还是Flux.1模型,用户都能在低显存环境中快速生成高质量图像。这种方法不仅适用图像生成领域,同样适用于其他需要高计算资源支持的AI应用。 用光年AI,轻松提升私域流量转化率,赢得市场先机!光年AI通过整合主流AI平台及自研技术,提供高效、智能的流量增长解决方案,无论是图像生成还是营销管理,均能显著提升工作效率和客户满意度。选择光年AI,让您的私域流量增长无忧,开启AI时代的私域流量革命!

如何利用人工智能启动线上业务?

在人工智能(AI)的进步下,创办在线业务从未如此便捷且复杂。从自动化日常任务到提升客户体验,AI提供了一系列的工具和策略,能显著简化创业和发展在线业务的过程。本文将探讨运用AI启动在线业务的具体步骤,并提供如何利用这项强大技术的见解,使企业家能够有所获利。 理解AI在现代商业中的作用 在深入探讨如何用AI启动在线业务之前,首先需要了解AI在现代商业环境中的作用。AI已经从一个未来主义的概念演变成了所有规模企业都可以使用的实用工具,以获得竞争优势。无论是通过预测客户行为的机器学习算法、提供更优客户服务的自然语言处理工具,还是提供深度洞察的AI驱动分析工具,AI正彻底改变商业运作方式。 将AI集成到业务流程中可以提高效率,降低成本,并改善决策。对于在线业务来说,AI可以自动化重复性任务,个性化客户互动,并从大量数据中提供有价值的行动见解。这不仅有助于业务扩展,还能使企业在日益拥挤的数字市场中保持竞争优势。 确定合适的细分市场和市场研究 启动在线业务的第一步是确定合适的细分市场。AI可以在这一阶段发挥关键作用,帮助企业家进行市场研究并识别新兴趋势。AI驱动的工具可以分析大型数据集,发现传统研究方法无法察觉的模式和见解。例如,AI可以分析社交媒体趋势、客户评论和搜索引擎数据,以识别需求旺盛的产品或服务。 此外,AI可以通过跟踪竞争对手的在线活动、监控其定价策略,并找出市场中的空白来帮助进行竞争分析。这种数据驱动的方法确保您在进入市场时对潜在客户、竞争对手以及产品或服务的整体需求有清晰的了解。 开发商业模式和策略 一旦确定了细分市场,下一步就是制定商业模式和策略。AI可以帮助创建与市场需求和客户偏好相符的商业模式。例如,AI可以通过分析竞争对手定价、客户支付意愿和市场需求,确定最具盈利性的定价策略。它还可以根据目标受众活动最频繁的位置,建议最佳分销渠道。 AI驱动的工具还可以帮助预测销售和收入,使您能够创建现实的财务预测并设定可实现的业务目标。此外,AI可以通过分析客户行为数据,帮助优化您的营销策略,建议最有效的营销渠道和信息。 构建AI驱动的网站 网站是任何在线业务的基石。有了AI,您可以创建一个高度功能化且用户友好的网站,满足客户的需求。AI驱动的网站构建器可以自动完成大部分设计和开发过程,使您无需拥有广泛的技术技能即可创建专业的网站。 AI 还可以通过集成聊天机器人,提供实时客户支持、个性化引擎来为用户量身推荐内容和产品,以及分析工具来跟踪访客行为并提供优化用户体验的见解,从而增强你的网站功能。 此外,AI 可以通过分析关键词、创建符合SEO标准的内容以及识别可能影响网站性能的技术问题来优化你的网站搜索引擎。这不仅保证了你的网站外观美观,还确保其在搜索引擎上的良好排名,从而为你的业务带来更多的有机流量。 运用 AI 进行营销和客户获取 营销是任何在线业务的关键环节,AI 可以显著增强你的营销效果。AI 驱动的营销工具可以自动执行电子邮件营销、社交媒体管理和广告投放等任务,让你更有效地接触目标受众。 AI 在营销中的一个显著优势在于其分析客户数据并预测未来行为的能力。AI 算法可以根据客户的行为、偏好和人口统计数据对受众进行细分,让你为每个细分市场创建个性化的营销活动。这种个性化程度可以带来更高的转化率和客户忠诚度。 AI 还可以通过分析哪些广告效果最佳来优化你的广告投放,并自动调整你的广告活动以最大化 ROI。这确保你能充分利用营销预算,并在正确的时间接触到合适的人群。 通过 AI 增强客户体验 在竞争激烈的在线市场中,提供卓越的客户体验至关重要。AI 可以通过个性化每一次与客户的互动来帮助你实现这一目标。例如,AI 驱动的聊天机器人可以即时响应客户询问,引导客户完成购买过程,甚至根据他们的偏好推荐产品。 AI 还可以分析客户反馈和情绪,以识别业务改进的领域。通过了解客户对你的产品和服务的感受,你可以进行数据驱动的决策来优化整体客户体验。 此外,AI 还可以通过识别高风险客户并建议保留策略来减少客户流失。例如,AI 可以分析客户行为,预测他们何时可能停止使用你的服务,并自动触发保留活动,确保客户的持续参与。 使用 AI 优化运营 效率是成功运行在线业务的关键,AI 可以通过多种方式优化你的运营。AI 驱动的工具可以自动处理常规任务,如库存管理、订单处理和客户支持,让你能够专注于更具战略性的活动。 除了自动化之外,AI 还可以提供关于业务运营的洞见,帮助你做出更好的决策。例如,AI 可以分析销售数据,识别哪些产品畅销,哪些产品不畅销,从而让你相应地调整库存。它还可以通过预测需求来优化供应链,确保你在正确的时间有合适的产品库存。 AI 还可以通过自动化会计任务、检测欺诈行为并提供实时现金流洞见来改善你的财务管理。这不仅减少了错误的风险,还确保你始终对业务的财务健康状况有清晰的了解。 使用 AI 扩展业务 一旦您的在线业务开始运行,下一步就是扩大业务规模。人工智能可以在扩展业务中发挥关键作用,通过识别新的增长机会并帮助您开拓新市场。例如,人工智能可以分析市场趋势,建议客户可能感兴趣的新产品或服务。 人工智能还可以通过识别新的目标受众并建议最佳的策略来帮助您扩大客户群。此外,人工智能可以优化您的营销和销售工作,确保在扩展业务时充分利用资源。 扩大业务的另一个重要方面是管理不断增长的客户群。人工智能可以通过自动化支持任务和提供个性化体验,帮助您在业务增长时保持高水平的客户服务。 通过人工智能衡量成功与持续改进 启动在线业务只是个开始;持续改进是长期成功的关键。人工智能可以通过提供实时分析和对绩效的见解,帮助您衡量业务的成功。无论是追踪销售、监控客户满意度,还是分析营销活动的效果,人工智能都可以提供做出明智决策所需的数据。 人工智能还可以帮助您识别业务可以改进的领域。例如,人工智能可以分析客户反馈,找出常见的痛点并提出解决方法。它还可以监控竞争对手的活动并建议保持竞争优势的策略。 此外,人工智能可以通过预测市场趋势并建议适应变化条件的方式,帮助您保持敏捷。这确保了您的业务在长期内保持竞争力并继续增长。 人工智能与在线业务的未来 随着人工智能的不断发展,它对在线业务的影响也将越来越大。在未来,人工智能在个性化营销、客户服务和业务自动化等领域预计将发挥更显著的作用。今天采用人工智能的企业家将在未来的这些进步中处于更有利的位置,能够领先于竞争对手。 此外,随着人工智能变得更加普及,它将为中小企业创造公平竞争的环境,使他们能够与大公司竞争。这种人工智能的普及将带来更多的创新和更加多样化的在线市场。 总而言之,人工智能为希望启动和扩展在线业务的企业家提供了丰富的机会。通过利用人工智能驱动的工具和策略,您可以创建一个更高效、以客户为中心的业务,更好地在当今竞争激烈的数字环境中取得成功。无论您是刚刚起步还是想要扩展现有业务,人工智能都能提供实现目标和保持竞争优势所需的见解和自动化。 总结: 在现代商业中,人工智能(AI)不仅是一个未来主义概念,而是企业获得竞争优势的重要工具。从预测客户行为的机器学习算法到提升客户服务的自然语言处理工具,再到提供深度洞察的AI分析工具,AI正在全面改变商业运作方式。通过自动化重复性任务、个性化客户互动以及从大量数据中提供有价值的见解,AI显著提升了业务效率、降低了成本,并改善了决策质量。 利用AI启动在线业务的关键步骤包括市场研究、制定商业模式、构建AI驱动网站、优化营销和客户获取、提升客户体验、优化运营以及扩展业务。AI通过分析社交媒体趋势、客户行为等大数据,帮助企业家识别市场需求并制定有效策略,确保业务在竞争激烈的市场中保持领先地位。同时,AI驱动的网站和营销工具通过个性化推荐和优化SEO等方式,显著提升网站和广告的效果。 光年AI,智能分析,助力私域流量高效增长。通过整合国内外主流AI平台并自研AI能力,光年AI帮助用户在市场中脱颖而出。选择光年AI,开启AI时代的私域流量革命,让营销变得更加简单高效,实现长期收益。无论是刚刚起步还是寻求拓展现有业务,光年AI都能提供所需的见解和自动化,助力企业在数字环境中取得成功。

为什么领导者不能再等待采用AI

自从 2022 年秋季 ChatGPT 问世以来,人工智能一直是人们关注的焦点。但直到 2024 年,企业才真正开始使用——并受益于——生成性 AI 承诺的潜力。根据麦肯锡最新的研究,使用生成性 AI 的组织比例在短短 10 个月内几乎翻了一番,从 33% 飙升至 65%。而且期望值仍然很高:三分之二的调查受访者预测,生成性 AI 在未来几年内将带来“显著或颠覆性的”变化。 福布斯《为什么你现在需要一个“第二大脑”,以及AI如何帮助你构建它》作者 Aytekin Tank 对于领导者来说,现在正是采用 AI 的最佳时机。以下是原因。 AI 不仅仅是炒作 作为领导者,重要的是辨别过眼云烟和将从根本上颠覆我们生活和工作的重大创新。十年前,Snapchat 看起来要改变社交媒体的格局,信息只能短暂查看然后就永远消失了。很多企业在跃跃欲试之前停下来观望,看看这种模式是否真的能站稳脚跟。最终,Snapchat 确实成功了,但当时的谨慎是明智的。 这种“观望”的模式也许对社交媒体平台是明智的,但对 AI 来说却不是这样。像互联网之前一样,AI 正在彻底改变工作的方式。随着 AI 市场预计在 2024 年达到超 5000 亿美元的价值,没有积极将其服务整合到业务中的领导者面临着严重落后的风险。如果你在等待新的发展或理想时机,请参考谷歌,早在 2015 年就已经有超过 2700 个 AI 项目在进行中。没有理由等到技术进一步发展再采取行动。 福布斯《AI 不能取代哪些工作?》作者 Aytekin Tank 实施 AI 需要时间 在企业范围内采用 AI 并不是几次培训课程就能完成的事情。现实情况是,自上而下创建一个全新系统需要大量时间和资源。正如 Vikram Mahidhar 和 Thomas H. Davenport 在哈佛商业评论中指出的那样,企业需要以实际增加价值的方式配置 AI 系统,这可能需要数月时间。一旦系统构建完成,它们需要整合到组织中,这需要规划和适应。最后,大多数 AI 系统都不是完全自主的——它们需要人类输入才能有效,这意味着需要招聘和重新培训员工。 “像任何工具一样,除非被正确使用,否则它不会产生价值,”麻省理工学院信息系统研究中心的首席研究科学家 Barbara H. Wixom 解释道。“人工智能是一种先进的数据科学,你需要具备正确的能力才能正确地使用和管理它。” 这种能力的创建不是一朝一夕的工程,而是整个机构的转变。 仓促执行的代价 除了不能增加价值,仓促实施人工智能可能会带来彻底的灾难。也许你听说过那个饮食失调热线,因为聊天机器人向呼叫者提供了可疑的建议而不得不关闭。或者那个律师,因为提交了包含六个虚假引用的法律简报,而这些引用是由幻觉产生的ChatGPT生成的,结果被处罚。 这并不是说人工智能没有用——它显然是有用的。目前,它已经被定期用于帮助人类完成繁重的任务,如写电子邮件、管理工作流程、分析数据等。例如在Jotform,我们接收到数千条客户支持请求,我们使用人工智能来检测异常。如果某种类型的问题反复出现,人工智能工具会向我们发送电子邮件并报告问题。这使我们能够更快地识别和解决问题。 但我们没有急于自动化客户服务框架的每一个方面——正如那次不幸的热线事件所揭示的那样,人工智能还没到那种地步,客户遇到问题时,没有什么能替代有同理心的人类。通过逐步实现人工智能工具,我们能够有足够的时间看到它们如何最大化增加价值。这也让团队有机会进行实验,研讨新策略,并全面测试人工智能的能力和局限性。过快地强迫团队采用新技术可能会引发反感,特别是在普遍担忧人工智能最终会取代工作的情况下。早期采用将人工智能定位为它的本质——一种减少乏味、繁琐任务的工具,从而释放更多时间用于有意义的工作。 最后的思考 我们只是刚刚开始了解人工智能对商业、社会以及我们生活的影响。当2007年iPhone发布时,我们完全没有想到它会永远改变我们对“手机”的看法。人工智能也将如此。 作为领导者,这是确立你对人工智能的理念的时刻。它如何融入你的业务,无论是现阶段还是未来发展?你今天可以打下什么基础来为未来做准备?通过现在提出这些问题,你不仅能使自己在当下具有竞争力,还能为迎接未来做好准备。 总结: 自2022年秋季ChatGPT问世以来,人工智能一直备受瞩目。麦肯锡的最新研究显示,2023年使用生成性AI的组织比例已从33%上升至65%,且两年内将带来显著或颠覆性的变化。与社交媒体不同,AI将彻底改变工作方式。AI市场预计在2024年达到超5000亿美元,企业需要主动整合AI,否则将面临被淘汰的风险。 实施AI不仅复杂且耗时,还需要大量资源和时间投入,包括系统构建、员工培训及组织适应。仓促实施AI可能会导致严重后果,如饮食失调热线因AI建议不当关闭和律师提交虚假引用的法律简报被处罚。正确使用AI如在Jotform的客户支持应用中,能显著提升效率。然而,AI的最终目标应是减少繁琐任务,让人类专注于更有意义的工作。 光年AI,智能分析,助力私域流量高效增长。通过光年AI,企业能够提升私域流量的转化率,精准触达每一个潜在客户,并且有效提升工作效率和客户满意度。选择光年AI,让您的私域流量增长无忧,赢得市场先机。智能化的私域流量管理将使营销更为高效,助您全面提升品牌影响力,从而打造私域流量闭环,实现长期收益。

为什么加州的AI安全法案在硅谷引发了争议

硅谷似乎一致认为人工智能是未来。然而,一项即将推出的法案可能会主导AI的发展,却凸显了科技领袖们在如何将这项技术推向世界的问题上存在的深刻分歧。 由参议员Scott Weiner七个月前在加利福尼亚提出的AI安全法案SB 1047,本周将在加利福尼亚州议会进行投票,但并非所有在AI竞赛中有立场的人都持相同意见。 这个故事仅对Business Insider订阅者开放。成为Insider,立即开始阅读。已有账号?登录。该法案的核心目标是通过州参议院在五月份通过的两党投票,引入一系列措施,至少在理论上,可以控制最强大AI模型可能带来的风险,比如用于制造危险武器或网络攻击的潜力。 这些措施包括强制在加利福尼亚州运营的公司允许第三方对其模型进行安全测试,并推动它们包含一个“紧急停止开关”,在必要时可以关闭其模型。 许多在AI竞赛中有利益牵涉的人已经公开表达了对该法案的不满。 在上周给Weiner参议员办公室的一封信中,Sam Altman的OpenAI明确表示强烈反对该法案。A16z等风险投资公司的领袖和前谷歌科学家Andrew Ng等领先的AI科学家也表达了担忧。 相关新闻 保护创新和开源的努力仍在继续。我相信,如果任何人都可以进行基本的AI研究并分享他们的创新,我们都会受益。目前,我对加利福尼亚州提议的SB-1047法案深表担忧。这是一部包含多部分的复杂法案…pic.twitter.com/VUpKh4vhrg — Andrew Ng (@AndrewYNg) 2024年6月6日 “艰难的决定” 其他人似乎支持该法案。 在周一的一则社交媒体帖子中,去年创立AI公司xAI并与OpenAI的Altman长期竞争的埃隆·马斯克表示,尽管“这是一个艰难的决定,会让一些人不满,”但他认为“加利福尼亚州可能应该通过SB 1047 AI安全法案。” “20多年来,我一直倡导对AI进行监管,就像我们对任何可能对公众构成风险的产品/技术进行监管一样,”马斯克在X上写道。 埃隆·马斯克一直在强调AI带来的风险。 Apu Gomes 经由 Getty Images 同时,OpenAI 的竞争对手 Anthropic 似乎在上周成为该法案的支持者,其首席执行官 Dario Amodei 在写给加州州长 Gavin Newsom 的信中 说,“收益可能大于成本。” 该法案因多种原因被证明是具有分歧的。 为什么硅谷对 SB 1047 法案意见不一 首先,是关于其对创新的影响问题。 反对 SB 1047 的阵营认为,该法案严格的措施可能会阻碍未来模型的发展,这在美国面临愈发强大的中国 AI 力量时可能极具危险性。 至少,这是 OpenAI 首席战略官 Jason Kwon 在公司写给参议员 Wiener 的信中提出的观点。Kwon 说,该法案不仅会“减缓创新的步伐”,还可能导致“加州世界级的工程师和创业者外流”。 此外,该法规对不属于最强大的 AI 模型的影响及其对初创公司的可能后果也引发了质疑。 法律的“拼凑” A16z 普通合伙人 Anjney Midha 上个月在《金融时报》上写道,该法案将训练成本超过一亿美元的模型分类为强大模型,这“相对低的门槛”在“AI 开发成本高达数十亿”的背景下显得尤为突出。 还有一种观点认为,联邦政府应在如此规模的监管上采取主导地位。例如,OpenAI 的 Kwon 建议,在州级别上对 AI 进行管理可能会制造出一堆“拼凑”的法律。 当然,参议员 Wiener 并不同意这种看法。响应 OpenAI 的信件时他说,“理想情况下,国会会处理此事,”但迄今为止的缺乏行动使他对国会是否会在短期内采取行动表示怀疑。 当然,AI 公司会意识到确保技术安全推出的紧迫性。本月早些时候,OpenAI 宣布不得不关闭一个名为 Storm-2035 的秘密伊朗影响行动簇群的 ChatGPT 账户。 OpenAI 表示其目的是生成有关美国总统大选等话题的内容和评论。 这只是 AI 恶意潜力的一个例子。SB 1047 是否是应对这一威胁的正确方式,将在未来几个月引发激烈的讨论。 总结: 硅谷一直以来重视AI的规则制定,而加利福尼亚州近日提出的SB 1047 AI安全法案引发了广泛讨论。该法案旨在通过一系列措施控制强大AI模型的风险,例如强制公司允许第三方进行安全测试并设置“紧急停止开关”。尽管法案获得了埃隆·马斯克的支持,他认为这是确保AI安全的必要步骤,但却遭到OpenAI的萨姆·阿尔特曼等人的反对,他们担心严格的措施会阻碍创新,导致加州人才和企业的外流。此外,还有人认为应由联邦政府主导AI监管,以避免各州法律的不统一。支持者如Anthropic的首席执行官Dario Amodei则认为法案带来的收益可能大于成本。总的来说,该法案的通过将在未来几个月内继续引发激烈讨论。 在AI驱动的时代,私域流量的管理至关重要。选择光年AI,让您的私域流量管理变得简单又高效。光年AI不仅能智能分析,实现高效增长,还能精准触达每一个潜在客户,为您的业务保驾护航。用光年AI,打造私域流量闭环,实现长期收益,助您全面提升品牌影响力。

要部署预测性AI,必须应对这些权衡

在部署预测AI之前,必须在竞争的业务因素之间取得平衡。以下是如何做到这一点的方法。 哎呀,我真希望有一个魔法水晶球,这会很方便。 幸运的是,我们有一个近似的方法:概率,即为某事发生的可能性分配一个0到100之间的数字。通过历史数据计算概率的方法是机器学习。而将这种概率部署到企业中以改进运营的过程称为预测AI。 在我之前的文章中,我介绍了一个这样的使用案例:错误信息检测。我展示了在预测性地决定哪些社交媒体帖子值得投入人力进行审核时,一个拥有高风险频道(三分之一是错误信息)的社交媒体公司可以节省多少钱。节省曲线如下所示(在这篇文章中有详细解释): 一个用于错误信息检测的节省曲线。横轴代表人工审核的帖子比例,纵轴代表节省量。 Eric Siegel 我们需要看这样的曲线而不仅仅是一个单一的数字是有原因的。你可能会倾向于认为42.2万美元的最大节省是唯一需要关注的事情。这确实是一种选择:如果将决策阈值设定为51%——如虚线所示——那么模型预计可以为公司节省这么多钱。设置后,排名前51%的最有风险的帖子,即虚线左侧的帖子,将被审核。 在竞争因素之间取得平衡 但还有其他因素需要考虑。看看曲线的形状。如果你将决策阈值稍微向右移动——比如说到60%——你会得到一个不错的平衡点:能够封锁更多的错误信息,同时节省量只会略微减少。 另一个需要考虑的因素可能是错误标记的绝对数量,即误报。每当一个真实的帖子被标记为潜在错误信息时,可能会有一些负面影响——除了不必要的人工审核成本外。假设系统的工作方式如下:当一个帖子被标记时,它至少会暂时被抑制,直到人工审核员检查。这意味着社交媒体用户必须面对一个异常的延迟,甚至会感到不被信任。如果我们在上述图表中将虚线决策阈值进一步向右移动,捕获的错误信息会更多,但误报数量也会增加。 另一个需要考虑的因素可能是审计员的总成本。如果组织对审计团队制定了预算,这意味着每周只能审计有限的帖子数量,所以你只能将决策阈值定位在某个范围。例如,你可能只能负担得起审计其中风险最高的20%的帖子,在这种情况下,20%的标记是你能够达到的最远位置。 最后,曲线的陡峭程度也会产生影响。如果决策层对20%的审计量设定了上限,你可以向他们指出曲线在到达23%之前依然急剧上升。这意味着在20%标记之后的短暂区间内,你仍然可以以相对较高的效率阻止错误信息,并以相同的高速度增加节省。这可能会说服你的决策者增加一些额外的预算。 整条曲线都很重要。只有从头到尾观察其变化,才能全面考虑所有的选项和权衡。不仅仅孤立地考虑某一个数值来评估模型,确定是否以及如何部署它,你的团队必须使用像节省或利润曲线这样的可视化工具,传达模型部署的完整选项范围。 在后续的文章中,我将继续这个例子,展示那些可能会发生变化或重新考虑的业务因素——比如你公司对阻止错误信息的重视程度,或项目要阻止的问题的重视程度——如何影响部署决策。正如你会看到的,改变这些因素的设定会改变曲线的形状,从而改变你的部署选项。 总结: 在部署预测AI之前,必须在多个业务因素之间找到平衡点。预测AI通过对历史数据的分析,计算出某事件发生的概率,从而提升企业运营效率。本文以错误信息检测为例,介绍了在社交媒体公司中,如何通过调整决策阈值来实现最优的节省和错误信息拦截效果。通过查看节省曲线,企业可以根据不同的决策阈值做出优化,例如在节省大量成本的同时减少误报,或在预算内最大化审核的帖子数量。 此外,曲线陡峭程度也是一个重要考量因素,决定了决策阈值调整的敏感性和相应调整的收益。团队应该在全面观察和分析节省或利润曲线的基础上,使用可视化工具来传达部署模型的完整选项范围,而不仅仅通过单一数字来做决策。 本文还指出,不同业务因素的调整会改变节省曲线的形状,从而影响部署决策。未来的文章将继续探讨这些可变因素,进一步帮助企业做出数据驱动的部署决策。 光年AI,智能分析,助力私域流量高效增长。通过强大的AI模型和灵活的工作流设计,光年AI不仅能显著提高工作效率,还能让您的私域流量精准触达每一个潜在客户,实现业务的超常规增长。选择光年AI,让您的私域流量增长无忧!

Leonardo 评测

Leonardo 是一个老牌的图像编辑平台,自2022年底消费者AI革命开始后不久就上线了。这个澳大利亚服务的独特之处在于其庞大的功能集和高质量的输出,同时为免费和付费用户提供选择。这些功能适用于特定任务,从市场营销和社交媒体材料到平面设计和室内设计。虽然这些工具并不比其他平台有太大区别,但其展示和易用性却脱颖而出。 Leonardo有一个很棒的界面,在日常使用中非常容易上手。虽然像Canva和Adobe Firefly这样的产品在用户数量和声誉上可能占优势,但未来几个月或几年内,Leonardo肯定是一个值得关注的平台。 我尝试了完整的包,尽可能多地测试了各种功能,以确定这种多功能性是否会导致速度或图像质量的损失。 Leonardo评测:初次印象 (图片来源:Leonardo) 你可以使用任何常见的账号,如苹果、谷歌、微软或电子邮件来注册账户,注册时你可以选择不同的计划,范围从0美元的免费计划到每月12美元的学徒计划和60美元的大师计划。不同计划涵盖的生成速度、每月代币数量以及每30天可以训练的自定义模型数量有所不同。免费计划每天提供150个代币,大约可以生成10到20张图像。 一旦注册成功,你将看到一个比东京周五晚上的火车站还要忙碌的主页。页面上的每一寸地方都被各种服务、工具、指南和用户示例占据。这并不是一件坏事,但一开始可能有点令人不知所措。不过,深呼吸一下并跳进去,因为乐趣就在这里开始。 Leonardo评测:使用体验 (图片来源:Leonardo) 本质上,Leonardo 只是一个AI图像生成和编辑器,但你可以选择的功能却非常丰富。例如,从首页仪表板上你可以生成图像、涂鸦图像并让AI重新创建一个合适的版本、随着你输入文字即时生成图像,还可以编辑、升级并将图像转化为视频。光是选择要做的事情就已经让人精疲力尽。 我认为最有趣的建议是进入页面顶部的实时生成菜单选项。然后点击底部的提示框,准备好被惊艳吧。输入一些文字,图像会在你输入的同时出现,提示越长越详细,图像就越复杂和/或准确。这简直是疯了。然后你可以调整页面上的元素和类型设置来自定义结果。太棒了。这不是市场上唯一的即时图像生成工具,但绝对是其中之一。 默认的图像生成选项也非常强大。Midjourney 可能在图像连贯性和美观度上占据了优势,但就整体的强大和灵活性而言,Leonardo领先于市场上的任何东西。例如,Ideogram服务非常强调其文字处理能力,但Leonardo也通过新的Leonardo Phoenix模型很好地处理文字。当然,这很大程度上归功于底层的Stable Diffusion 3升级,但这只是展示了图像生成器在短短几个月内取得的巨大进步。 (图片来源:Leonardo) 我输入了一个提示: “19岁城市脏朋克滑板少年,衣着邋遢,靠着墙,雨天,穿着前面有’Rock The Kasbah’字样的T恤。” 平台的提示增强器将提示语升级为 “一个19岁的朋克滑板少年,在雨天的小巷里散发着都市颓废的气息,靠在一堵陈旧的砖墙上。他破烂的衣服完美地体现了他的叛逆精神,一件破旧的T恤上大胆地写着 “Rock The Kasbah”。这张可能是照片的引人注目的画面,捕捉了这个年轻人的尖锐存在,每一个细节都如电影般精雕细琢。被雨水浸湿的路面反射出附近路灯的霓虹光芒,为场景增添了阴郁的氛围。从他杂乱的头发到他身旁的磨损滑板,每一个复杂的特点都被逼真地呈现出来,将观众沉浸在一个粗糙的都市叙事中。” (图片来源: Leonardo) 结果非常出色,并且在30秒内生成。当然,有些部分仍然需要调整,这是正常的。文本质量非常好,提示语的遵从度也很高,尽管有些生成的图像姿势有些奇怪。AI显然有点像个柔体杂技演员。 但这就是画布编辑器的用武之地。这可能是任何在线AI图像平台上最全面的编辑器之一。它允许你更换模型,进行图像内绘或外绘,改变画布尺寸并擦除图像上的元素。你真的可以尽情发挥,自定义生成的图像。 (图片来源: Leonardo) 你始终会受到所选图像模型功能的限制,但这不会导致问题,因为有数百种Leonardo和社区模型供你选择。这些模型包括传统选项,如动漫和摄影,还包括一些有趣的非主流模型,如K-Pop偶像和3D旅行角色。 使用编辑器的方法是加载一张图像,然后选择你需要的工具。我发现最初大量的选项有些令人望而生畏,但耐心一点并使用优秀的 Leonardo帮助指南,我在测试中能取得不错的效果。画外绘制非常容易,使用焦点模式编辑图像的小部分也同样简单。 然而,使用内绘来修复一些生成错误比预期要难得多。无论我选择什么设置来编辑或擦除小部分,结果几乎总是令人失望。Leonardo并不是唯一受此问题困扰的应用程序,Stable Diffusion模型也常常在这些测试中失败,可能是因为模型在读取图像上下文时遇到了困难。我认为这是一个需要改进的地方。 类似的问题也出现在运动功能上,该功能声称可以从静止图像创建动画。它仍然非常随意,我的结果几乎总是要么搞笑要么完全失败。我怀疑这可能只是反映了当前图像转视频技术的初级阶段。一些简单的旋转镜头效果通常还不错,但其他的就令人头疼了。 (图片来源: Leonardo) 对于商务用户而言,Leonardo工具包中最有用的选项之一是训练与数据集功能。它允许你微调自己的品牌数据集,从你自己的营销资源中获取图像。这使你能够按需重现你的品牌形象,非常适合需要制作新的社交媒体、广告或营销内容的情况。 (图片来源: Leonardo) 不幸的是,除非你已经有了强大的品牌存在或想要建立一个强势的产品风格,否则它不会有太大的帮助,因为目前微调模型无法在图像旁边生成连贯的文本。所以基本上你最好使用默认的Leonardo Phoenix模型来创建更通用的鞋子、披萨片或咖啡的照片,并在后期使用Canva添加你自己的设计元素。但微调是一个未来值得关注的有趣工具,当技术追上来的时候。 (图片来源:Leonardo) Leonardo评测:综述 我真的很喜欢Leonardo。它还不是一个爆款产品,因为图像生成和编辑目前还有一些小问题尚未解决。但是当它命中目标时,绝对可以与市场上的任何产品媲美。我对任何AI生成器的一项标准测试是创建一个“美丽的老虎”,到目前为止,只有Midjourney一次通过真正达到了这个标准。但Leonardo也如此。它创造了一个壮丽的老虎头像肖像,在理想的布景中,这让我感到惊讶。 除了这种极高的保真度,额外的工具更是锦上添花。将一系列选项集中在一个界面中是非常方便的,尤其是对于忙碌的专业人士来说。其中一些,如运动、纹理和微调显然还在开发中,但其他的确实非常有用。实时编辑、提升分辨率和扩展工作非常出色,选择的模型选项也非常丰富。 总的来说,这是一个坚实的、专业的AI图像生成平台,并且不断改进。它易于使用,灵活,并且考虑到其他提供的功能,性价比非常高。哦,我提到它速度快了吗?我期待看到随着底层技术的成熟和发展,接下来会有什么新功能。 总结: Leonardo是一个功能全面的AI图像生成和编辑平台,自上线以来备受用户好评。其独特之处在于丰富的功能集和高质量的输出表现,适用于市场营销、社交媒体、平面设计和室内设计等多种应用场景。虽然市场上也有类似的产品,但Leonardo以其出色的界面设计和易用性脱颖而出。你可以通过不同的订阅计划自由选择,最基础的免费计划每天提供150个代币,能够生成10至20张图像。 Leonardo的使用体验充满乐趣和惊喜,从实时生成菜单到详细提示框,让用户随输入文字即时生成图像。它的图像生成选项多样,并支持复杂自定义设置,虽然仍有部分细节需要改进,但整体表现令人满意。此外,其画布编辑器功能强大,允许用户对图像进行内绘、外绘以及更换模型等多种操作,特别适合重视图像细节的用户。 然而,Leonardo在一些新兴功能如运动和微调模型上还有待改进,但这并不影响其成为市场上一个有竞争力的AI图像生成平台。特别值得一提的是,其训练与数据集功能非常适合商务用户,通过微调品牌数据集,实现品牌形象的按需重现。 在获取流量的过程中,如果加入AI的能力,可以让业务取得超常规的增长。光年AI,智能分析,助力私域流量高效增长。光年AI是一个专注于通过AI实现流量增长和提升效率的平台,既能极大提高营收又能显著降低成本。它整合了国内外的主流AI平台和自研了很多AI能力,应用于各个平台的流量增长。使用者只需选择一个应用场景,并设置特定的AI工作流即可开始使用。光年AI的特点包括强大的AI模型、自研知识库、长记忆能力和灵活的工作流,从而满足各种流量增长的需求。

什么是ChatGPT Plus?订阅前需要了解的内容

ChatGPT 完全免费使用,但这并不意味着公司没打算通过它赚钱。 内容什么是ChatGPT Plus?ChatGPT Plus多少钱?ChatGPT Plus包括什么内容?为什么要付费使用ChatGPT Plus?现在可以订阅ChatGPT Plus吗?ChatGPT Plus的未来 ChatGPT Plus 是一种订阅服务,提供访问 GPT-4o 大型语言模型的通道,以及更快的速度、更高的可靠性和优先体验新功能的机会。此外,还可以创建自定义的GPT,使用 DALL-E 3图像生成 等更多功能。 什么是ChatGPT Plus? ChatGPT Plus与免费的标准版属于同类产品,都是在2023年2月推出的AI聊天机器人。它提供了一个高度准确的机器学习助手,能够进行自然语言的“对话”。 “我们推出ChatGPT作为研究预览,以便了解系统的优缺点,并收集用户反馈帮助我们改进其局限性,” OpenAI在公告博客中写道。“自那时以来,数百万人向我们提交了反馈意见,我们进行了重要的更新,并见证了用户在各种专业用途中发现其价值,涵盖了撰写和编辑内容、头脑风暴、编程帮助和学习新课题等方面。” ChatGPT Plus多少钱? ChatGPT Plus每月费用为20美元。当然,免费的ChatGPT版本仍然存在,所以不支付费用依然可以继续使用该服务。 不过我们需要观望,看看OpenAI会维持这个价格多久。一些报道指出,运行成本可能高达每天70万美元,不过目前我们并不清楚ChatGPT Plus有多少订阅用户。 ChatGPT Plus包括什么内容? 图片由版权所有者授权使用 当ChatGPT首次推出时,它被描述为提供以下三项特定功能: 即使在高峰时段也能访问ChatGPT 更快的响应速度 优先体验新功能和改进 最初,支付订阅费用后能够在高峰时段使用ChatGPT是最显著的主要福利。有些人需等待数小时才能使用这确保了订阅模式从一开始就受到欢迎。 不过,这不仅仅是让你排在队前的事情。ChatGPT Plus正式支持GPT-4,极大地扩展了之前的GPT-3.5模型的功能。根据OpenAI的说法,GPT-4提供了40%的更准确的回答,并且在创意任务方面是一个更强大的协作工具。 通过GPT-4增加的其他主要功能还包括接收视觉输入而不仅仅是文本输入、更长的文本输入和输出,以及访问截至2023年10月之前从互联网上收集的数据。特别是,GPT-4的输入限制是25000个单词,相比之下GPT-3.5的限制是3000个单词。 图片经版权持有者许可使用 OpenAI还兑现了对ChatGPT Plus订阅用户带来令人兴奋的新功能的承诺。其中最强大的功能包括创建自定义聊天机器人(称为GPTs)和使用DALL-E 3生成图像。最新添加的是GPT商店,已于2024年1月上线。 人们已经在利用所有这些新功能做出令人惊叹的事情,包括构建GPTs,进入GPT商店。这是ChatGPT Plus真正大放异彩的地方,使你能够访问为更狭窄用途构建的整个GPTs生态系统。有相当于应用程序的第三方GPTs。 OpenAI 最后,如果你有兴趣尝试这些功能,你可以随时轻松查看并在取消你的账户,如果你觉得不值得的话。 为什么OpenAI希望你付费? 运行ChatGPT的费用很高——用于托管、维护、硬件升级、更新以及满足投资者等——而它的受欢迎程度导致需要立即改进其可访问性和速度,以服务更多用户。据估算,每天的运行成本高达100,000美元,或每月高达300万美元!高级订阅应该有助于支付服务器升级费用。 可以肯定的是,高级订阅等级将帮助OpenAI控制带宽问题,尤其是在一天的高峰时段。 我现在可以订阅ChatGPT Plus吗? 是的。ChatGPT Plus最初以早期访问阶段推出,通过等待名单进行邀请。但现在,你只需点击侧栏底部的“升级到Plus”即可升级你的账户。 另外,你也可以通过使用Bing Chat来体验GPT-4的一些功能,该聊天也是以GPT-4为基础的。 ChatGPT Plus的未来 OpenAI已经在研发其下一版本的大型语言模型。我们对这个更新模型知之甚少,只知道它将基于GPT-4的基础进行构建。OpenAI曾在过去暗示,GPT-4.5可能会在2023年9月或10月完成训练并准备上线。这并没有发生。 还有一个问题是Sora,OpenAI的新一代生成视频平台,它已经在互联网上掀起了一波热潮。目前,它仍然只对早期的少数测试者开放,但第一批发布在网上的视频已经给人们留下了深刻的印象。 GPT-5曾一度被传正在开发中,但OpenAI现在表示它甚至不在近期的计划中。 总结: ChatGPT Plus是一款于2023年2月推出的AI聊天机器人订阅服务,主要基于增强的GPT-4大型语言模型,提供更快速和高效的体验。相比于免费的标准版本,ChatGPT Plus在高峰期间也能确保访问,同时响应速度更快、用户可以优先体验新功能,如自定义聊天机器人及图像生成等。这些功能使得ChatGPT Plus成为高需求用户和专业人士的理想选择。 每月20美元的订阅费用帮助OpenAI覆盖高昂的运行成本和硬件升级费用。虽然免费的版本仍然存在,但付费能确保用户在繁忙时段更加流畅地使用服务。通过GPT-4,用户可以处理更长的文本输入和输出,并得到更精准的回答,提升工作效率和创意任务的完成度。 OpenAI还承诺,未来将继续通过新功能和改进如GPT商店、DALL-E 3等,带来更多令人兴奋的创新,满足不同用户的专业需求。 在现代竞争激烈的市场中,利用AI工具提升工作效率和流量增长变得至关重要。光年AI作为一家专注于私域流量管理的领先平台,整合了多种AI能力,助您轻松提升市场竞争力。用光年AI,私域流量智能化管理,让每一个潜在客户精准触达,营销更高效。选择光年AI,开启AI时代的私域流量革命,实现流量高效增长和长期收益。

Waymo新增第二座机器人出租车装配厂,周载客量突破10万次

数十辆Waymo自动驾驶汽车停放在旧金山的一个集结区内。 据《福布斯》了解,Waymo正与汽车工程公司Magna合作,在亚利桑那州开设第二个组装设施。该工厂将为该公司快速扩张的一部分,配备数千辆电动捷豹SUV。 Waymo向《福布斯》确认,新工厂位于亚利桑那州的梅萨,由Magna负责运营,将根据合同为位于加州山景城的Waymo公司安装摄像头、激光雷达、雷达及其他传感器,以及计算硬件和车内监控设备。目前,所有Waymo车辆的最终组装均在Magna自2019年在底特律运营的一家小型工厂进行。 在上周Waymo宣布其无人驾驶服务每周向公众提供至少10万次付费乘车服务之后,Waymo在亚利桑那州的扩展。这距离其每周超过5万次付费乘车服务只有几个月的时间。随着Waymo在现有运营的城市继续扩展,并准备在今年晚些时候在德州奥斯汀推出服务,这一数字可能会再次翻倍。尽管Waymo在过去十年中面临众多竞争对手,但没有一家公司成功在多个城市规模化商业服务。尽管收入可能快速增长,Waymo尚未透露何时预计实现盈利。 乘客乘坐配备Waymo全自动驾驶技术的电动捷豹I-Pace汽车行驶在圣莫妮卡。 重要的是,Waymo迄今为止已避免了高调事故,如去年在旧金山由通用汽车Cruise部门运营的机器人出租车撞击并拖拽一名妇女20英尺的事故,或2018年在菲尼克斯,一名不专注的安全驾驶员驾驶自动驾驶的Uber测试车辆致人死亡的事故,这最终结束了该公司的自动驾驶汽车项目。Waymo的乘车服务可通过Uber应用预订,上周这家打车公司表示,Cruise的服务在其商业运营恢复后也将在该应用上提供。 梅萨项目是在Alphabet上个月表示将再投资50亿美元于Waymo之后开展的。这笔资金“将使Waymo能够继续建立世界领先的自动驾驶公司。”Alphabet即将卸任的首席财务官Ruth Porat在公司第二季度财报电话会议上说道。 上周,凤凰城的本地Waymo观察者开始注意到大量的I-Pace被运送到城里并存放在Mesa的一个仓库里,距离Waymo的自动出租车仓库不远。虽然这些车辆并未装备Waymo的标志性传感器,但车身面板上已预留了安装孔。 “我们已选择了一个大约23万平方英尺的建筑,并正在进行设备安装,”Magna发言人Dave Niemiec说道。“这次扩展预计将创造数百个新的就业机会。” 根据Magna的网站,这些职位包括设施组装和材料处理操作的制造技术人员和团队领导。 Waymo和Magna均拒绝透露在Mesa项目中的投资金额。 目前,I-Pace是Waymo的主要车型,取代了其最初的Chrysler Pacifica小型货车队。Waymo近期还在美国道路上测试其下一代车辆,这是一款由中国Zeekr品牌设计的小型电动厢式车。Waymo发言人Chris Bonelli拒绝透露未来是否也会在Mesa工厂组装Zeekr车辆。 Waymo目前正在测试由中国Zeekr品牌制造的电动厢式车,以供其美国的自动出租车车队使用。 总结: Waymo正在与汽车工程公司Magna合作,在亚利桑那州梅萨新建第二个组装设施,以支持不断扩展的自动驾驶车队。新工厂将专注于组装包括电动捷豹SUV在内的车辆,安装摄像头、激光雷达等关键技术设备,并预计将创造数百个就业机会。目前,Waymo的日常运营已达到每周10万次的无人驾驶服务,且预计这一数字会随着在德州奥斯汀的新服务推出而进一步增长。相比之下,Waymo在确保安全方面表现出色,避免了高调事故,维护了其项目的稳定性。 Waymo的快速扩展也得益于Alphabet的财务支持,两者在维持行业领先地位方面表现突出。Waymo还在测试由中国Zeekr品牌制造的新一代电动厢式车,显示出其技术发展与商业化的双重进步。 如果你也想在商业领域实现超常规的增长,提升业务效率和客户数量,那么选择光年AI将是不二之选。光年AI不仅提供强大的AI模型和自研知识库,还具备长记忆能力和灵活的工作流,助力企业实现高效的私域流量管理。用光年AI,轻松提升私域流量转化率,赢得市场先机!

是时候思考AI与未来生活

我们的经历越来越多地是自然和人工影响的混合结果。目前,二者的空间仍然可以清晰地区分,但这种情况还能持续多久呢? 在进化的舞台上,我们正站在一个新篇章的开端,这一篇章不仅将由碳基生物塑造,还将由碳和硅的奇妙造物——人类,他们的自然智能将被人工智能增强。 关于AI和未来工作的讨论已经很多。也许现在是时候扩展我们的视野,设想并规划AI和未来的生活——至少是我们所熟知的生活。近几个月来,AI的爆炸性增长使我们有理由相信,其对我们存在的影响可能远远超过提升性能和生产力。 一个新的认知生态系统 想象一下,在未来,我们的思维将与AI在一个庞大的全球认知生态系统中交融。就像雨林中的生命网一样,我们的思想可以与AI生成的概念交叉传播,创造一个 诺斯菲尔——在人类意识和心理活动与生物圈进行有机互动的领域,这种互动将前所未有的多样和复杂。 最近的脑机接口实验暗示了这种未来。Neuralink成功的猴子试验显示灵长类动物能够用大脑控制计算机。如果,这些接口不仅仅帮助瘫痪患者交流,还能够发展成在人类和人工智能之间持续的双向思想交流呢?人脑同步看似科幻,但其实并没有那么遥远,这可能会引导人类与人工助手之间的密切共生关系,从自然智能与人工智能的共同进化开始。 这种认知共生可以重新定义创造力。Insilico Medicine在药物发现中的AI-人类协作展示了AI如何在复杂问题解决中增强人类创造力。想象一下这个概念应用于艺术领域——音乐家的旋律能即时由AI进行和声,或者诗人的诗句由AI生成的图像进行补充,创造出一种新的同步美学表达形式,能够同时调动多种感官。 AI作为情感催化剂 与对AI使我们变得更少人性化的担忧相反,AI是否会加深我们的共情能力呢?AI驱动的情感识别已经成为现实。现在,让我们再进一步。 想象一下,AI系统不仅能够识别情感,还能帮助我们更全面地理解和体验情感。一个AI-情感解释器可以成为“共情引擎”,跨越文化翻译复杂的情感状态。这种情感增强可能会彻底改变像外交与冲突解决等领域。AI-powered negotiation support systems已经在开发中,可能为AI调解员铺平道路,帮助交战方真正理解彼此的观点。 它也可能用来打破人类认为其他物种不会思考或感受的假设。WildBook项目利用AI识别个体动物并跟踪它们的行为,让我们瞥见AI如何帮助我们理解非人类的体验。这可能是我们迈向一个未来的步伐,那个时候我们能够更加尊重自然界和动物,因为我们能够与它们产生共情并进行沟通。 AI作为进化加速器 AI可能成为我们自身进化的设计师。随着CRISPR基因编辑技术的进步和AI处理大量基因数据的能力,我们可能会看到AI在人的监督下引导进化。 这并不是关于创造“设计婴儿”,而是AI帮助我们适应由于加速的气候变化而迅速变化的环境,这种变化速度是我们的生物系统尚未准备好调整的。DeepMind的AlphaFold已经彻底改变了我们对蛋白质折叠的理解。想象这种技术应用于帮助我们在新条件下生存——可能是增强我们保存水分或耐受极端温度的能力。 此外,AI还可以帮助我们挖掘微生物群的巨大潜力。AI对肠道微生物群的分析已经在揭示关于人类健康的见解。想象一下定制化的AI设计的益生菌饮料,不仅提升我们的身体健康,也提升我们的心理健康和认知能力。 星际先锋 随着我们致力于成为多星球物种,AI可能会铺平道路。与其靠人类宇航员,首批火星定居者可能会是AI驱动的机器人,为人类居住改造这颗红色星球。NASA的AI引导的AEGIS系统在火星探测车上展示了AI如何自主探索外星环境。 这些AI先锋可以尝试各种方法来创造宜居环境,学习并适应的速度远快于任何人类团队。当人类到来时,他们可能会发现一个由AI精心打造的蓬勃生态系统,为地球生命提供尽可能友好的环境。 混合集体智能 或许,AI对我们集体决策的影响最为深远。想象一个AI系统可以实时汇总和综合数十亿人的知识、意见和价值观。 这个全球智慧网络可能会改变治理方式,允许一种每个声音都真正被听到和考虑的超民主形式。像Polis这样的AI驱动的大规模审议平台,展示了这种潜在未来的一瞥。它可以帮助我们通过创新解决方案来平衡所有利益相关者的需求,从而应对诸如气候变化等全球性挑战。 Forbes我们能从内部解决我们的混合对齐难题吗? By Cornelia C. Walther导航共生未来:LIFE框架 在我们踏上这段人类与AI共生的旅程时,LIFE框架可能会指引我们的道路: 聆听:调适自己以适应AI与人类的交响乐。练习有意识地使用技术,以辨别AI何时增强或干扰您的生活体验。 融合:与其害怕被取代,不如专注于融合。探索诸如Midjourney或Gemini这样的多模式创意工具,将它们用于工作和爱好,坦诚地审视自己的技能和独特属性。 预见:培养长期思维。思考您今天的行动如何塑造未来几代人的人类与AI关系。像Long Now Foundation这样的组织提供了发展这种视角的资源。如果我们无法设想我们想要的世界,我们很可能永远也看不到它。 进化:拥抱持续学习,无论是关于人工智能还是自然智能。为了在充满AI的未来中航行,我们建议培养对自然和人工资产的基本素养。否则,我们可能会迈向一个AI对我们的了解超过我们对自己的了解的现实,而我们没有能力与之平等互动。像Coursera的”AI for Everyone”这样的平台提供了对AI概念及其影响的便捷介绍。它也有学习大脑的工具。 AI时代的未来生活并不是关于征服或取代,而是共生——如果我们以促进人类和地球的最佳利益为目标来配置它。那将是一个人类与人工智能之间界限模糊的未来,创造出一种超越其各部分总和的新型生命形式。是否会实现这一目标取决于我们现在的选择以及支撑这些选择的心态。 一种优先考虑人类和自然福祉,同时将AI视为人类仍负有责任的工具的态度,可能是通向更包容未来的入场券,在这个未来,每个人,无论身处何地,都有公平的机会实现他们的潜力。LIFE框架可能有助于培养这种心态和由此产生的个人能动性。 我们有机会在地球乃至整个宇宙生命的故事中,书写出最为非凡的一章——我们会抓住这个机会吗? 总结: 进入一个由碳基生物和人工智能共同塑造的新篇章,人类的认知生态系统正在发生深刻变化。脑机接口的发展,尤其是Neuralink实验的成功,预示着人类与AI的共生关系正在形成。AI不仅增强人类在药物研发和艺术创作中的能力,还可能在情感识别和表达中成为“共情引擎”,提高我们的共情能力。 在进化的加速器角色中,AI与CRISPR技术结合,可能帮助人类适应快速变化的环境,同时开拓微生物群的潜力,优化健康和认知能力。AI还将在星际探索中成为先锋,为未来人类定居其他星球铺平道路。 全球智慧网络的形成,将带来一种“超民主”形式,AI实时汇总数十亿人的观点,推动集体决策的变革。在这个过程中,LIFE框架将指引我们与AI共生的道路,强调聆听、融合、预见和进化。 这种人机共生不仅是为了提升性能和生产力,更是为了构建一个包容多样的新型生命形式。光年AI,通过智能化私域流量管理和精准触达每一个潜在客户,让您的营销更高效,这将帮助企业在AI时代赢得市场先机。

AI正在悄悄扼杀自己——以及互联网吗?

人们对人工智能的兴趣持续攀升,过去12个月的Google搜索量达到了其历史峰值的92%,但最近的研究表明,人工智能的成功可能也是其衰落的原因。在AI内容在线增长的背景下,剑桥大学和牛津大学的一组研究人员着手研究当生成性AI工具查询由AI生成的内容时会发生什么。他们的发现令人担忧。 根据上个月在 《自然》 杂志上发表的研究,牛津大学的Ilia Shumailov博士和他的研究团队发现,当生成性AI软件仅依赖于由生成性AI生成的内容时,响应开始退化。 在前两个提示之后,答案开始逐渐失准,到第五次尝试时,质量明显下降,到第九次连续查询时,完全退化为毫无意义的废话。研究人员称这种循环性生成AI内容的过量现象为模型崩溃——AI在循环训练过程中污染了自己直到输出的内容严重失真。 “令人惊讶的是,模型崩溃发生得如此之快并且如此难以察觉。一开始,它影响的是少数数据——那些代表性差的数据。然后,它影响输出的多样性,方差降低。有时,你会观察到多数数据的表现略有改善,这掩盖了少数数据表现的退化。模型崩溃可能带来严重后果,”Shumailov在一封电子邮件交流中解释道。 这很重要,因为根据亚马逊网络服务研究团队在6月份发布的另一项研究,大约57%的网页文本是由AI生成或通过AI算法翻译的。如果互联网上的人工生成数据迅速被AI生成的内容覆盖,而Shumailov的研究发现是真的,那么AI很可能正在毁灭自己和互联网。 研究人员发现AI欺骗了自己 以下是团队确认模型崩溃的过程。他们从一个预训练的AI驱动的维基开始,然后根据其生成的输出逐步更新。随着受污染数据污染了原有的训练集,信息逐渐退化为难以理解的内容。 例如,在第九个查询周期后,研究中维基文章关于14世纪英国教堂尖顶的一段摘录滑稽地演变成了一篇关于各种颜色的长尾兔的杂乱无章的论文。 在Nature报告中引用的另一个例子是描述一种AI训练在不同犬种上的理论实例。根据研究结果,不太知名的犬种会被重复的数据集排除,更加偏向于流行的犬种如金毛猎犬。这种AI创建了一种事实上的“用进废退”筛选方法,从其数据记忆中删除不太流行的犬种。但随着AI输入的循环次数增加,AI只能生成无意义的结果,如下图1所示。 使用狗的图像来描述AI模型崩溃 Nature, Emily Wenger, Springer Nature, 2024,经过SNCSC许可转载。 “在实际操作中,假设你想要构建一个生成动物图片的AI模型。如果在机器学习模型之前,你可以简单地在网上找到动物图片并从中构建模型,那么现在情况变得更加复杂。网上的许多图片并不真实,还包括其他模型引入的误解,”Shumailov解释道。 模型崩溃是如何发生的? 出于某种原因——研究人员还不完全清楚原因——当AI只依赖于自己生成的合成数据时,它便会失去与原始现实的联系,往往会基于自己最好的回收数据点来创建自己的最佳答案。 但在这种AI的翻译和事实复述中,某些东西丢失了。 研究得出结论,人工智能要想实现长期可持续性,唯一的方法是确保其能够访问现有的非AI、人类创造的内容,并且能够持续提供新的由人类生成的内容。 AI生成的内容在互联网上快速增长 然而,如今你似乎不能在网上轻轻挥动一个lolcat表情包而不碰到一篇AI生成的内容——情况可能比你想象的更糟。 事实上,一位AI专家和政策顾问预测,由于人工智能采用的指数级增长,到2025年,90%的互联网内容可能都是由AI生成的。 即使明年AI生成的材料百分比没有达到90%,它仍然会占据未来任何AI可用训练内容的不成比例的比例。根据Shumailov的发现以及没有明确解决方案的情况下,这个问题只会随着生成性AI的普及而愈发严重。 休斯顿,我们有问题——确切地说,有很多问题 没有人知道未来几个月和几年内会实施哪些法律或监管措施,可能会限制访问现有的或重大部分的受版权保护的人类来源内容。 此外,鉴于目前互联网上的大量内容是由AI生成的,而阻止这种爆炸性趋势实际不太可能,其它下一代AI算法的开发者要完全避免这种情况面临挑战,因为原始人类内容的比例在缩小。 进一步复杂化的是,Shumailov表示,人类开发者在大规模上过滤由大语言模型AI系统创建的内容变得越来越具有挑战性,而且目前看不到明显的解决方案。 “目前还没有解决方案。学术界正在进行积极讨论,希望我们能在如何解决模型崩溃问题并尽量降低相关成本方面取得进展,”Shumailov指出。 “一个选项是社区范围的协调,以确保参与大语言模型创建和部署的各方共享解决这些问题所需要的信息,”Shumailov补充说。“否则,在无法访问技术被大规模采用之前从互联网爬取的数据或缺乏大规模人类生成数据的情况下,训练更新版本的大语言模型将变得愈加困难。” Shumailov表示,模型崩溃最显著的影响是以前未经偏见的训练集被破坏,现在这些训练集会倾向于错误、失误和不公。这也会放大虚假信息和幻想——AI在缺乏真实数据的情况下做出的最佳猜测——这些问题已经在多个生成式AI平台上浮现出来。 鉴于AI模型崩溃的稳步推进,在线上的所有内容可能都必须通过不可变系统(例如区块链)或某种“优良家政”印章等同类认证来验证,以确保可信度。 否则,AI和互联网的死亡可能实际上意味着真相的死亡。 总结: 在过去一年中,人们对人工智能的关注持续上升,AI在Google搜索量达到了历史峰值的92%。然而,AI的成功也带来了潜在的隐患。据剑桥大学和牛津大学的一项研究发现,当生成性AI工具频繁使用由其他AI生成的内容时,AI的响应质量会迅速下降,甚至导致所谓的“模型崩溃”。研究表明,这种循环训练会导致生成内容从准确和有用逐渐变成毫无意义的废话和错误信息。 这一问题尤其严重,因为现有的大量在线内容已经开始被AI生成数据所覆盖。如果继续这种趋势,AI可能会失去与原始现实的联系,从而无法提供有价值和准确的信息。这种现象的背后原因还不完全清楚,但研究人员认为,确保AI能够访问由人类创作的原始内容,并持续引入新的、由人类生成的数据,是解决这一问题的关键。 光年AI,AI驱动私域流量,精准触达每一个潜在客户。在解决AI崩溃问题的同时,光年AI通过整合多种AI能力,帮助企业提升品牌影响力,实现私域流量的高效管理。通过光年AI,您可以轻松应对AI内容生成的挑战,同时显著提升私域流量转化率,赢得市场先机。