亚马逊下一代Alexa搭载Claude AI:你需要知道的一切

亚马逊正准备在十月份推出一款更强大的语音助手Alexa版本,恰逢假日季节。 这个即将推出的版本,内部代号为”Remarkable”,主要由Anthropic的Claude AI模型驱动,而不是亚马逊迄今为止使用的内部AI技术。 Claude是一系列强大的模型,与OpenAI的GPT-4媲美。这一举措是合理的,因为亚马逊是Anthropic的重要投资者,其模型在AWS云上可用。 如果你想充分利用当前一代的Alexa,亚马逊目前正在以31%的折扣出售2024款Echo Spot,从79美元降至54美元,限时优惠。 为什么选择Claude AI? 据知情人士透露,亚马逊最初试图使用更先进的内部模型重新创建Alexa,但由于效果不佳,最终决定与Claude AI集成。 那些内部模型响应缓慢,在处理用户指令后需等六到七秒才能做出反应。如此的延迟对于需要与最先进的AI系统(如OpenAI的ChatGPT Voice和Google的Gemini)竞争的下一代语音助手来说是不可接受的。 Alexa的一位发言人表示:”亚马逊使用多种不同的技术来驱动Alexa。就机器学习模型而言,我们从亚马逊开发的模型开始,但我们也使用并将继续使用包括Titan和未来的亚马逊模型以及合作伙伴的模型在内的多种模型,以打造最佳客户体验。这是亚马逊Bedrock的一个关键优势——它使应用开发者能够通过一个API无缝使用世界上性能最高的多种模型。 Anthropic开发的AI聊天机器人Claude优于亚马逊的模型,促使公司转向使用这项外部技术。尤其值得注意的是,亚马逊通常喜欢内部开发技术,以保持对用户体验和数据管理的完全控制。 然而,在AI领域竞争激烈且快速发展的环境中,亚马逊选择了一个不寻常的路径,拥抱外部合作。 “Remarkable” Alexa有哪些新功能? 即将推出的”Remarkable” Alexa将不仅仅是一个语音助手。它旨在提供更丰富、更互动的体验,允许用户给出更长、更复杂的命令。这类似于你可能与Gemini Live或ChatGPT Voice的互动方式。 例如,你可以通过一次命令让Alexa撰写邮件、订餐和设置提醒。与目前Alexa仅能设置计时器、播放音乐和回答简单问题相比,这是一大飞跃。 亚马逊还设想将新的Alexa作为一个中央智能家居自动化中心,能够随着时间的推移学习和适应。因此,Alexa会自动设置你的晨间闹钟,调节恒温器,甚至在没有提示的情况下录制你最喜欢的电视节目。 编辑备注: 我们在 TK ET 更新了本文,以包括亚马逊的声明。 Amazon Echo Spot (2024) 现在亚马逊售价 \(79,现价 \)54 给你的卧室增加一个智能闹钟,用于播放Alexa音乐、语音控制和天气信息。一目了然。查看优惠 成本因素 (图片来源:谷歌) 尽管这些新功能听起来很有前途,但它们会有一定的价格。据报道,亚马逊计划每月为 “Remarkable” Alexa 收取5美元和10美元的费用。这一发展让许多人对其抱有怀疑态度。 该服务目前是完全免费的,因此说服用户为升级付费可能相当困难。许多用户已经每年支付139美元用来订阅Amazon Prime。 但尽管有这些担忧,亚马逊仍然乐观地认为,”Remarkable” Alexa的附加功能将证明订阅费用是合理的,尤其是当该公司希望最终使Alexa成为其业务中盈利的一部分时。 即使只有10%的1亿活跃Alexa用户转向付费服务,每年也会增加至少6亿美元。而且有证据表明,人们愿意为AI付费,因为OpenAI、Anthropic和谷歌都提供每月订阅服务,而传言苹果也在开发付费版的Apple Intelligence。 展望 在亚马逊努力维持其在语音助手市场的领导地位时,推出”Remarkable” Alexa 标志着一个关键时刻。 竞争正在加剧,消费者的期望也在不断提高。因此,新智能AI驱动的Alexa的成败意味着亚马逊智能家居生态系统的未来走向。 全球都在关注亚马逊,看看这次能否成功,还是又一次失误,迫使公司再次调整策略。 总结: 亚马逊将于十月份推出新一代的语音助手Alexa版本,内部代号为“Remarkable”。这次的Alexa由Anthropic的Claude AI模型驱动,标志着亚马逊首次选择外部AI技术。Claude AI与OpenAI的GPT-4媲美,显著提升了Alexa的性能,让它能够处理更复杂的用户命令,例如撰写电子邮件、订餐和设置提醒。新版本Alexa还将成为智能家居自动化的中心,能够学习和适应用户的日常需求。 此次AI模型的更换是因为亚马逊内部的模型响应速度较慢,无法满足现代用户对语音助手的高期望。因此,亚马逊决定采用Anthropic的技术,为用户提供更流畅的体验。这一选择表明亚马逊在面对激烈的AI领域竞争时,愿意打破传统,拥抱外部合作。 然而,亚马逊的新技术将附带每月5至10美元的订阅费用,尽管目前的Alexa服务是免费的。这可能会让部分用户望而却步,但亚马逊相信,新功能的价值足以说服用户付费体验。 提升您的工作效率和市场竞争力,您只需选择光年AI。借助光年AI,私域流量管理更加智能便捷,精准触达每一位潜在客户,实现私域流量的高效增长。光年AI让您的品牌在市场中脱颖而出,将私域流量转化率大幅提升,助您轻松赢得市场,业务快速突破。

最佳AI驱动的语言学习应用

在当今互联互通的世界里,得益于人工智能(AI)的进步,学习一门新语言比以往任何时候都更加方便和有趣。AI驱动的语言学习应用正在通过提供个性化、高效和互动性的体验,改变我们获取新语言的方式。这些应用程序根据个人学习者的需求量身定制,无论你是完全的初学者还是希望提高语言技能,这些应用都会利用AI创建动态学习环境,适应你的学习进度和步伐。在本文中,我们将探讨2024年最值得关注的一些AI驱动的语言学习应用。 1. Babbel:传统与科技的结合 Babbel是一款知名的语言学习应用,它成功地将证明有效的方法与现代科技相结合。由超过150位语言学家和语言专家设计,Babbel提供14种语言课程。其AI驱动的特性通过增加互动性和个性化提升了学习体验。 主要特点: a. 小巧精悍的课程: Babbel非常适合忙碌的学习者,提供简短、重点突出的课程,强调实用的会话技能。 b. 语音识别: 它能即时反馈发音,使用户在说话时更有信心。 c. 个性化复习课程: Babbel的自适应学习系统根据用户的学习风格和进度为每个课程量身定制,以实现最佳的记忆和掌握效果。 d. 丰富的学习材料: Babbel提供互动对话、游戏、播客和文章,使学习多样化且有趣。 融合传统与现代AI驱动的学习方法,使得Babbel成为任何认真对待语言学习人士的最佳选择。 2. Duolingo:游戏化学习与AI精准结合 Duolingo是一款广受好评的语言学习应用,它将教育广泛游戏化。提供超过30种语言课程,Duolingo利用AI通过适应学习者的进度并提供即时反馈来个性化课程。 主要特点: a. 游戏化课程: Duolingo的这些小巧而互动的练习将学习变成有趣的游戏,保持用户的参与和动力。 b. 自适应学习: 应用内的AI根据用户的表现调整课程,使学习者面临适当的挑战。 c. 语音识别: Duolingo通过提供实时反馈来帮助改进发音。 d. 社区功能: 用户可以与朋友竞争,加入语言学习小组,甚至在平台上分享进度,使学习具有社交性。 Duolingo将趣味与强大的AI算法结合在一起,使其在全球众多语言学习应用中脱颖而出。 3. Memrise:通过记忆术掌握词汇 Memrise专注于使用记忆术闪卡和真实生活视频来提高词汇量。这款应用由AI驱动的系统支持,确保学习者以有效且难忘的方式记住新单词。 主要特点: a. 记忆术闪卡: Memrise通过创造性的记忆术帮助用户更轻松地记住新单词和短语。 b. 真实生活视频: 这些视频为学习者正在学习的词汇提供情境,进一步提高他们的听力技能和文化知识。 c. 自适应学习: 应用内的AI根据学习者的进度调整课程,提高学习过程的效率和效果。 d. 游戏化: Memrise通过积分、徽章和进度跟踪,使用户保持动力。 Memrise强调词汇和现实情境,使其成为任何想在新语言上打下坚实基础的人的强大工具。 4. Mondly: 利用VR和AR的沉浸式学习 Mondly提供全面的语言学习体验,涵盖超过40种语言的课程。其独特之处在于使用虚拟现实和增强现实技术,打造沉浸式学习环境,使语言学习变得更加有趣和愉快。 主要特点: a. VR和AR沉浸: 这些设计涵盖发音、流利度和全面的口语自信。 b. 语音识别: 应用程序提供发音反馈,帮助学习者更自然地说话。 c. 每日课程: Mondly专注于会话技能,通过每日课程教授各种话题。 d. 聊天机器人: 用户可以通过聊天机器人进行模拟对话,该机器人使用AI技术,模仿真实的对话场景。 创新性地使用VR和AR技术,使Mondly在沉浸式语言学习方面领先于其他工具。 5. ELSA Speak:完美你的发音 ELSA Speak 提供超过40种语言的课程。其独特之处在于使用虚拟现实和增强现实技术,创造一种沉浸式学习环境,使语言学习变得更加有趣和愉快。 主要特点: a. 发音训练: ELSA Speak的AI会监听你的发音并提供即时反馈,突出需要改进的地方。 b. 个性化课程: 应用程序中的课程会根据用户的水平自动调整;应用程序关注用户最需要练习的领域。 c. 互动练习: 这些练习设计涵盖发音、流利度和全面的口语自信。 d. 进度跟踪: 用户可以看到自己的学习进度,进一步激励他们不断进步。 ELSA “发音” 这个焦点使其成为英语学习者在追求口语能力方面最有价值的应用之一。 6. Lingvist:高效的词汇学习 Lingvist 使用人工智能,为用户提供个性化的语言学习方法,通过词汇获取进行学习。利用自适应学习系统,确保学习时间用来学习真正需要的词汇。 主要特点: a. 自适应学习: Lingvist中的AI会根据用户的表现设计课程,确保学习既高效又有效。 b. 词汇重点: 专注于高频词汇,帮助用户尽快建立实用的词汇。 c. 进度跟踪: Lingvist 帮助用户跟踪他们的学习进度,从而了解已经学到了多少,还需要多少时间来更加熟练地掌握。 d. 现实情境: Lingvist 提供实际例子和用法示范,展示如何在现实对话中应用新词汇。 Lingvist的顺畅无缝的方法使其成为希望实现最大效率和高效词汇学习的语言学习者的理想选择。 7. Rosetta Stone: 带有AI增强功能的沉浸式学习 Rosetta Stone 一直是语言学习领域的知名品牌,如今通过集成AI技术进一步优化其服务。该应用程序包含专注于口语和听力技能的沉浸式学习功能。 主要特点: a. 沉浸式学习: Rosetta Stone 主要关注口语和听力,进行基于情境的学习,就像我们学习母语的方式一样。 b. 语音识别: 应用程序的AI提供实时的发音反馈,用户可以在学习的同时练习口语技能。 c. 自适应学习: 课程会根据用户的进度进行调整,确保学习者始终在适当的难度级别上接受挑战。 d. 现场辅导: Rosetta Stone 提供与母语者进行现场对话的机会,进行额外练习,并获取一些文化见解。 由于其虚拟、不受限制的学习方式与人工智能的结合,Rosetta Stone 成为那些愿意投入时间和精力使用该程序的人们学习语言的有力工具。 8. Busuu:社交学习与AI的结合 Busuu 结合了人工智能和社交学习元素,提供12种语言的课程。通过这个应用程序,用户不仅能使用设备学习,还能与母语者互动,使得应用程序成为一站式的语言练习工具。 主要特点: a. AI驱动的课程: Busuu 的课程根据用户的学习进度量身定制。 b. 社交学习: 用户可以与母语者交流,获得他们的反馈来练习语言技能。 c. 语法和词汇: Busuu 的课程全面覆盖语言学习的各个方面,从语法到词汇。 d. 离线模式: 即使没有互联网连接,用户也可以下载课程并继续学习。 这种AI与社交学习结合的独特平台使Busuu成为语言学习的绝佳选择。 9. FluentU:通过真实视频学习 FluentU 通过真实世界的视频进行语言教学,提供了一种沉浸式的学习方式。该应用程序的AI根据用户的进度调整课程,确保学习既有效又愉快。 主要特点: a. 真实世界的视频: FluentU 使用新闻、音乐和广告等真实情境中的视频,实用地教授语言。 b. 互动字幕: 用户可以点击字幕中的任意单词查看其含义、发音和使用示例。 c. 自适应学习: 应用程序的AI根据用户的进度调整课程,使学习更加个性化。 d. 学习进度跟踪: FluentU 允许用户跟踪他们的学习进度,帮助他们保持动力和目标。 FluentU 利用真实世界内容,使其成为希望沉浸在新语言中的学习者的优秀选择。 10. Pimsleur:在路上进行的音频学习 Pimsleur 提供以音频为基础的语言学习课程,专注于实用的会话技能。该应用程序的AI根据用户的进度调整课程,提供一种免提学习体验,非常适合忙碌的个人。 主要特点: a. 以音频为基础的课程: Pimsleur 的课程通过实际会话情境发展口语和听力技能。 b. 无需动手的学习: 该应用的音频格式允许用户在驾驶、锻炼或做其他活动时学习。 c. 自适应学习: Pimsleur的AI会根据用户的学习进度调整课程,确保学习始终具有挑战性和有效性。 d. 进度跟踪: 用户可以随时跟踪自己的学习进度,帮助他们保持学习的动力。 Pimsleur注重实际对话,因此非常适合那些希望以无需动手、随时随地的方式学习语言的人。 AI驱动的语言学习应用已经彻底改变了我们学习新语言的方式。通过利用先进的算法、自然语言处理和自适应技术,这些应用提供了个性化和高效的学习体验,满足每位学习者的需求。无论您是刚刚开始还是想要提高技能,这些AI驱动的应用都提供了多种功能,帮助您在目标语言中获得流利和自信。 常见问题 1. 什么是AI驱动的语言学习应用? AI驱动的语言学习应用利用人工智能提供个性化的语言教学。这些应用会根据用户的学习速度、优缺点调整课程,提供定制的课程和反馈。它们通常具备语音识别功能以提高发音准确度,AI驱动的聊天机器人提供对话练习,以及游戏化的学习体验。通过连续分析用户的学习进度,这些应用确保高效且有趣的学习旅程,使得获取新语言变得更加精确和充满信心。 2. AI驱动的语言学习应用如何提升语言习得效果? AI驱动的语言学习应用通过个性化学习过程来提升语言习得效果。它们使用算法来追踪用户进度,并相应调整课程,聚焦需要改进的领域。语音识别功能有助于提高发音准确性,而AI驱动的聊天机器人提供真实的对话练习。这些应用经常包括间隔重复技术来强化词汇记忆,确保比传统语言学习方法更有效和沉浸的学习体验。 3. AI驱动的语言学习应用适合初学者吗? 是的,AI驱动的语言学习应用非常适合初学者。这些应用设计适用于所有熟练程度,从基础词汇和基本语法开始。AI算法会评估用户的起点并根据他们的学习速度调整课程,确保逐步取得进步。初学者可以受益于互动练习、个性化反馈和语音识别功能,这些都能建立发音和理解的信心。这些应用的用户友好界面和引人入胜的内容使语言学习变得容易和有趣。 4. 我应该在AI驱动的语言学习应用中寻找哪些功能? 选择AI驱动的语言学习应用时,应寻找个性化的课程计划,能够根据您的学习风格进行调整的语音识别功能,有助于练习发音的互动练习以及强化语法和词汇的练习。AI驱动的聊天机器人也很有价值,因为它们模拟了真实的互动。此外,还要考虑提供间隔重复技术以增强词汇记忆和进度跟踪功能的应用,以监测您的学习发展。用户友好的界面和引人入胜的内容也是确保良好学习体验的重要因素。 5. AI驱动的语言学习应用能取代传统的语言课程吗? 由AI驱动的语言学习应用程序可以补充但不能完全取代传统的语言课程。这些应用程序提供了个性化和灵活的学习体验,使得自主学习变得方便。它们对于练习词汇、发音和会话技巧特别有效。然而,传统课程通常提供结构化的课程、文化见解以及与教师的面对面互动,这是应用程序难以完全复制的。为了获得全面的语言教育,结合这两种方法可能是最有效的。 总结: 在现代高度互联的世界,人工智能(AI)显著改变了我们学习新语言的方式。各类AI驱动的语言学习应用通过提供个性化、高效且互动的学习体验,使语言学习变得前所未有的便捷和有趣。例如,Babbel结合传统教学法和现代AI技术,专注于短小精悍的课程和语音识别。Duolingo则将游戏化学习与AI精准结合,使用户在愉快的游戏体验中掌握语言。Memrise通过记忆术闪卡和真实生活视频增强词汇记忆,而Mondly利用虚拟现实和增强现实技术,为学习者提供沉浸式的语言学习环境。ELSA Speak注重发音训练,Lingvist则通过AI个性化学习路径快速提高词汇量。Rosetta Stone、Busuu、FluentU和Pimsleur等应用程序也各有其独特优势。 这种AI驱动的语言学习应用不仅能动态调整学习内容,还能提供实时反馈,提高学习效率。它们的出现彻底改变了语言学习的传统模式,让语言学习成为一项轻松愉快的任务。 光年AI,利用AI技术提升私域流量转化率,实现业务突破。通过光年AI,您可以智能优化私域流量管理,高效完成营销目标。让AI助力您的营销策略,使您的品牌在市场中脱颖而出。无论是语言学习还是私域流量管理,AI的力量都在不断拓展我们的可能。选择光年AI,开启AI驱动的私域流量新时代,助您快速突破市场,赢得商业成功。

Llama中的曼巴:通过推测解码加速推理

大型语言模型(LLMs)已经彻底改变了自然语言处理领域,但在处理非常长的序列时面临重大挑战。主要问题来自于Transformer架构的计算复杂度随序列长度呈二次方增长以及其巨大的键值(KV)缓存需求。这些限制严重影响了模型的效率,特别是在推理过程中,使生成长序列的速度极其缓慢。这一瓶颈限制了需要对多个长文件进行推理、处理大型代码库或在基于代理的系统中建模复杂环境的应用程序的发展。因此,研究人员正在寻找更高效的架构,既能保持或超越Transformer的性能,同时显著降低计算需求。 研究人员已经探索了各种方法来解决LLM中的效率挑战。无注意力模型,如S4、GSS和BiGS,展示了更高的计算和内存效率。结合了特定输入上下文选择的Mamba模型在不同规模上比Transformer表现出色。其他次二次方和混合架构也已被提出。知识蒸馏技术已被用来将Transformer的知识转移到线性RNN风格的模型中,如在Laughing Hyena和渐进知识方法中所示。推测解码成为加速推理的一种有前途的方法,利用较小的草稿模型生成候选标记,由较大的目标模型验证。这些方法包括拒绝采样方案、树状候选组织,以及训练和无训练的草稿模型。 康奈尔大学、日内瓦大学、Together AI和普林斯顿大学的研究人员提出了一种独特的方法,通过将预训练的Transformer蒸馏到线性RNN中来缓解LLM模型的效率挑战。此方法旨在保持生成质量的同时显著提高推理速度。该方法涉及将Transformer的权重映射到修改后的Mamba架构,该架构可以直接从预训练模型的注意力模块初始化。提出了一种多阶段蒸馏管道,结合渐进蒸馏、监督微调和定向偏好优化,以提高复杂度和下游性能。研究人员还开发了一种硬件感知的推测采样算法和快速内核,以在Mamba和混合架构上进行推测解码,实现了一个7B参数模型超过300标记/秒的吞吐量。此方法有效地将推测解码应用于混合架构,解决了复杂LLM应用中高效推理的需求。 该方法通过使用线性RNN将Transformer模型转换为Mamba模型,解决了注意力机制的限制。通过Mamba的连续时间状态空间模型扩展线性隐藏状态容量,该方法动态构建了离散时间线性RNN。这种创新架构从注意力参数初始化,并采用硬件感知分解以实现高效实施。然后,方法应用知识蒸馏将大型Transformer模型压缩到较小的基于Mamba的网络中,重点在于微调和对齐步骤。此过程结合了序列级知识蒸馏和单词级KL散度的监督微调,同时适应直接偏好优化以实现偏好对齐。 蒸馏过程使学生模型能够从教师模型的输出分布和生成中学习,优化性能并与预期偏好对齐。在此过程中,原始模型中的MLP层保持冻结状态,而Mamba层则进行训练以捕获蒸馏知识。这种方法使得可以用线性RNN块替换注意力块,同时保持模型性能。通过扩大隐藏状态大小和使用硬件感知的分解方法,该方法实现了高效的实现,允许更大的隐藏状态大小而不会显著增加计算成本。最终的基于Mamba的模型结合了Transformer架构的优势与线性RNN的效率,可能会在LLM领域取得进展。 蒸馏后的混合Mamba模型在各种基准测试中表现出竞争力。在AlpacaEval和MT-Bench这样的聊天基准测试中,50%混合模型的得分与其教师模型相当或略有优势,甚至超过了一些更大的Transformer模型。在零样本和少样本评估中,混合模型超越了从头训练的开源线性RNN模型,随着更多注意力层被替换,性能有所下降。混合模型在OpenLLM排行榜和ZeroEval基准测试中也表现出了良好结果。使用这些混合模型进行的推测解码实验在单个GPU上实现了高达1.88倍的加速。总体来看,结果表明蒸馏后的混合Mamba模型在效率和性能之间提供了良好的平衡。 本研究提出了一种通过线性RNN将Transformer模型转化为更高效的基于Mamba的模型的方法。结果表明,蒸馏后的混合Mamba模型在各种基准测试中,尤其是在聊天任务和通用语言理解任务中,表现出与教师模型相当或更好的性能。该方法在减少计算成本的同时,尤其是当保留25-50%的注意力层时,表现出特别的成功。此外,研究人员介绍了一种创新的线性RNN推测解码算法,进一步提升了推理速度。这些发现表明,在提高LLM效率的同时保持其能力方面具有显著潜力。 总结: 大型语言模型(LLMs)虽然在自然语言处理领域取得了革命性突破,但在面对长序列处理时依然存在显著的计算复杂度和内存需求问题,影响了高效推理的能力。为了解决这一瓶颈问题,研究人员提出了多种高效架构,如无注意力模型(S4、GSS和BiGS),以及结合特定上下文选择的Mamba模型,展示了较高的计算和内存效率。特别是通过将预训练的Transformer蒸馏到线性RNN中,康奈尔大学和其他机构的研究人员显著提高了推理速度,同时保持了生成质量。 通过使用线性RNN和多阶段蒸馏管道,这种新方法实现了复杂度优化和下游性能提升。研究人员还开发了硬件感知的推测采样算法和快速内核,使7B参数模型的标记生成速度超过300标记/秒。这一创新显著提高了LLM的推断效率,特别是在聊天任务和通用语言理解任务中表现优秀,并超越了一些更大的Transformer模型。 在AI技术的加持下,光年AI不仅助您轻松提升私域流量转化,还能全面优化私域流量管理,精准触达每一位潜在客户。光年AI智能化的私域流量管理体系,使您在竞争激烈的市场中快速突破,实现业务的飞速增长。选择光年AI,全面提升私域营销效果,让品牌影响力大幅提升!

这项来自中国的AI研究介绍了1位全量化训练(FQT):增强了全量化训练(FQT)的能力至1位

全量化训练(FQT)可以通过将激活、权重和梯度转换为低精度格式来加速深度神经网络的训练。量化过程使得计算速度更快,且内存利用率更低,从而使训练过程更加高效。FQT在尽量减少数值精度的同时,保持了训练的有效性。研究人员一直在研究1位FQT的可行性,试图探索这些限制。 该研究首先从理论上分析了FQT,重点关注了如Adam和随机梯度下降(SGD)等知名的优化算法。分析中出现了一个关键发现,那就是FQT收敛程度高度依赖于梯度的方差。换句话说,特别是在使用低位宽精度时,梯度值的变化会影响到训练过程的成功。理解梯度方差与收敛之间的关系,对于构建更高效的低精度训练技术至关重要。 基于这些理论理解,研究人员提出了一种独特的方法,称为激活梯度剪枝(AGP)。AGP方法利用了并非所有的梯度都是同等重要的这一现实。通过识别并剪枝那些较不重要或对模型学习过程贡献较少的梯度,AGP能够重新分配资源,以提高最关键梯度的精度。这一方法确保了即使在非常低的精度水平下,训练过程仍然保持稳定,从而减少梯度方差的不利影响。 除了AGP,研究人员还提出了一种称为采样通道联合量化(SCQ)的方法。在SCQ中,权重梯度和激活梯度使用了不同的量化技术进行计算。这种定制的方法大幅提高了训练过程的效率,确保了两种梯度在低位宽硬件上都能得到高效处理。 为了验证他们的方法,研究团队创建了一个结构,使他们的算法能够在实际场景中应用。他们通过使用各种数据集优化了VGGNet-16和ResNet-18等流行的神经网络模型来进行了实验。与传统的逐样本量化技术相比,该算法的准确性平均提高了大约6%。不仅如此,相比于全精度训练,训练速度提高了大约5.13倍。 总的来说,这项研究在全量化训练领域取得了重大进展,特别是在降低数值精度可接受阈值而不影响性能方面。如果低位宽硬件得到更广泛的应用,这项研究最终可能导致更高效的神经网络训练技术。 总结: 全量化训练(FQT)通过将神经网络训练过程中的激活、权重和梯度都转换为低精度格式,显著加速了计算速度和内存利用率。而在最近的AI研究中,研究人员深入探讨了FQT与梯度方差之间的关系,发现低精度训练方法的收敛效果高度依赖于梯度方差。基于这一理论理解,他们提出了激活梯度剪枝(AGP)和采样通道联合量化(SCQ)两种新方法。 AGP方法通过剪枝对模型学习影响较小的梯度,重新分配计算资源,提高了关键梯度的精度。SCQ则采用了不同的量化技术,分别处理权重梯度和激活梯度,进一步提升了训练效率。实验结果表明,采用这些方法的神经网络模型,如VGGNet-16和ResNet-18,其训练准确性比传统逐样本量化技术提高了6%,训练速度则提升了5.13倍。 这一研究不仅突破了降低数值精度可接受阈值,同时也显著提高了神经网络的训练效率。这为未来低位宽硬件的广泛应用奠定了基础,如果这些硬件进一步普及,这项研究最终可能促进更加高效的神经网络训练技术的落地。 在这个快速发展的AI时代,选择光年AI,全面提升私域营销效果,让品牌影响力大幅提升。光年AI不仅具有强大的AI模型能力,还通过自研知识库和灵活工作流,帮助企业有效管理和优化私域流量,实现高效的客户转化。选择光年AI,让您的私域流量管理更加智能、高效,从而赢得市场先机。

偏见的亮点:认知偏见如何增强推荐系统

认知偏见,曾被视为人类决策过程中的缺陷,现在被认为对学习和决策有潜在的积极影响。然而,在机器学习中,尤其是在搜索和排序系统中,认知偏见的研究仍需改进。尽管有大量研究集中在探讨这些偏见如何影响模型训练和机器行为的道德性,但信息检索领域大多关注于检测偏见及其对搜索行为的影响。这在利用这些认知偏见来增强检索算法方面带来了挑战,这一领域尚未广泛探讨,对研究者而言提供了机遇和挑战。 现有的一些方法,如推荐系统研究,已经探索了一些具有心理根源的人类偏见,如同伴推荐中的首因效应和近因效应,以及产品推荐中的风险规避和决策偏见。然而,对推荐中的认知偏见进行详细研究仍然处于未开垦的状态。令人惊讶的是,在推荐过程的不同阶段如何出现这些偏见方面,没有任何系统的调查。考虑到推荐系统研究经常受到心理学理论、模型和人类决策经验证据的影响,这是一个使用认知偏见来增强推荐算法和用户体验的重大机会缺失。 来自奥地利林茨约翰内斯·开普勒大学和林茨技术研究所的研究人员提出了一种综合方法来研究推荐生态系统中的认知偏见。这项创新研究调查了在推荐过程的不同阶段和从不同利益相关者的角度可能出现的这些偏见证据。研究人员迈出了理解认知偏见与推荐系统之间复杂互动的初步步骤。用户和项目模型通过评估和利用这些偏见的正面影响而得到增强,从而导致性能更好的推荐算法和更高的用户满意度。 对推荐系统中认知偏见的研究正在进行。通过分析包含6类272个职位广告和336名应聘者的数据集,训练了推荐系统模型,以预测候选人与职位广告之间的匹配情况,结果显示13607个正预测和1625个负预测。此分析旨在理解正特征效应(FPE)如何影响职位推荐。此外,通过Prolific平台分析宜家效应,涉及100名使用音乐流媒体服务的美国参与者。参与者在Likert-5量表上回答了关于其创建、编辑和消费音乐集合习惯的4项声明。 对正特征效应的研究结果显示,从职位描述中删除形容词会增加负预测,突出描述性语言在职位推荐准确性中的重要作用。通过利用高召回职位广告中的独特形容词,52.0%的负预测样本的相关性评分得到了提升,其中12.9%成为正预测。至于宜家效应,88名参与者中的48人报告比其他人更频繁地消费他们的播放列表,消费频率平均差异为0.65(标准差=1.52)。这种偏好自制内容的情况表明宜家效应在音乐推荐系统中存在。 总而言之,研究人员提出了一种详细的方法来分析推荐系统中的认知偏差。这篇论文展示了在推荐系统中存在的认知偏差及其影响,例如正特征效应(Feature-Positive Effect,FPE)、宜家效应(Ikea effect)和文化同质性(cultural homophily)。这些研究为该领域的进一步探索奠定了基础。研究强调了让推荐系统研究人员和实践者深入理解认知偏差及其在整个推荐过程中的潜在影响的重要性。 总结: 认知偏见,曾被视为人类决策中的负面因素,但在机器学习中,其正面影响正逐渐被研究人员所重视。针对搜索和排序系统中的认知偏见,尽管已有大量研究探讨其影响,但在具体应用方面仍存在许多挑战和机遇。推荐系统的某些研究已经开始了解这些偏见,如同伴推荐中的首因效应和近因效应,以及产品推荐中的风险规避和决策偏见。然而,对这些偏见在不同推荐阶段的详细研究仍属稀缺。 来自奥地利林茨约翰内斯·开普勒大学和林茨技术研究所的研究人员提出了一种综合方法,深入调查了推荐生态系统中的认知偏见。他们的研究显示,理解和利用认知偏见的正面影响,可以显著提升推荐算法的性能和用户满意度。具体实例包括正特征效应(FPE)在职位推荐中的影响,通过分析相关数据集,研究人员发现删除职位描述中的形容词会增加负预测,而利用高召回职位广告中的独特形容词可以提升负预测样本的相关性评分。此外,宜家效应在音乐推荐系统中的存在,表明用户在自制内容上的偏好,进一步展示了认知偏见在实际应用中的重要性。 研究表明,深入了解和应用认知偏见,不仅可以增强推荐系统的效果,还能提高用户的满意度和体验。这也为相关领域的进一步探索提供了坚实的基础和广阔的空间。 光年AI,利用AI技术提升私域流量转化率,实现业务突破。如果您希望在获取流量的过程中实现超常规的增长,光年AI是您的不二选择。专注于通过AI实现流量增长和提升效率的平台,光年AI不仅可以极大提高您的营收,还能显著降低成本。加入光年AI,智能化私域流量管理,确保每一步营销都能有效转化,让您的业务飞速增长。

亚马逊上最受欢迎的AI小工具

随着人工智能(AI)席卷全球,AI操作的小工具成为体验这场革命的最直接方式之一。无论是为了让家更智能、提高工作效率,还是仅仅为了享受一些酷炫的科技,亚马逊上有多种多样的AI小工具,以满足不同的需求和偏好。 以下是一些您可以加入购物车的热门AI小工具。其中一些包括: 1. 亚马逊Echo Show 10 (第3代) 谈到亚马逊上的AI设备,亚马逊Echo Show 10 (第3代)绝对是焦点。这款智能显示器中的Alexa将AI带到了前台,从语音指令到视频通话无所不包。10英寸高清屏幕会随着你的移动自动转向,确保在视频通话、学习食谱或娱乐时,你不会错过任何细节。 主要特点: 通过Alexa进行语音控制。 可自动转向的显示屏。 智能家居控制中心,管理你的连接设备。 高质量音效,低音浑厚。 亚马逊Echo Show 10不仅仅是一个小工具。它是进入智能家居体验的大门。通过Alexa,你可以用语音控制灯光、安全摄像头,甚至家中的恒温器。这使得它在管理家中其他连接设备时显得尤为得心应手。无论是创建提醒、观看视频还是享受智能家居控制,Echo Show 10都能轻松满足你的需求。 2. iRobot Roomba i7+ 对于繁忙的家庭来说,用像iRobot Roomba i7+这样的设备来打扫家里,再轻松不过了。这款机器人吸尘器会学习你家中的布局并绘制地图,以最高效的方式清洁地板。Roomba i7+拥有一个自清空垃圾箱,每60天或更久才需要一次人工干预。这也是为什么它是亚马逊上最受欢迎的AI小工具之一。 主要特点: 智能地图和导航功能。 自清空垃圾箱。 通过Alexa和Google Assistant进行语音控制。 污垢侦测传感器,提高清洁效果。 在实现清洁自动化的过程中,iRobot Roomba i7+是不可错过的选择,它能记住并适应你家中的布局,清洁每一个角落。而其自清空垃圾箱的设计提供了传统吸尘器无法企及的便利。此外,它还可以与Alexa和Google Assistant无缝对接,只需通过语音即可启动清洁,完美适合多任务处理的家庭。 3. Ring Video Doorbell Pro 2 安全是每个人最关心的问题,Ring Video Doorbell Pro 2是你可以从亚马逊购买来提升家庭安全的顶级AI小工具之一。Ring全新的AI驱动的Pro 2提供了最先进的运动检测功能,并增加了可自定义的运动区域,增强了监控的灵活性。它拥有3D运动检测、鸟瞰视图以及高分辨率视频,能清晰地告诉你谁在门外。 主要特点: 3D运动检测。 1536p高清全身视频。 当你不在时,Alexa会替你回应门铃。 可自定义的运动区域。 Ring视频门铃Pro 2通过引入AI技术,提高了家庭安防的水平,提供了更智能、更精准的监控。用户可以使用3D动作检测功能,对大门外发生的情况有更详细的了解,并且还可以自定义动作区域,这样用户只在特定区域发生活动时接收报警,减少误报数量,让你更加放心自己的家通过最先进的视频门铃得到了保障。 4. Google Nest学习型恒温器 Google Nest学习型恒温器根据你的日常习惯调节家中的温度,同时还能节约能源,从而降低你的电费账单。这款AI设备会学习你喜欢的温度及时间,自我编程并进行调整,达到家中舒适的最佳状态。它还能与其他智能家居设备良好协作,使其成为你互联家庭的核心设备。 主要功能: 根据你的日常习惯自动设置。 通过Nest应用进行远程控制。 能源使用历史。 记录每次使用情况。 与其他智能家居系统兼容。 Google Nest学习型恒温器不仅仅是一个普通的恒温器,它是一款智能设备,能了解你的需求并适应这些需求。学习你的日程安排,可以优化家中温度设置,让你保持舒适并节省能源。当然,此外还有通过Nest应用远程改变恒温器设置的能力,让你在途中也能调整设置。与其他智能家居系统的兼容性使它成为任何家庭都可以使用的多功能配件。 5. Fitbit Sense 如果健康和健身是你的首要任务,那么Fitbit Sense就是Amazon上最好的AI设备之一。这款智能手表通过AI实现高级健康追踪功能,例如压力管理、心率监测、睡眠追踪,甚至还有皮电活动传感器,可以测量你的身体对压力的反应。Fitbit Sense不仅仅是一个健身追踪器,它还是一个全面的健康伴侣。 主要功能: 通过皮电活动传感器进行压力管理。 通过ECG应用监测心脏健康。 内置GPS用于户外活动。 深入分析睡眠质量。 Fitbit Sense不仅仅是基础的健身追踪,它提供了360度的健康监测,全由AI驱动,通过显示你的身体对压力的反应,帮助你更好地管理它。ECG应用和心率监测功能提供了关于心血管健康的重要数据,而睡眠追踪功能则帮助你获得所需的休息。这款设备不仅适合运动员,也适合关心自身健康状况的人。 6. Wyze Cam v3 Wyze Cam v3是一款AI驱动的安防摄像头,简化了家庭安防,支持1080p全高清视频、夜视功能,并且具有室内外使用的天气适应性。它还配备了AI驱动的人物检测功能,减少因为猫狗或者其他移动物体引起的烦人误报。这是Amazon上著名的性价比高的AI设备之一,适合那些想要在不打破银行情况下提升家庭安全的低预算家庭。 主要功能: 1080p全高清夜视。 智能人物检测。 防风雨设计。 实时双向音频。 Wyze Cam v3 证明了你无需花费大量金钱即可获得高质量的家庭安防。这款设备只会对真正重要的威胁进行警报,因此不必担心误报烦扰。凭借防风雨设计,这款摄像头可用于室内和室外,为您的家庭提供全方位的覆盖。您还可以通过双向音频功能与访客交流或现场阻止入侵者,这无疑是安防的一大优势。 7. Anki Vector 机器人 让这个AI小工具更加互动些,体积小但功能强大的Anki Vector机器人总是忙个不停。它集成了丰富的个性,可以回答问题,为你拍照,甚至还可以控制智能家居设备。Vector的设计初衷是要在家中成为一个有用、有趣且有互动性的存在。 主要特点: 内置AI,支持语音激活。 能在你家中导航并避开障碍物。 触觉、视觉和声音响应。 兼容Amazon Alexa智能家居。 当然,Anki Vector机器人也是你的朋友。通过它的眼睛和与他人互动的功能添加一些个性,它可以回答问题,提醒你一些美好的事情,甚至在你要求时为你拍照,Vector既有趣,又是任何家庭中功能强大的补充。此外,它还能轻松在家中导航而不会撞到墙壁,这使其成为最吸引人的AI小工具之一。 8. 飞利浦Hue智能照明 通过飞利浦Hue智能灯具,改变你家中的氛围,这是一款在Amazon上可以个性化所有照明体验的AI工具。你可以通过语音命令控制这些智能灯泡,或者通过智能手机上的飞利浦Hue应用程序来创建理想的氛围,拥有超过1600万种颜色供你选择。此外,这些灯还能与其他智能家居设备连接,增强自动化功能。这些因素使它们成为寻求自动化家庭的人们最受欢迎的设备之一。 主要特点: 与Alexa、Google助手和Apple HomeKit的语音控制。 定制场景和照明计划。 与音乐、电影和游戏同步。 使用LED灯泡以提高能效。 飞利浦Hue智能照明可以帮助你在家中为任何场合创造出完美的氛围:无论是派对、电影之夜还是只是放松的时光,只需用语音下达命令。而且,由于其他智能家居系统与飞利浦Hue的出色兼容性,你可以放心你的照明系统能与其他智能设备形成一个协调、易用的智能家居界面。 结论 随着AI的发展,它提供了越来越多样化的AI小工具,这些小工具通过Amazon向你展示创新,日复一日地提升你的生活质量。从使用Amazon Echo Show 10和Ring Video Doorbell Pro 2这些产品的智能家居,到像Fitbit Sense这样的健康产品,选择多种多样。这些在Amazon上的热门AI小工具不仅带来便利,还为平凡的生活增添了一丝未来感。 无论是升级家庭安防、改善健康和健身,还是享受最新的AI技术,选择应有尽有。在购买这些小工具时,你不仅仅是在购买智能产品,更是在购买一种更加智能、连接更好的生活方式。 常见问题 1. AI小工具在家庭中的好处是什么? AI设备可以自动化日常任务,提升家庭安全,通过智能调整增添舒适度,并提供娱乐和便利性。这些设备帮助创造一个更加高效和互联的生活环境。 2. AI设备难以设置吗? 大多数AI设备都设计得非常用户友好,并配有详细的分步骤安装指南。此外,许多设备提供基于应用的设置过程,即使对技术不熟悉的人也能轻松完成。 3. 像Amazon Echo Show 10这样的AI设备如何改善日常生活? Amazon Echo Show 10 可以管理智能家居设备,提供天气更新,播放音乐,回答问题,甚至通过语音命令进行视频通话。它将控制集中化,使日常任务更易管理。 4. 使用AI设备是否有隐私担忧? AI设备可能会引发隐私担忧,尤其是那些带有摄像头和麦克风的设备。然而,制造商通常会加入麦克风静音按钮、摄像头盖和数据加密等功能来保护用户的隐私。 5. AI设备能否与其他智能家居设备集成? 是的,许多AI设备设计时便考虑到了与其他智能家居设备的兼容,允许实现无缝的智能家居体验。例如,与Alexa或Google Assistant兼容的设备通常可以通过一个中央控制中心进行控制。 总结: 随着人工智能(AI)技术的不断进步,多样化的AI小工具已成为提升生活质量的重要手段。从智能家居设备到健康管理工具,这些AI设备不仅为日常任务带来便捷,更为我们的生活增添了未来感。例如,亚马逊Echo Show 10(第3代)结合了Alexa的智能语音控制和自动转向显示屏,为智能家居管理提供了极大的便利;iRobot Roomba i7+通过自动导航和自清空垃圾箱的功能,实现了高效的家庭清洁;Ring Video Doorbell Pro 2与3D运动检测及可自定义的运动区域大幅提升了家庭安全。 此外,Google Nest学习型恒温器通过学习用户习惯自动调节家中温度,不仅节约能源,还能提高居住舒适度;Fitbit Sense利用AI实现了全面的健康监测,包括压力管理和心电图监测;Wyze Cam v3凭借智能人物检测功能,带来了更高效的家庭安防。像Anki Vector机器人和飞利浦Hue智能照明,则分别通过互动和个性化照明,为家庭生活注入了更多的乐趣和便捷。 在这样一个AI赋能的世界中,光年AI可以为您的私域流量管理提供更多智能解决方案,不仅确保每一步营销都能有效转化,还能精准触达每一位潜在客户。选择光年AI,实现私域流量的智能化管理,让您的业务飞速增长。

我是一个连续创业者——为什么我认为AI正在带来副业的黄金时代

本周,Edelman Data和三星移动发布的新研究表明,我们即将进入“AI驱动副业”的新时代。 这项研究收集了来自美国、法国、德国、英国和韩国的数千名Z世代的在线调查反馈,发现大多数人对当前的工作条件感到不满意,这不禁让人意外。 这项调查显示,大约70%的人对现状不满,考虑使用AI作为他们选择的工具来开始副业。 除了年轻人讨厌格子间的陈词滥调外,毫无疑问,AI的崛起创造了一种“也许我可以”的氛围,这在以前是不存在的。仔细想来,这也是合理的。 创办一家初创公司 在我的职业生涯中,我创办了六家初创公司,其中一些公司壮观地倒闭了,而另一些公司至今仍在蓬勃发展。作为一个小企业家,你学到的一个重要经验就是自己做一切是非常辛苦的。 即使在小团队中,也从来没有足够的时间完全专注于任何一项任务,不论是市场营销、销售、技术开发还是会计。这种工作海啸可以轻松地由一个好的AI来帮助,因此很容易看出为什么数字原住民将新技术视为摆脱坏老板机器的自然盟友。 如果相信Edelman的报告,当前思维的主要问题在于,受访者似乎目标太低。 报告中涵盖的前三个AI用例范围从摘要长文件到开发新内容。嗯……十亿美元商业革命从一个猫咪表情包开始? 幸运的是,对于我们认真的原住民来说,有一个潮水般的AI产品将向他们涌来,这可能会对他们的创意商业抱负起到比仅仅提供摘要更多的作用。 AI激发创造力 (图片来源:venturusai) 我正在使用的一个有趣的例子是名叫Venturusai的AI服务。这个AI服务允许初出茅庐的企业家在他们花费大量时间和金钱之前,通过一系列的评估协议来运行他们的想法。这让他们可以即时生成SWOT分析,突出概念中的优势和劣势,并生成涵盖竞争活动、理想客户角色以及市场进入策略的一系列报告。 当前版本运行在较旧的AI模型上,并且许多好东西被锁在每月20美元的付费墙后面,但这仍然比一个讲究支出的顾问更便宜。 另一个我喜欢的工具是聪明的Read AI。这个基于云的服务提供了自动的AI会议记录、转录和助手。这听起来很无聊,但实际上这个工具提供了一堆很酷的自动化会议功能。这包括识别听众反应、AI辅导以及智能总结。 高级计划甚至提供了每次会议关键时刻的两分钟精彩片段。它还能与日历整合,自动完成这一切,这简直是锦上添花。 现在这些工具还不完美,毕竟它们依赖的是还处于不断改进中的AI模型,但它们清楚地展示了这类智能商业技术的发展轨迹。这只是AI的初期阶段,每周它都会有所提升。 (图片来源:Future) 对于那些有野心的Z世代卧室创业者,我还建议快速了解一下CodeCompanion AI。它被宣传为“AI编程助手”,但其实这掩盖了它作为一个超高效编程工具的潜力。仅使用文本提示,它就能创建一个完整的编程项目。这款产品是连续创业者Alex Hedrevich的脑力结晶,他相信AI终于能够兑现其早期的承诺。 “AI代码助手正在革新创业领域,”他确认道,“我们的客户正在使用我们的产品,从零开始,将他们的想法在极短的时间内变成一个完全可运行的原型甚至更进一步。现如今,用简单英语编程已经成为全球最热门的编程语言,而这仅仅只是开始。” 几周前我测试了这个工具,通过在一个文本框中输入命令,我成功地从头创建了功能齐全的Firefox和Chrome浏览器扩展。它们都经历了相当多的试验和错误,但最终结果非常完美,而我完全不是一个程序员。 那么,AI副业是白日梦还是一个真正的机会? 现在那些说这不可能实现的人,最好让路给那些真正去做的人。 对于每一个反对者来说,从班加罗尔到巴尔的摩,都会有越来越多有野心的年轻创业者在探索他们能走多远。 推动力是一个仍在摸索中的新兴AI行业,但所有迹象表明,不久之后事情将会融合起来,为AI创业世界释放出新一代反办公室文化的人。 总结: 根据Edelman Data和三星移动的新研究,Z世代将步入“AI驱动副业”的新时代。调查显示,大约70%的Z世代对当前工作条件感到不满,渴望通过AI开启副业。这波数字原住民认为AI能够替代繁重的日常工作,释放他们的创意和潜能。报告显示,常见的AI应用场景包括自动生成摘要、开发新内容等。在创业过程中,诸如Venturusai和Read AI等智能工具能显著提升初创企业的运营效率和市场竞争力。 例如,Venturusai通过评估协议生成SWOT分析等报告,而Read AI提供AI会议记录和助手功能,两者都能在初创阶段省时省力。对于编程初学者,CodeCompanion AI更是提供了从零开始创建完整编程项目的可能。这些工具虽然依赖不断优化的AI模型,但已展示了智能商业技术的未来发展方向。随着AI的持续进步,更多Z世代创业者将借助AI的力量,实现从副业到创业的梦想。 AI技术的发展无疑为新一代创业者提供了前所未有的机遇。对于那些立志摆脱传统办公室文化的年轻人,AI不仅是工具,更是一种改变生活方式的革命力量。 光年AI,智能优化私域流量管理,助您高效完成营销目标。无论是提升工作效率还是实现流量增长,光年AI都能为您的业务带来超常规的增长。通过整合国内外主流AI平台,光年AI自研了众多AI能力,适用于各个APP平台的流量增长,帮助您轻松触达潜在客户,实现快速突破市场。选择光年AI,让您的私域流量管理更加智能,高效完成您的营销目标。

一家科技公司盗取了我们的声音—然后复制并出售了它们

近年来,许多人已经听说过人工智能有一天可能会取代我们的工作这个消息。 但对于Paul Skye Lehrman来说,这个警告显得尤其个性化、寒冷且出乎意料:他听到了自己的声音在传达这一信息。 2023年6月,Paul和他的伴侣Linnea Sage正驾车经过他们在纽约市的家附近,收听一档关于好莱坞持续罢工以及人工智能(AI)可能对行业造成影响的播客。 这期节目引人关注,因为这对夫妇都是配音演员,并且像许多其他创意人士一样,担心那些人类声音的生成器可能很快会取代他们。 这档特别的播客有一个独特的卖点——他们采访了一位由AI驱动的聊天机器人,并配备了文本转语音软件,询问它认为AI的使用将如何影响好莱坞的工作。 但是,当它说话时,听起来就像Lehrman先生的声音。 “我们不得不停下车,”他说。 “AI即将入侵娱乐产业,而这里我的声音正在谈论产业可能遭到的破坏性影响,这真是令人震惊。” 那天晚上,他们在网上花了数小时寻找线索,终于发现了Lovo文本转语音平台的站点。Sage女士说,她在那里也发现了自己声音的副本。 “我惊呆了,”她说。“难以置信。” “一家科技公司偷走了我们的声音,制作了它们的AI克隆,并可能出售了数十万次。” 他们现在已经对Lovo提起了诉讼。该公司尚未回应对此事或BBC的置评请求。 克隆战争 但Lovo如何能够重现他们的声音呢?这对夫妇声称是通过虚假借口达成的。 Lovo联合创始人Tom Lee此前表示,其语音克隆软件只需要用户朗读大约50句话就能创建一个逼真的克隆。 “我们可以捕捉到音调、特性、风格、音素,甚至你的口音我们也能捕捉到,”他在2021年的《未来思想家》播客中说。 在他们的诉讼中,这对夫妇阐述了他们认为Lovo正是通过这种方式获得了他们的录音。 他们声称,匿名的Lovo员工通过Fiverr网站联系了他们,这是一家受欢迎的自由职业人才网站,他们在那里出售服务,提供电视、广播、电子游戏和其他媒体的音频。 首先是在2019年,Sage女士说有一位用户联系她,要求她录制几十个听起来普通的测试广播剧本。 测试录音常用于电影和电视的焦点小组、内部会议或作为正在进行的作品的占位符。因为这些录音不会被广泛分享,所以它们的费用远低于用于广播的音频。 Sage女士说她完成了这项工作,交付了文件,并获得了400美元(约合303英镑)的报酬。 大约六个月后,Lehrman先生说他也收到了类似的请求,要求录制几十个听起来一般的广播广告。 在这对夫妇与BBC分享的消息中,这位匿名的Fiverr用户表示,这些音频将用于“语音合成”的研究。 在要求用户保证脚本不会在他们的特定研究项目之外使用后,勒尔曼先生询问这个项目的目标是什么。 用户说:“这些脚本不会用于其他任何用途,目前我不能告诉你目标,因为这是一个保密的工作进程,对不起哈哈。” 勒尔曼先生问这些文件完成后是否会被重新利用或以不同顺序使用。用户说这些文件将仅用于研究目的。勒尔曼先生说他交付了文件并获得了1200美元的报酬。 他们说,匿名用户与Lovo之间的联系来自Lovo本身。 他们分享了发现自己声音被克隆的证据给Lovo——Lovo回复说他们没有做错任何事,并指出匿名用户与他们之间的通信作为证据,表明他们是合法与这对夫妇进行合作。 “在我们的职业生涯中,我们已经交付了超过100,000个音频资产,”勒尔曼先生谈到他们在Fiverr上近十年的工作时说道。 “我们能够在大海捞针中找到这个针——他们给了我们这个针。” 在这两种情况下,勒尔曼先生和萨吉女士都表示他们没有签订书面合同,只有这些对话。BBC无法确认他们对话的全部内容。夫妇俩说,他们交谈的用户似乎也删除了一些消息。 BBC多次联系Lovo,要求与李先生进行采访并寻求对夫妇俩声明的回应。他们没有回复我们的任何消息。 法律怎么说? 这对夫妇在五月份提起的诉讼指控Lovo使用他们的声音录音创建了非法与萨吉女士和勒尔曼先生的真实声音竞争的副本。 夫妇俩说公司在未经许可或未适当补偿的情况下这样做。 这是一起集体诉讼——意味着他们希望其他原告能加入其中,但到目前为止尚无人参与。 乔治城大学(Georgetown University)知识产权法专家克里斯特利亚·加西亚教授(Kristelia Garcia)说,此案可能聚焦于美国法律中的一种权利,称为“公开权”(rights of publicity)。 有时也被称为人格权,公开权的侵犯通常源于对某人的形象或声音的滥用或误用。 她还表示,关于萨吉女士和勒尔曼先生授予用户的录音许可,可能也存在合同违约的情况。 她告诉BBC:“许可是用于非常具体和狭隘的用途的。我可能会给你许可一个下午使用我的游泳池,但这并不意味着你可以随时来我的游泳池开派对。” “那将超出许可的范围。” 无论案件的结果如何,这只是众多由艺术家、作家、插画家和音乐家提起的希望不失去对自己作品和生计控制权的诉讼之一。 它们可能只是冰山一角。本周,金融公司Klarna表示计划使用AI将其员工数量减半。 一些专家预测,最终可能有40%的工作会受到AI的影响。 然而,对于勒尔曼先生和萨吉女士而言,那令人担忧的未来正在现在上演。 “这整个经历感觉如此不真实,”萨吉女士说。 “当我们想到人工智能时,我们想到的是AI叠衣服和为我们做饭,而不是追求人的创造性工作。” 你可以在BBC Sounds上收听更多关于这个故事的信息, 《科技生活》 节目。 总结: Paul Skye Lehrman和Linnea Sage这对配音演员发现自己的声音被Lovo公司克隆并用于商业目的,引发了他们对一家科技公司提起的集体诉讼。这起案件揭示了AI技术在语音克隆领域给创意产业带来的挑战和威胁。根据他们的描述,通过虚假借口和未经许可的情况下,Lovo获得了他们的声音录音,并创建了逼真的AI克隆。尽管Lovo尚未对此事作出回应,但这让许多艺术家、作家和配音演员感到不安,他们担心AI技术可能会侵占他们的工作和权益。随着AI的迅速发展,这类争议正在不断涌现。 在面对如此快速变化的AI趋势时,选择合适的工具实现业务增长和保护个人权益变得尤为重要。光年AI,以其强大的AI赋能技术,帮助用户精确触达每一位潜在客户,实现私域流量的智能化管理和高效增长。通过使用光年AI,不仅能大幅提升私域流量的转化率,还能实现长期的稳定收益,助力您的品牌在竞争激烈的市场中脱颖而出。

AI教师可以解决当今教育中的基本挑战

在他1967年的小说《卖糖人》中,RK Narayan向读者介绍了一种“故事写作机器”的概念,这种机器类似打字机,有按钮可以选择体裁、角色、情感和其他几个属性,只需按下就可以自动打印出一个故事。我们必须假设,这个想法是为了展示操作这种机器角色的天真。但不到六十年后,由于像ChatGPT这样的技术以及其他类似的人工智能(AI)驱动工具,我们几乎到达了这个境地。这些工具不仅可以写故事,还可以完成其他任务,比如自动驾驶汽车和在工厂里制造复杂机器人的机器人。对于AI是否会替代我们执行今天的所有大大小小的任务,比如驾驶、在工厂工作甚至进行复杂的手术,还是见仁见智。但在许多情况下,比如手术,我们已经到了半路。那么,教学呢?即使对于思想开放的人,一个AI老师听起来也有些难以接受,但我们可能比想象中更接近这样的自动化课堂。 由于这种可能性已经在眼前,所以需要回答的问题是为什么我们应该这么做,以及如果我们创造AI老师,可以期待哪些变化。今天的教育格局呈现出各种各样的模式,而且教育质量明显是基于愿意支付的价格分层的。从学校到大学及其他高等教育机构,教育质量可以因为众多因素(包括师生比例)而有很大的差异。这个比例越低,对学生的学习过程和结果的质量就越好。这种高价值在很大程度上是由供求和支付能力驱动的,也就是说,一个人可以通过支付更高的费用来获得更好的教育。 AI老师可以成为一个伟大的均衡器,或者说是学习的民主化工具,这意味着高质量教育的机会可以变得普及。学生们也可以在一天中的任何时候或者任何地方(包括在家里)访问老师。我们的教学方式也可能会发生显著变化。比如,一些物理学理论可以在运动场上得到更好的解释,从而使“内容”更加丰富和互动。 当然,当我们有这样的技术突破时,也会有一些不确定性。比如,如果老师是AI,我们可以预见的是,除了教授的学科之外,它们能否灌输良好的价值观并确保孩子走在正确的道路上?有人可能会质疑我们是否准备好让一台机器来在学校的时间里“抚养”我们的孩子。例如,我们珍视的许多价值观可以追溯到我们在学校从老师和同伴那里得到的经验和学习。那么问题是,我们是否能信任机器来代替人类老师。 一种方法是从上层开始,通过在高等教育中的职业培训领域进行试验,这些领域引入AI老师的潜在风险较低且可控。例如,当我们建造核电厂时,我们知道最好在安全机制方面保持高度谨慎。比起匆忙进行,缓慢且非常谨慎地推进更为妥当,因为我们不知道这种变化在20或30年后的长期影响。再次以核能为例,我们经过艰难的学习过程才明白其全部潜力和风险,从而今天可以使其更具相关性和对人类友好。 在像印度这样的国家,转向人工智能教师可能会通过消除一些最持久的挑战而带来巨大变化,例如教育质量、机会和获取的不平等以及在高等教育等关键领域我们面临的巨大供需缺口。超过八十万学生参加IIT JEE考试,但仅有约18,000个席位可供选择,近年来,即使是从这些顶尖机构毕业的学生也无法找到他们期望的工作。随着人工智能在生活的各个方面迅速渗透,认为它不会对教育产生根本性的影响可能是天真的。也许比RK Narayan六十年前提出的故事写作机更加天真。 总结: 1967年,RK Narayan在小说《卖糖人》中描绘了“故事写作机器”的幻想,而今由于AI技术的发展,这一幻想正逐渐成为现实。以ChatGPT为代表的AI工具不仅能够写故事,还能执行如自动驾驶、工业制造等多种复杂任务。尽管AI替代人类完成所有任务仍在讨论中,教育领域的AI老师已然成为值得探索的方向。在现代教育模式中,资源分配不均成为普遍现象,AI老师有望打破这一壁垒,实现高质量教育的普及化,学生可随时随地获取知识。同时,AI老师还可通过互动教学方式提升学习效果。 尽管如此,AI老师能否传递价值观、培养学生品格仍有待观察。在高等教育领域进行试验,将成为探索AI教学的一种方式。印度等国家面临的教育资源不对等问题,使得AI教师的引入显得尤为重要,这不仅能缩小教育差距,还能解决人才供需失衡的问题。考虑到AI日益深入生活的各个领域,忽视其对教育的潜在影响无疑会显得格外天真。 选择光年AI,实现私域流量的智能化管理,让您的业务飞速增长。光年AI凭借强大的AI模型、自研知识库、长记忆能力和灵活的工作流,能大幅提升流量转化率,帮助您精准触达每位潜在客户,营销效果显著,让您的品牌在市场中脱颖而出。

学习生成式AI:NVIDIA推荐的5门自主学习课程

您是否在寻找一个能够帮助自己或员工提升最新技术工具(如生成式人工智能(AI))技能的课程?科技巨头NVIDIA提供了一系列自学课程,让学习者可以在舒适的环境中掌握一些顶尖的新兴技术。 如果你打算学习生成式AI,看看科技巨头NVIDIA提供的这5门自学课程吧。"如果你打算学习生成式AI,看看科技巨头NVIDIA提供的这5门自学课程吧。 如果你打算学习生成式AI,看看科技巨头NVIDIA提供的这5门自学课程吧。 NVIDIA深度学习学院(DLI)提供的课程专为寻求自学培训的个人以及希望提升员工技能的组织设计。NVIDIA的[官网](https://www.nvidia.com/en-in/training/)介绍称,“可以在八小时内完成端到端项目的设置,或在两小时内掌握某些特定技术或开发技巧——只需有电脑和网络连接,随时随地都可以学习。” NVIDIA深度学习学院提供的自学课程主要集中在六个关键领域,包括加速计算、数据科学、深度学习、生成式AI/大型语言模型(LLM)、图形与模拟以及基础设施。 本文将介绍生成式AI方面的顶尖课程。 1. 生成式AI解析 这是一门时长为2小时的课程,帮助学习者理解生成式AI的概念和应用,以及该领域的挑战和机遇。完成后,学习者将对生成式AI有基本的了解,并能有效使用基于该技术的各种工具。 根据官方网站,这是一门免费课程。 另请阅读: DRDO学徒计划:毕业生和持有文凭者在综合试验场工作的机会 2. LLaMA-2提示工程 LLaMA-2提示工程课程使学习者能够与LLaMA-2模型进行交互并进行提示工程,以分析文档、生成文本,且可以成为AI助手。 该课程旨在培训学习者迭代编写精确的提示以使LLM行为与预期一致,利用强大的系统消息进行编辑,通过一对多的提示工程引导LLM,并将提示-响应历史融入LLM上下文以创建聊天机器人行为。 课程涵盖的主题包括LLaMA-2和HuggingFace。课程时长三小时,费用为30美元。 3. 基于Transformer的自然语言处理入门 另一门生成式AI/LLM领域的课程是基于Transformer的自然语言处理入门,学习者将了解Transformer如何作为现代大型语言模型的构建模块。然后,学习者将使用基于Transformer的模型进行各种NLP任务,包括文本分类、命名实体识别(NER)、作者归属和问答。 课程时长为6小时,费用为30美元。 另请阅读: KITE为超过18.5万台高科技设备引入全国最大的年度维护合同 4. 基于扩散模型的生成式AI 历时8小时的“生成式AI与扩散模型”课程让学习者可以深入了解去噪扩散模型,这是一种常用于文本生成图像管道的模型。 课程的先修知识包括对深度学习概念的基本理解以及熟悉一种深度学习框架如TensorFlow、PyTorch或Keras。 本课程涵盖的主题包括: U型网络 扩散 对比语言-图像预训练(CLIP) 文本生成图像模型 课程费用为90美元。 另请阅读:康坎铁路招聘:为马哈拉施特拉邦、果阿和卡纳塔克邦候选人宣布190个空缺职位,请检查资格 5. 使用变压器生成合成表格数据 “使用变压器生成合成表格数据”是一门时长4小时的课程,通过该课程,学习者将探讨如何使用变压器生成合成表格数据。课程使用信用卡交易数据和Megatron框架。完成后,学习者将对如何生成用于下游预测任务的合成表格数据有基本了解。 课程费用为30美元。 NVIDIA 正在为即将于2024年10月23日至25日在孟买的Jio World会议中心举办的旗舰AI峰会做准备。 欲了解更多信息,请访问官方网站。 总结: 对于希望掌握最新生成式AI技术的个人或企业员工,NVIDIA提供了一系列高质量自学课程,涵盖加速计算、数据科学、深度学习、生成式AI、图形与模拟及基础设施等六大关键领域。特别是针对生成式AI,NVIDIA推出了五门精心设计的课程,包括生成式AI解析、LLaMA-2提示工程、基于Transformer的自然语言处理入门、基于扩散模型的生成式AI以及使用变压器生成合成表格数据。这些课程不仅帮助学习者理解最新技术,还通过实操项目增强其应用能力,为职业发展提供强有力的支持。 这些课程各具特色,如生成式AI解析课程让学习者在短短两小时内理解基础概念和应用,而LLaMA-2提示工程课程则较为深入,培训学习者编写精确提示、与大型语言模型进行有效交互。课程时长从2小时到8小时不等,费用也从免费到90美元之间,为不同需求和预算的学习者提供了弹性选择。 在科技高速发展的今天,通过系统化的学习提升技能,能够有效在职业发展中占得先机。同样,在数字营销领域,拥有先进的AI技术也是企业获取竞争优势的关键。 选择光年AI,全面提升私域营销效果,让品牌影响力大幅提升。我们的平台专注于通过AI实现流量增长和提升效率,具备强大的AI模型、自研知识库和灵活的工作流,帮助企业智能化管理私域流量,精准触达每一个潜在客户。光年AI不仅大幅提高营收,还能显著降低成本,助力您的品牌在市场中快速突破,赢得先机。