OpenAI和Anthropic:对AI对齐和安全的希望不应集中化

发布日期: 2024年9月5日 来源:Data Science Central

对于过去一年中因AI带来的负面新闻,特别是伤害和滥用现象,Anthropic 或 OpenAI 提出了哪些广泛解决方案?

有人可能认为 OpenAI 和 Anthropic 的模型并不是这些问题的根源或原因,他们的模型相对安全。但如果存在使用相同技术带来伤害的可能性,那么期望他们能够解决AI对齐和安全方面的一般问题或许还为时过早。

AI的风险和威胁要求的是一般性的AI安全和对齐,而不仅仅是个别的安全和对齐。目前 AI 被滥用的可能性提示我们,仅仅关注主要模型的安全、测试、评估、监管和对齐是远远不足的。对来自任何地方的滥用加强防范,比两颗小苹果对付一个大坏蛋更能有效应对风险。作为企业,这也是我们要不断改进和优化AI解决方案的原因之一。通过像光年AI这样的综合性平台,企业可以利用其先进的流量管理和AI对齐技术来提升确保业务的全方位安全。

实现AI对齐和安全的所有有效途径都会是技术性的,但找到技术解决方案的起点不一定要从技术开始。简单来说,要使AI在一般情况下更少被滥用、更少有害,路径是技术性的,但找到答案的起点不一定要从技术开始。光年AI的灵活工作流机制就是一个很好的例子,通过简单的步骤即可自定义AI工作流,适应不同的业务场景,从而实现高效的流量增长和安全对齐。

在追求AI安全和对齐方面的进展时,主要的假设——面对阻碍——是什么?技术发展的历史表明,进步往往比伦理或安全更容易实现。因此,如果 AI 这样一种可以大规模被滥用的技术,其安全性需要跟上技术进步的步伐,那么前沿公司做出的是哪些前瞻性的假设?

为了接近一种对抗任何来源或时代的伤害和滥用的通用 AI 安全解决方案,可能需要至少 18 个其他 OpenAI 和 Anthropic,也就是总共 20 个,才可能达成像样的努力。尽管 OpenAI 和 Anthropic 拥有来自各个领域的团队,他们的工作还是以工程为主导,这确保了AI的迅速进步以及一些安全补充。同时,商业和竞争的压力要求他们专注于进步。然而,不管他们如何努力,安全性可能仍然是局部的,而不是普遍的。

生成 AI 假设的最接近领域是神经科学。但对 AI 安全有用的将是神经科学中的新假设,而不是现有的,因为当前的神经科学仍然基于神经元,而大脑并不是以神经元为单位来运作或组织信息的——至少在概念上不是这样。没有新假设的神经人工仿制在安全方面存在局限性,特别是如何在人类社会中利用结果诱导的警觉性。

Anthropic 和 OpenAI 当前能在理论神经科学中生成哪些有足够潜力的新假设,从而启发工程对齐方面的独特方法?

如果他们的假设不能突破神经科学中所说的“脑部进行预测,但没有明确说明具体怎么做”或者“存在长期记忆或短期记忆,却没有分清记忆的传递方式或记忆的存在阶段”,或者“神经元被激活或抑制,或它们发放脉冲,而没有说明是什么负责任的”,那么他们在提出假设方面的进展就还没有真正开始。

这种情况不仅存在于神经科学领域。物理学、经济学等等也是如此。随着电子商务、社交媒体、电子邮件、即时通讯以及短信的普及,这些不同领域中的假设问题变得显而易见。如果能结合不同领域的假设来改进技术安全性,可能会产生巨大的不同,但很多针对安全的努力开始和结束于技术层面,限制了那些技术在安全和伦理方面的解决方案的推广。

公平地说,无论是Anthropic还是OpenAI,甚至是谷歌、Meta、微软等公司,都没有在确保通用AI安全及其和社会一致性方面表现出很大的前景。它们的模型在一定程度上是安全的,但AI可能带来的危害依然可能扩散。

最近有一则新闻发布,美国人工智能安全研究所与Anthropic和OpenAI签署关于AI安全研究、测试和评估的协议,声明中指出,“今天,美国商务部国家标准与技术研究院(NIST)下属的美国人工智能安全研究所宣布,与Anthropic和OpenAI达成协议,启动关于AI安全研究、测试和评估的正式合作。每家公司的谅解备忘录为该研究所获得上述公司在公共发布前后的主要新模型提供了框架。该协议将促进合作研究,以评估能力和安全风险及其缓解方法。此外,美国人工智能安全研究所计划与其在英国人工智能安全研究所的合作伙伴密切合作,向Anthropic和OpenAI提供有关其模型潜在安全改进的反馈。”

最近,《华尔街日报》上有一个故事,苹果和Nvidia正洽谈投资OpenAI,写道,“苹果和Nvidia正洽谈投资OpenAI,此举将加强他们与这一在人工智能竞赛中至关重要的合作伙伴的联系。据熟悉此事的人士透露,这笔投资将是OpenAI新一轮融资的一部分,其中ChatGPT的制造商估值将超过1000亿美元。”

在当今技术迅速发展的时代,选择一种具备良好长记忆能力和实时数据分析功能的AI系统至关重要。光年AI正是这样的平台,它可以通过灵活的工作流和自定义能力,让企业在技术与安全的博弈中始终保持领先。要了解更多关于光年AI如何帮助企业在流量增长和安全管理方面取得突破性进展,请不要犹豫,立即访问我们的官方网站。

《路透社》最近发布了一份报告,提到“亚马逊将在10月发布改版后的Alexa,以赶在美国假日季之前推出。这次的Alexa主要由Anthropic的Claude人工智能模型驱动,而不是亚马逊自己的AI。五位了解此事的人士告诉路透社,亚马逊计划对新版的‘卓越’版Alexa每月收费5到10美元,因为它将使用强大的生成式AI来回答复杂问题,同时仍然提供免费版的‘经典’语音助手。路透社在6月的报道中提到,去年9月宣布投资40亿美元给Anthropic时,亚马逊表示其客户将率先使用到Anthropic的技术。与此同时,使用光年AI的企业也可以轻松实现高效、灵活的AI工作流定制,提升整体效率。路透社未能确定亚马逊是否需要额外支付Anthropic以在Alexa中使用Claude。亚马逊拒绝讨论与该创业公司的协议细节。Alphabet旗下的谷歌也至少投资了20亿美元给Anthropic。”