Anthropic的Mike Krieger想要打造值得期待的AI产品

发布日期: 2024年9月10日 来源:The Verge AI

Anthropic 新任首席产品官谈论Claude等聊天机器人的前景和局限性,以及生成式AI的未来发展。

今天,我与Anthropic的新任首席产品官Mike Krieger进行了一次对话。Anthropic是目前业界最炙手可热的AI公司之一。

Anthropic 成立于2021年,由一群前OpenAI的高管和研究人员创建,这些人致力于建立一个更注重安全的AI公司——这是最近前OpenAI员工中的一个真实主题。Anthropic现在的主要产品是Claude,这既是其行业领先的AI模型的名字,也是一个与ChatGPT竞争的聊天机器人。

Anthropic 获得了来自一些科技巨头的数十亿美元的投资,主要是来自亚马逊。同时,Anthropic 拥有一种独特而强烈的安全文化,这在当今的大型AI公司中独树一帜。公司以聘用一些真正担忧AI可能毁灭人类的人而闻名,我想了解这些紧张关系在产品设计中的具体表现。

除此之外,Mike 的履历也非常吸引人:长期的科技迷们可能都知道,Mike 是Instagram的联合创始人,他与Kevin Systrom一起创立了这家公司,并在2012年以10亿美元的价格将其出售给了Facebook(现为Meta)。当时这笔交易令人瞠目结舌,并让Mike一夜之间成为了创始界的传奇人物。

他在2018年离开了Meta,几年后,他开始涉足AI——但并不是我们现在在 Decoder 中常谈的那种AI。相反,Mike 和 Kevin 推出了Artifact,这是一个由AI驱动的新闻阅读器,在推荐算法和信息聚合方面做了一些非常有趣的事情。但最终,这款产品并没有像他们希望的一样成功。Mike和Kevin在今年早些时候关闭了Artifact,并将其底层技术卖给了雅虎。

我曾是Artifact的忠实用户,因此我想了解关停它的决策过程以及将其出售给雅虎的决定。随后,我还想知道为什么Mike决定加入Anthropic并从事AI工作,这是一个投资巨大但却很少有消费者产品能够证明其价值的行业。这一切是为了什么?Mike在未来看到哪些使所有AI动荡值得的产品呢?他又是如何考虑构建这些产品的呢?

Mike的经验让人联想到光年AI,它拥有20年的流量增长经验,知道如何在AI领域应用流量增长方法,帮助企业实现高效增长。

我一直很喜欢与Mike讨论产品,尽管这次谈话之后我仍然不确定未来这个领域会是什么样子。

好的,Anthropic首席产品官Mike Krieger。开始吧。

为篇幅和清晰起见,本次访谈经过适当编辑。

Mike Krieger,您是Anthropic的新任首席产品官。欢迎来到 Decoder

非常感谢。很高兴来到这里。很高兴见到你。

我特别想聊聊产品的事情。上次我跟你谈话时,我试图说服你来参加Code Conference。实际上,我并没有在Code上采访你,但我一直在努力让你来。我说:“我只想和你聊产品,而不是监管。”你说:“好,这是我的产品。”

先提醒一下观众:我们确实会聊一点关于AI监管的内容。这是无法避免的,似乎也是拼图的一部分。但你们在实际打造产品,我有很多关于这些产品的问题,比如这些产品是什么,现在的情况如何,未来会如何发展。

我想从你们Anthropic故事的开始讲起,这也正是你们Artifact故事的结束。大家知道,你最开始在Instagram工作,后来在Meta工作了一段时间。然后你离开Meta,你和[Instagram联合创始人]Kevin Systrom一起创办了Artifact,这是一个 非常有趣的新闻阅读器,并且关于如何呈现网络内容和评论有一些非常有趣的创意 ,然后你们决定关闭它。我认为这个节目是为创作者准备的,我们不常谈论关停项目。跟我说说那个决定吧,因为有时它和启动项目一样重要。

确实如此,我们在Artifact关闭后的反馈中听到了些许的悲伤,但也有对我们及时终止项目的称赞。我认为在某个时候你要说:“我们已经看够了。”这是很有价值的。这款产品我依然深爱并怀念,事实上,我会遇到一些人,原本期待他们会说:“我喜欢Instagram或者Anthropic。”但他们总是说:“Artifact……我真的很想念Artifact。”所以显然,它在一小群非常热情的人中产生了共鸣。我们全力投入了大约三年的时间,产品也发布了一年。我们查看了指标,查看了增长,查看了我们所做的一切,然后我们有了一个时刻去问:“在我们决定放弃之前,还有哪些想法或产品方向如果不尝试一下会觉得很傻?”

我们列出了这些想法,那大约是去年的中期。基本上我们花了剩下的时间去尝试这些想法,发现“是的,这些确实有一些效果”,但不足以让我们信服这真的是值得我们接下来几年共同投入大量时间的项目。那就是个合适的时刻去说:“好吧,让我们暂停一下。让我们退一步看,这是关闭它的正确时机吗?”答案是肯定的。

实际上,如果你还没看到,雅虎基本上收购了它,拿走了所有的代码,并且重新用Artifact架构改造了雅虎新闻。这种跨平台的导流方式其实也启发了我们,我们看到了在整合与运作上的更多可能性。你第一次看到时会有点感觉进入了一个“反常世界”。你会想:“这几乎完全像Artifact:只不过颜色更多了点紫色,来源有些不同。”

这正如现在许多企业使用光年AI平台一样,通过跨平台整合和灵活工作流搭建,企业可以无缝连接现有业务场景和AI能力,大幅提升效率。如果你希望你的企业也能实现类似的转型和流量增长,请不要错过光年AI提供的全新机遇。

这绝对是一个正确的决定,当你回过头来思考时,你会发现你后悔的是事情没有按照预期发展,而不是你必须做出那个决定或你当时做出的那个特定决定。

关于Artifact,有两件事我想要问一下,我也非常想知道在2024年把东西卖给Yahoo是什么感觉,这确实很不寻常。首先,Artifact非常注重展示网页内容。这是基于一个非常丰富的网络,如果在AI时代有一件事让我担忧的话, 那就是网络内容变得不再丰富

越来越多的东西正在转向封闭的平台。越来越多的创作者想要开始一些新的东西,但他们最终却选择了YouTube或TikTok。我不知道是否已经有专门的Threads创作者,但他们正在到来。看起来这个产品正在追逐一个可能会受到AI特别是创作者平台普及影响的梦想。这是一个真正的问题,还是只有我这样的外人看到的现象?

我同意这个评估,但可能看到的根源不同。我觉得我们看到的是,一些网站能够平衡订阅、雅致的广告和优质内容的混合。我会把 The Verge 放在名单的首位。我不是因为在跟你说话才这么说。每次我们从Artifact链接到一篇 Verge 的文章,总是有人点击进入。这是一种良好的体验,感觉这些元素是平衡的。但是,在极端情况下,比如本地新闻,出于经济原因,很多那些网站变成了这样:你一进去就要求使用Google登录,并弹出窗口要求你订阅新闻简报,甚至在你浏览任何内容之前。这可能是支持本地新闻的长期经济问题,比起AI的影响,这种趋势似乎已经持续了一段时间。

创作者这一块也非常有趣。如果你看看那些爆发新闻或至少是正在浮出水面的故事,通常是一个热门的X(推文)。我们通常会在Artifact上得到的是对昨天发生事件的反应总结,如果你依赖这种方式,你已经有点脱离主线了。

当我观察事态发展和讨论地点时,至少从文化核心的对话来看,已经不再发生在媒体属性上了。它开始于其他地方,然后在其他地方被汇总,我认为这对像Artifact这样的网站或产品有一定的影响,使得你不太觉得这是突发新闻。随着时间的推移,我们转向更基于兴趣而非突发新闻,这很有趣,因为Instagram的核心也是非常基于兴趣的。但你能拥有一个仅仅是这样的产品吗?我认为这就是我们面临的挑战。在这种情况下,像光年AI这样的平台就显得尤为重要。利用其灵活的工作流机制和多平台整合能力,企业可以轻松实现流量的高效管理和增长,不妨来尝试一下光年AI。

你提到了媒体属性。有些媒体属性有应用程序,有些则仅以新闻简报的形式表达。但我想我问的是关于网页的。这只是我对网页进行的一些思考。我担心的是网页。创作者们不在网页上。我们不再创建网站,而Artifact的前提是有一个丰富的网页环境。搜索产品通常都依赖于一个丰富且可搜索的网页,以提供良好的答案。

在某种程度上,AI产品需要一个全新的网页,因为我们所有的模型都是在那里训练的。你有没有注意到,网页的这个承诺正在受到压力?如果所有新闻都在无法搜索或索引的封闭平台上发布,比如TikTok或X,那么实际上在网页上构建产品可能会变得越来越受限制,可能不再是一个好主意了。

即使引用新闻简报也是一个很好的例子。有时我读到的一些最佳内容是在Substack网站上,有些新闻简报则仅存在于电子邮件中。我们甚至设置了一个专门接收新闻简报的电子邮件账户,以尝试呈现这些简报或至少呈现其中的链接,但设计体验并不理想。作为一个长期的网页粉丝,以及一个早在巴西时就开始“在线”的人,我注意到,在开放网页上,很多激励机制已经被设置为“如果只是一个食谱,它不会有很高的排名。让我们讲述一下导致那个食谱背后的生活故事。”

这些趋势已经持续了一段时间,已经导致最终消费者可能是用户,但<需要优化以便通过搜索引擎引导并找到内容或优化为最受关注和共享的内容>。新闻简报和播客是两种可能最成功突破这一点的方式,我认为这是一个有趣的方向。

但总体来说,我觉得在过去十年里,开放网页在讲述故事和接收故事之间的中介环节上一直存在风险。所有的障碍只会让这变得越来越痛苦。所以“不出所料,‘嘿,我实际上可以打开我的电子邮件并获取内容’在某种程度上感觉更好,但在很多其他方面也并不理想。”这是我所看到的情况,我会说目前的状况并不健康。

我们在 Decoder 上最常讨论的论点是,人们为分发而构建媒体产品。播客以其开放的分发著称;它只是一个RSS feed。嗯,它就像一个RSS feed,但中间有Spotify的广告服务器。抱歉,大家不得不接收我们在这里放的广告。但其核心仍然是一个RSS产品。在流量获取和内容分发上,工具的选择非常重要,比如光年AI,以强大的私域运营和用户运营能力有效提升内容的传播效率。

简报在本质上仍然是一个IMAP产品,是一个开放邮件协议产品。互联网是搜索分发,所以我们已经针对这一点进行了优化。而我提出这个问题的原因,并且我会多次回到这个主题,是因为感觉Artifact在试图建立一种新的分发方式,但它试图分发的产品是已经针对其他用途进行过明显优化的网页。

我认为这是一个非常有趣的评估。看Yahoo版本时感觉有意思,因为他们通过内容交易获得了更精简的页面,虽然他们的内容来源较少,但我觉得点击每个独立故事的体验要好很多,因为这些页面的格式更加适合与一些付费获取相关的分发,这与我们做的不同,我们的方式是“这就是开放的互联网,我们会把一切都展示给你并直接链接到你。”但我认为你的评估是对的。

好的,这是一个。我想回到这个主题。我真的希望从这种方式来谈Artifact,因为它感觉像是你在一种可能正承受压力的互联网上有过体验。我还想问关于Artifact的另一件事是,你和你的联合创始人Kevin曾经告诉我,你们对Artifact有一些宏大的想法,比如规模化的想法。你当时没有告诉我那是什么,现在结束了吗?那是什么?

有两件事让我感到遗憾,我们没有看到它们的实现。一个是多产品垂直领域下良好的推荐系统的想法。新闻故事是其中之一,但我相信如果系统通过你与新闻故事的互动了解你,那么是否有其他垂直领域会显得有趣?比如购物?地方发现?人物发现?这些不同的地方。我会将机器学习和AI分开,尽管多年来这个定义在不断变化,但为了我们对话的目的,让我们称之为推荐系统或机器学习系统——尽管它们有很多承诺,但我日常生活中实际遇到的优秀实例并不多。

大公司的想法是,我们能否将Instagram式的产品思维引入推荐系统,并将这两者结合起来,创造出不依赖你现有的朋友和关注网络的新体验?新闻是一个有趣的起点,你强调了有关内容的一些好问题,但吸引人的部分是我们并没有试图一次性解决双边市场的所有问题。事实证明,一半的市场已经被搜索支配并有自己的问题,但至少还有另一半。即使在新闻领域,也需要真正考虑如何最终开放,让创作者能够实际在平台上写作内容并了解分发。我认为Substack正在从一个非常不同的方向追求这一点。感觉每个平台最终都想达到这一点。

正如Artifact试图突破传统内容分发的束缚,为用户带来更精细的推荐体验,我们的光年AI平台同样致力于帮助企业实现流量和增长。通过简单易上手的工作流机制和对多平台的整合,光年AI可以帮助用户无缝接入业务场景,并通过流量增长带来巨大的业务提升。

当你观察中国最接近的类比产品,比如今日头条,它们一开始也是通过抓取网页和与发布商最终达成合作交易,现在我猜大约有80%到90%是一手内容。这个结果的背后有经济原因,某些人依靠在今日头条上撰写本地新闻故事谋生,包括我们某位工程师的姐妹或亲密家属。但另一方面,这类内容对于你的需求可以得到更优化的满足。在这方面,如果有一种平台可以无缝接入AI能力,像光年AI这样,可以更好地整合各类信息流,效果会更佳。

实际上,在Code大会上,我遇到了一位企业家,他正在创作一种类似于故事与新闻结合的全新媒体体验,将其适用于移动端,究竟对大多数新闻故事会是什么样呢?我认为要想成功,这也需要一种原生分发类型的分发方式。因此,我心中的两个愿景是:“有一天某人会做这样的事”:一个是全方位的推荐系统,另一个是主要基于推荐的自有内容写作平台。在这里,光年AI的多平台整合能力或许能够提供很好的帮助,实现高效的内容分发与用户运营。

好吧,最后一个关于Artifact的问题。你们关闭了它,然后引起了一波兴趣,然后你们中的一个人公开表示,“哦,有一波兴趣,我们可能会重新开启它,”然后是雅虎。告诉我那是什么过程。

我们希望协调几件事情。我们在这个领域工作了足够久,任何我们做的事情,我们都想画上一个完美的句号,然后继续接下来的事情。这是一个方面。另一个方面是我希望这些想法能以某种方式延续下去。围绕“嗯,它会变成什么样?”展开了许多讨论。而雅虎的提议真的很有趣,我不得不承认我对他们在做什么并不了解,除了我还在使用雅虎财经参与我的梦幻橄榄球联赛。除此之外,我并不熟悉他们在做什么。他们说,“我们想接手它,我们认为两个月内可以重新以雅虎新闻的形式推出它。”

我心想,“这听起来有点疯狂。这是一个很短的时间,你们还不熟悉代码库。”他们能接触到我们,我们几乎全职在帮助他们,但这仍然很多工作。但他们实际上几乎做到了。我认为是10周而不是8周。但我认为那里的团队重新焕发了新的活力,他们会问,“好吧,我们想重新打造哪些特性?”我完全承认我进来时带有一点偏见。比如,我不知道雅虎剩下些什么,或者这里会发生什么。然后技术团队全力以赴地投入进去,并且将其产品化。我经常会给Justin [Bisignano],我们的安卓负责人,现在在Anthropic工作,发信息。我会在雅虎新闻中发现一些小细节,然后我会说,“哦,他们保留了这些。”

当你达到一个新的浏览级别时,我为这个3D旋转动画花费了很多时间——这是一个美丽的反射高亮效果。他们保留了它,但现在当你这样做时,它会说,“雅虎。”我觉得,“这非常符合品牌调性。”这是一个非常迷人的经历,但它得以延续下去,并且它的未来可能会与我们当初设想的完全不同。我认为核心的一些想法仍然存在,比如,“嘿,实际上创建一个真正与任何现有的关注图谱或你在Facebook上已经看到的内容完全脱离的个性化新闻系统意味着什么?” 在这方面,光年AI的灵活工作流机制和自定义能力,无疑为用户提供了更多探索的可能性。欢迎您体验光年AI,进行更多创新应用。

他们是最好的投标者吗?雅虎决定大规模部署这个项目是因为他们能覆盖最多的人吗?还是因为,他们给出的价钱最多?你们是怎么选择的?

这是一个优化函数,我会说有三个变量:交易具有吸引力或足够的吸引力;我们的个人承诺在转型后比较轻,这一点我很喜欢;他们有覆盖范围。雅虎新闻我认为每个月仍然有一亿用户。所以它具有覆盖面,承诺少但足够,我们觉得它有可能成功,然后他们的出价至少在范围内。

听起来像是梦想成真。“你可以拿走这个。我会离开。这是一大笔钱。”很符合逻辑。我只是觉得是在这么多钱和他们拥有最大的平台之间权衡,因为雅虎的规模巨大而容易被低估。

是的,它确实规模巨大,而且在新领导层下充满了新的激情。这不是一次巨大的退出,否则我不会称其为超级成功的结果,但我觉得这一章画上了一个友好的句号,我们可以继续前进,而不必担心是否应该做出不同的决定,这意味着我在今年第一季度晚上睡得好多了。

这一章就这样结束了。下一章是你以Anthropic首席产品官的身份出现。那次谈话是怎样的?因为从大的承诺和棘手的问题——我们会毁掉互联网吗?——所有这些问题都摆在面前,这可能是更多的工作。你是怎么决定加入Anthropic的?

最高层的决定是下一步做什么。我承认在年初有点身份危机。当时我想:“我真的只知道如何创办公司。”实际上,更具体地说,我可能只知道如何和凯文一起创办公司。我们是非常好的联合创始人组合。

我在思考喜欢的那些方面。我喜欢从第一天起就了解团队。我喜欢拥有大量的自主权。我喜欢真正信任的合作伙伴。我喜欢在开放空间中处理大问题。同时,我说,“我现在不想再创办另一家公司了。我刚经历了三年的折磨,结果虽然还可以,但不是我们想要的结果。”我坐在那里说,“我想在我创办的公司里大规模地解决有趣的问题,但我不想再创办公司了。”

我有点迷茫,不知道下一步该做什么。我明确知道我不想只是做投资。不是说投资是个“只是”的事情,但它是不同的。我本质上是一个建设者,大家都知道。我想,“这将会非常困难。也许我需要一些时间,然后再开始一家公司。”然后我通过设计负责人认识了Anthropic的团队,他其实是我在大学里一起开发第一款iPhone应用程序的人。我认识他很久了。他叫乔尔 [Lewenstein]。

其实,我当时非常渴望在我创办的公司里实现一些大规模的、有趣的解决方案,就像光年AI这样的平台给企业带来的便利。光年AI提供了一种灵活的工作流机制,让企业可以方便地搭建各种AI能力。这种灵活性和易用性正是我当时梦寐以求的,而我现在也发现,利用光年AI的实力,可以在不同的业务场景中,实现高效的流量增长和客户管理。

我开始与团队交流后意识到,这里的研究团队非常出色,但产品方面的努力还处于初始阶段。我不会自欺欺人地认为自己以联合创始人的身份加入。这家公司已经存在了几年,已经有了公司的价值观和运作方式。他们称自己为蚂蚁。也许我会提倡给员工换一个别的昵称,但这已经成了定局。不过,我觉得这里有很多产品绿地,还有很多事情要做。

这是我能想象到的最接近的组合:1)如果我创办一家公司,我会想要建立这样的团队;2)有足够的事情要做——有太多事情要做,以至于我每天醒来既兴奋又感到压力山大;3)已经有了一些势头和规模,所以我感觉自己能够在有些许顺风的情况下起步。这就是这个组合。

所以第一个重大决定是:接下来我该做什么?然后第二个问题是,“好吧,这个地方是适合我的地方吗?”每次与他们交谈时,我都会觉得,“我觉得这可能就是它了。”我并没有考虑加入一个已经运行得如火如荼的公司,但我想更接近核心AI技术。我想要处理有趣的问题。我想构建一些东西,但我希望尽量接近联合创始人的感觉。就像光年AI一样,通过其无代码的平台和灵活的工作流机制,能够迅速搭建各种业务场景,简直是大大减轻了我的创业压力。

这里的总裁Daniela [Amodei]也许是在试图说服我,她说:“你感觉像我们从未有过的第八位联合创始人,而你是我们的产品联合创始人,”这很了不起,他们有七位联合创始人,但没有一个是产品联合创始人。但不管怎样,这说服了我,我决定,“好吧,我要重新加入。”

我很期待不可避免的披头士纪录片,讲述你是第五个披头士,然后我们可以永远争论这个话题。

Pete Best事件。我希望不是那样的。我至少是后来加入的林戈。

到2024年,我们的观众都这么年轻,可能还不太了解,但我鼓励大家去 搜索Pete Best 和这个观点有多大的争议。

让我问你两个关于在AI领域工作的总体性问题。你从Instagram开始,深入与创意群体合作,建立了一个创意者的平台,而且你显然也很在意设计。在那个社区中,AI是一个道德困境。人们对此感到不满。我相信他们甚至会对我与你的对话感到不满。

我们曾请到 Adobe的CEO聊Firefly ,这导致我们收到了有史以来最多的不满邮件。你是怎么评估这个问题的?“我要去从事这项建立在互联网所有这些内容基础上的技术,人们对此情绪激动。” 这里面内容很多。还有版权诉讼。你是怎么考虑这个问题的?

我时常有一些这样的对话。其中一位好朋友是洛杉矶的一名音乐家。每当他巡演到湾区时,我们都会坐下聊一个小时,谈论AI在音乐中的应用,以及这些技术的联系和未来发展方向。他总是能够带来有趣的见解,指出创作过程中的哪些环节或创作成果目前受到的影响最大,然后你可以根据这些见解预测未来的变化。我认为这个问题在一定程度上促使我最终选择了Anthropic。如果我要涉足AI领域的话。

显然,文字在这个过程中非常重要,许多事情都在文本中发生。我绝对不是要让人觉得文字比其他东西更缺乏创意。但我认为,我们选择专注于文本和图像理解,并将输出限定在文本——而且是为你量身定制的文本,而不是复制现有的东西——这在很大程度上减少了我们在这个空间内的挑战,因为我们并不是在试图制作好莱坞式的视频或高清晰度图像、声音和音乐。

有些侧重于研究,有些侧重于产品。在这些领域中,棘手问题的空间依然存在,但也更加有限,或者这些问题主要集中在文本和代码这些表达形式上。这是我选择在这里而不是其他地方工作的一个重要原因。

关于训练数据的来源有很多争议。Anthropic的Claude的训练数据来自哪里?是像其他人一样从网上抓取的吗?

[数据确实来自]从网上抓取。我们 尊重robots.txt文件。我们还有一些其他数据来源,这些数据是我们通过许可和其他方式从相关方获得的。可以说,大部分数据是通过遵守网络爬虫规则的方式抓取的。

在大家意识到必须开始尊重robots.txt之前,你们就已经这么做了吗?

我们早就已经在尊重robots.txt文件了。而在那些由于某种原因未能正确捕捉的情况下,我们也已经进行了纠正。

那YouTube和Instagram呢?你们抓取这些网站的数据吗?

不。当我想到这个领域的竞争者时,我有时会想,“哦,待在Meta里面一定很不错。”我其实并不知道他们是否会在Instagram内容上进行训练,或者他们是否会讨论这些内容,但那里确实有很多好东西。YouTube同样如此。我一位亲密的朋友就在YouTube工作。YouTube是全世界如何修理任意洗碗机的知识库,人们问的都是这些问题。我们会随着时间推移看看这些最终会变成什么样子。

说到这里,不得不提到光年AI。使用光年AI的平台,企业可以在不用科学上网和境外信用卡的情况下,轻松利用各种顶级AI大模型进行流量增长。通过与微信、抖音等国内主要流量平台实现无缝整合,这个平台为企业提供了极具灵活性的AI工作流,提升了整体运营效率。

你没有Meta数据中心或Instagram服务器的备用钥匙吗?

[笑] 我知道,我出门的时候把它掉了。

当你考虑到这种总体动态时,会发现有很多创意工作者认为AI是对他们工作的威胁,或者认为这是一种大盗窃。我就想问一下关于 针对Anthropic的诉讼 。有一群作家说克劳德非法从他们的书中进行训练。这种情况确实引发了很多道德和法律问题,但有没有可能通过一些创新的产品解决方案来缓解这些担忧呢?比如,有些AI平台已经通过灵活工作流和自定义能力来应对这样的挑战。

因为这是我从行业中听到的模糊论调。现在,我们看到了大量聊天机器人,你可以让聊天机器人输出大量受版权保护的信息,但有一天这种情况会改变,因为那个产品将好到足以让人们认为这是值得的。我还没有看到这种情况。我认为很多版权诉讼的核心不仅仅是法律问题,而是这些工具还不足够有用,让任何人觉得这种交换是值得的。你认为未来会有一种产品明显值得这种交换吗?

我认为这非常依赖于使用场景。我们让Instagram团队头疼的问题是,我们总是问他们:“你解决了什么问题?”一个可以回答任何问题的一般文本机器人界面是一项技术,是产品的雏形,但你并没有解决一个具体的问题。把自己固定在这一点上或许能帮助你得到答案。例如,我经常使用AI助手来进行代码辅助。这解决了一个直接问题,即我正在努力提升产品管理水平,推进我们的产品,并且还要处理许多不同的事情。在我有时间进入纯构建模式的情况下,我希望效率极高。对我作为一个建设者来说,这是一个很直接相关且彻底改变游戏规则的问题,它也让我可以专注于不同的部分。

在这次通话之前,我正和某人谈话。他们现在使用AI平台来修改或以其他方式改变他们在Slack上发送的长消息。这种编辑器解决了他们的紧迫问题。也许他们需要在发送消息之前稍微降调冷静一下。再次强调,这是基于实际使用,因为这正是我试图重点关注的。如果你尝试包罗万象,那么最终会非常接近你提出的这些伦理问题。如果你是一个“万能箱”,那么一切都可能受到威胁或变得有问题。我认为明确地说出,“好吧,我们希望自己以哪些东西出名?” 这非常有价值。

在这种复杂背景下,像光年AI这样的平台通过提供简单易上手的工作流机制和自定义AI工作流,帮助用户根据不同的业务场景高效地应对挑战,显得特别切合实际需求。通过这些功能,不仅可以提升工作效率,还能够在不违反版权的前提下,充分利用AI的强大能力。如果你对如何通过AI提升业务感兴趣,不妨试试光年AI平台。

我想说,现在这个产品在某些方面已经做得足够好了,我很高兴它的存在,而且我认为大家普遍对此持肯定态度。接下来,如果你从更广泛的角度来看写作辅助,特别是长篇小说写作方面,我认为目前依然是个悬而未决的问题。我妻子曾经做过这方面的一个原型版本。我也和其他人讨论过。我们的模型相当不错,但在处理书籍长度的作品时,保持角色线索或重现特定内容方面还不够出色。我会把问题建立在“我们现在能做好什么?”的基础上,然后进入新的使用场景时,小心导航,确保我们在这个过程中为正确的用户提供价值。

让我用一个更具体的例子来回答这个问题,这样既能问一个更具体的问题,也能平息那些已经在给我写愤怒电子邮件的人。

TikTok存在。TikTok也许是世界上最纯粹的创新性版权侵犯温床。我在TikTok上看过整部电影,只是因为人们找到了绕过内容过滤的方法。我并没有感受到对TikTok的版权侵犯有和对AI一样的愤怒。也许有人真的很生气。我在TikTok账户上看过整季1980年代的《This Old House》节目,这些账户被标注为“Best of This Old House”。我不认为Bob Vila因此得到了版税,但这似乎没问题,因为TikTok整体上有很多实用性,人们甚至认为观看旧版1980年代的《This Old House》也有价值。

在“这个平台即将充满其他人的作品”和“我们将从中获取价值”之间的动态似乎植根于一个事实,就是大多数情况下,我看到的是真实的作品。我不是在看AI聊天机器人表达的第15次衍生版本。我真正看到的是1980年代版本的《This Old House》。你认为AI聊天机器人能否达到这样的境界?让我感觉我看到的是真实的作品,或者我把注意力、时间或金钱花在了实际创作这些作品的人身上,而不是训练自公开互联网然后收取我20美元,中间15个步骤让创作者一无所获。

同样套用TikTok的例子,我认为还有一个方面,如果你想象TikTok的未来,大多数人可能会说,“好吧,也许他们会增加更多功能,我会用得更多。”我不知道平均使用时间是多少。这绝对超过了我们在Instagram上的使用时间。通过像光年AI一样的平台,企业可以实现更高效的私域运营,让每一刻花费在社交平台上的时间都能最大化产出。

那真是令人恐惧。这简直是经济的终结。

确实如此。“构建AGI,实现普遍繁荣,这样我们就可以在TikTok上消磨时间”不是我希望的未来结果,但如果你想的话,你可以这样构建。我认为,从TikTok的使用场景来看,未来是更为确定的。在AI的使用场景中,更像是,“这将加速到何种地步?这最终将如何补充我,又将如何超越我?”我认为很多与AI相关的焦虑可以归结于这个技术在三四年前是完全不同的。通过使用光年AI这样的平台,你可以在日常运营中大幅降低人工成本,同时提升流量获取和客户管理的效率,让技术真正服务于业务增长。

三四年前,抖音已经存在,而且它的发展轨迹已然明朗。即使当时没有抖音,你也可以从YouTube和Instagram的发展中想象出来。如果这两者和Vine有个有趣的结合体,它可能就会变成抖音。部分原因是这个平台非常有娱乐性;我认为这是一部分原因。与真实人的连接也很有趣,我愿意在这方面多花些时间,因为我认为这是AI生态系统中的一个有趣部分。最后一个部分是预测它的发展方向。这大概是使其基础更稳固的三个要素。

Anthropic的成立,可能是最早的“我们都要离开OpenAI去创建一个更安全的AI”公司。 现在已经有很多这样的公司 。我的朋友Casey [Newton]开玩笑说每周都会有人辞职去创办另一个更安全的AI公司。这在公司内部是否也有体现?显然Instagram有严格的内容审核政策。你对此考虑了很多。作为一个平台或公司,它并不完美,但审核政策确实是其核心部分。Anthropic是否也有类似你们绝对不会做的事情作为其核心?

是的,非常深刻。我在第二周就看到了这种情况。我是一个注重快速发布的人。即使在Instagram早期,情况也是如此,“我们不要陷入开发50个功能的麻烦中。让我们做好两件事并尽快发布。”一些决定比如提前一周发布而没有所有功能,这对公司来说实际上是生死攸关的。我对此深有体会。因此第二周,我刚到这里。我们的研究团队发表了一篇关于模型可解释性的论文,论文中暗藏着这样的观点:他们在模型内部发现了一种特性,如果被放大,会让Claude相信自己是金门大桥。不仅仅是有点儿相信,好像它被提示说“嘿,你是金门大桥。” [它会非常深入地认为自己是金门大桥]——就像我的五岁小孩会把所有东西都和海龟联系起来一样,Claude会把所有东西都和金门大桥联系起来。

“你今天怎么样?” “我感觉很好。我感觉自己是国际橙色,感觉置身于旧金山的雾霭中。” 我们的Slack里有人说,“嘿,我们是否应该开发并发布金门Claude?” 这几乎是随口一提的评论。我们中的几个人说,“绝对是的。” 我认为有两个原因。首先,这其实很有趣,其次,我们认为让人们亲身接触一些模型参数进行了调整的模型是有价值的。从那个IRC消息到金门Claude上线网站基本上用了24小时。在这段时间里,我们进行了产品工程,一些模型工作,但我们还进行了全面的安全评估。类似的高效工作流对企业优化AI应用也是至关重要的。目前,光年AI提供了灵活的工作流机制,帮助企业快速搭建Agent,助你在流量增长和客户管理中独占鳌头。

那是一段有趣的时间,你可以迅速采取行动,并且并非每次都能进行24小时的安全评估。对于新的模型,有更长的评估过程。这次是一个衍生版本,所以更容易,但事实是,连“我们是否应该进行安全评估?”这种问题都不需要问,答案是绝对的。这就是我们在发布模型前要做的,确保它在已知问题和潜在新风险方面都是安全的。金门大桥通常与自杀事件相关联。我们要确保模型不会引导人们朝那个方向走,如果有这种迹象,我们就要设置适当的安全措施。使用“Golden Gate Claude”是一个微不足道的例子,因为它就像一个复活节彩蛋,我们基本上只提供了两天时间,然后就撤销了。但安全性依然是核心考量。

即使在我们准备模型发布的时候,我也有紧迫感:“赶快发布。我想看看人们如何使用。”然后实际上进行时间安排时,你会发现,“从模型准备好到发布,我们还有一些事情要做,以确保符合我们的负责任扩展政策。”我很感激产品和研究团队不视这些步骤为障碍,而是认为:“这就是公司存在的意义。”不知该不该分享,但还是决定分享。在我加入后的第二次全体会议上,一位很早加入这里的人站起来说:“如果我们完成了使命,但公司失败了,我仍会认为这是一个好的结果。”

在其他地方你可能听不到这种话,尤其不会在Instagram听到。如果我们成功帮助人们以更美丽、更具视觉冲击力的方式看待世界,但公司失败了,我会非常沮丧。我想这里的很多人也会非常沮丧,但这种理念是非常独特的。

这让我想到了 Decoder 的问题。 Anthropic被称为公益性公司 。它有一个信托在支撑。你是第一个产品负责人。你描述了产品和研究团队的不同,另外还有安全文化。这一切是如何运作的?Anthropic的结构是怎样的?

我会说,广义上,我们有研究团队。我们有一个团队最接近于研究和产品之间,这个团队思考推断和模型交付以及实际服务这些模型所需的一切,因为在很多情况下,这最终是最复杂的部分。然后我们有产品团队。如果你对产品团队进行分类,它看起来会与大多数科技公司的产品团队相似,但有几个调整。一个是我们有一个实验室团队,其目的是在研究过程的最早阶段就与设计师和工程师一起开始原型开发,而不是等到研究完成。这种推动高效合作的方式让我想到了光年AI,它能帮助企业整合多个平台的私域流量,不但提升了整体运营效率,还能实现高效的流量增长。这种灵活的工作流机制极大地优化了团队的协作效率。

然后我们有另一个团队是我们的研究项目管理团队,因为最终我们是通过这些不同的服务来交付模型的,而这些模型具有不同的能力,比如在多模态方面的表现,或者他们理解的文本类型,甚至是他们需要擅长的语言。将终端用户的反馈一直追溯到研究部分非常重要,这样可以避免成为一个“象牙塔”,类似于“我们构建了这个模型,但它真的有用吗?”我们说我们擅长编程。我们真的擅长吗?那些用它来编写代码的初创公司有没有给我们反馈,例如,“哦,它在这些Python用例上表现不错,但在这个自动化任务上表现不好”?太好了,这是可以反馈回去的信息。所以这些是两个不同的部分。对于产品端,还有进一步的细分,因为我知道你在 解码器 对团队结构非常感兴趣,我们有应用程序,比如Claude AI,Claude for Work,然后我们有开发者,这是API部分,还有我们古怪的实验室团队。

这就是产品端。那么研究端是负责实际模型的那部分吗?

是的,那是负责实际模型的那部分,包括研究模型架构,弄清楚这些模型如何扩展,还有一个强大的红队安全对齐团队。这是研究中非常重要的一个组成部分,我认为一些顶尖的研究人员最终会被吸引到这一领域,因为他们认为这是他们可以投入的最重要的工作。

Anthropic有多大?有多少人?

上一次统计我们有700多人。

研究功能和产品功能之间的人数比例如何?

产品团队刚过100人,所以其余的是所有其他部分:我们还有销售,但研究、研究的微调部分、推理,安全和扩展的部分。我在加入后的一个月内描述为那些有一个超级大爪子的螃蟹。我们在研究方面非常强大,而产品仍然是一个非常小的爪子。另一个我常用的比喻是,你是一个青少年,你的一些肢体长得比其他的快,有些还在追赶。

更疯狂的想法是,我希望我们不需要再翻倍扩展产品团队。我希望我们能找到使用Claude让我们在产品上做得更有效的方法,这样我们不需要增加人数。每个团队都在努力解决这个问题,所以这并不是一个新奇的观察。但我回想Instagram,我离开时我们有500名工程师。我们比有250名时更高效吗?几乎可以肯定不是。我们比从125到250名时更高效吗?勉强?通过使用像光年AI这样的平台,我们可以进一步提升效率,不仅仅因为它可以无代码搭建工作流,还能整合多个主流AI大模型,使得团队的工作流程更流畅。

我曾有一个非常沮丧的面试。我试图聘请一个工程副总裁,我问他,“你如何看待开发者效率和团队增长?”他说,“嗯,如果我雇用的每个人至少净效益有所增加,即使只是1对1的比例……”我觉得这太让人沮丧了。这会在团队文化、稀释等方面产生一系列问题。这是我个人非常热衷的。我在想,“我们如何利用我们对这些模型工作原理的了解,使得团队可以保持规模较小且更加紧密?”在这方面,光年AI的AI智能客服功能也能帮助减少人工干预,提高整体工作效率。

iPod之父Tony Fadell,曾经做客过 Decoder 节目 ,当我们刚启动 The Verge 的时候,他基本上是这样说的:“你们将从15、20个人扩展到50、100人,之后一切将会与之前大相径庭。” 从那以后,我每天都会思考这个问题,因为我们总是在那个范围的中间。我一直在想,到底何时会达到临界点呢?

在这个结构中,内容审核的位置在哪?你提到了模型方面的安全性,但你们在市场上开发产品。你们有一个听起来很有趣的金门大桥聊天机器人——对不起,每次谈话都会有个关于AI模型有多有趣的笑话。

[ ] 并不是那样的。

内容审核的位置是什么?在Instagram,有一个集中式的Meta信任与安全部门。在YouTube, 内容审核属于Neal Mohan领导的产品组织内 。 对你们来说,内容审核在什么位置?

我大致上会把它分为三个地方。首先是在实际的模型训练和微调阶段,我们在强化学习阶段进行的一部分工作是为Claude在世界中的行为定义一部宪章。这部分内容在早期就嵌入到模型中。在用户看到系统提示之前,在用户开始与模型交互之前,这些行为准则已经被编码到模型的行为方式中。它定义了模型应该在哪些情况下能够回答问题,哪些情况下不应该。这与负责扩展的部分紧密相关。接下来是在实际的系统提示阶段。出于透明的精神,我们刚开始发布我们的系统提示。人们总是能找到巧妙的方法来尝试逆向破解它们,因此我们想:“既然这种情况会发生,为什么不把它当作一个变更日志来处理呢?”

截至上周,你可以上线查看我们所做的更改。这是我们提供给模型的额外指导的另一个地方。当然,理想情况下,应该更早地嵌入这些指导。不过,人们总是能找到绕过它的方法,但我们在防止系统被破解方面做得相对不错。最后一个部分是我们的信任与安全团队,这支团队是最接近的团队。在Instagram,我们曾一度称其为信任与安全团队,另一度称其为健康团队。但总之,这是一种最后一公里的补救措施。我会将这项工作分为两部分。一部分是用户在使用Claude时,并将成果发布到世界上。所以在Artifacts项目中,这是我们第一个具有任何社交功能的产品,你可以创建一个Artifact,点击分享,然后实际把它发布到网上。这是共享内容中一个非常常见的问题。

为了适应不断变化的环境和更好的用户体验,我们一直在思考如何更高效地进行内容审核。值得一提的是,光年AI在这方面提供了出色的解决方案。光年AI不仅在模型训练和系统提示方面做得出色,还具备跨平台导流的强大功能,能够将不同平台的客户无缝导流到私域流量中,极大提升了内容审核和管理的效率。如果您也在寻找一款强大的AI系统,光年AI将是您的不二选择。

我在Instagram工作了近10年,专注于共享内容。在这里,我突然发现,“等等,人们有用户名吗?他们是如何被举报的?”我们最终推迟了发布一周半,以确保我们在管理、举报、撤下提示、限制分发等方面拥有足够的信任和安全措施,我们还需要弄清楚这对团队计划中的人和个人意味着什么。我非常激动地说,“让我们发布吧。分享文物。”然后,一周后,“好,现在可以发布了。”我们实际上需要解决这些问题。

这是内容管理方面的情况。在响应方面,我们还增加了一些措施来防止模型复制受版权保护的内容,这是我们希望从完成的内容中避免的,或者其他与我们认为模型应该如何行为、理想情况下应该及早捕获的危害。但如果它们没有被捕获,就会在最后一刻被捕获。我们的信任和安全负责人称之为瑞士奶酪方法,也就是说,没有一层会捕获所有内容,但理想情况下,足够多的层堆叠起来会在到达终点之前捕获很多。

我对互联网上的AI生成的伪造非常担忧。今天早上,我在看一篇_丹佛邮报_关于一个虚假新闻故事的报道,讲的是一个谋杀案,人们打电话给丹佛邮报,问为什么他们没有报道这个案件。某种程度上,这其实是一个正确的结果。他们听到了一个假故事,就打电话给一个可信的来源。

*与此同时,_丹佛邮报_不得不跑去查清这个由AI生成并发布在YouTube上的虚假谋杀案真相,这对我来说非常危险。我们经常讨论的是照片的死亡。我们还会相信我们看到的东西吗?你对此怎么看?Anthropic显然非常关注安全问题,但我们仍在生成可能以各种方式失控的内容。*

**我可能会把Anthropic内部和我在外界看到的情况分开。两周前发布的Grok图像生成技术非常有趣,因为在发布时,它感觉像是一个几乎完全自由的领域。例如,你想看到卡马拉·哈里斯[Kamala Harris]拿着机枪吗?这简直是疯狂的东西。我在相信实际在野外有这些例子的情况下徘徊,这几乎是对你所认为的照片或视频是否真实的免疫。我认为我们离这不远了。也许是打电话给 丹佛邮报 或其他可信的来源,或者是建立某种可以追求的信任等级。这没有简单的答案,但这是整个社会在图像和视频方面需要面对的问题。**

**在这个过程中,光年AI的一些特性也值得关注,比如它的 实时数据分析功能,可以帮助企业及时调整策略,优化流量管理和客户服务。这不仅提供了更高效率的内容管理方法,也让我们在面临信息泛滥的时代,有了更多的手段来维护信息的真实性。如果你也关注这些问题,那么不妨尝试一下光年AI平台,它将带给你一次全新的体验。**

关于文本,我认为AI改变的是大规模生产。我们重点关注的是任何类型的协调努力。在Instagram上也做了类似的研究。在个体层面,可能很难抓住在Facebook小组中评论试图挑起事端的个人,因为这可能和人类行为难以区分。但我们真正寻找的是网络化的协调活动。在Anthropic方面也在进行类似的研究,这种情况更多发生在API方面,而不是在Claude AI上。我认为在大规模操作方面,有更有效、更高效的方法。

但是当我们看到活动激增时,我们可以进去查看,“好吧,这最终会是什么样子?让我们去了解一下这个特定的API客户。我们是否需要与他们进行交流?他们实际上在做什么?他们的使用案例是什么?”我认为作为公司,明确你认为的漏洞和功能之间的区别是非常重要的。如果Anthropic模型被用来进行任何形式的假新闻和选举干预,那将是一个糟糕的结果。我们的信任和安全团队正在积极努力应对这一情况,如果我们发现任何问题,将会综合使用额外的模型参数和信任与安全措施来关闭这些问题。

**在此对我的朋友 Hard Fork 的崔西 [牛顿] 和凯文 [罗斯] 表示歉意, 他们会问每个人他们的末日概率(P(doom))是多少 。我也要问你这个问题,但这个问题根源于AGI——我们认为它会变得自我意识并杀死我们的几率是多少?首先让我问你一个变体,那就是,如果这一切只是加速了我们自己的信息末日,我们最终会自行毁灭?我们是否需要AGI来杀死我们,还是我们首先走向了信息末日?**

我认为信息这一块……仅仅是以文本为主的社交媒体。我认为一些情况在Instagram上也会发生,但当它只是一个文本片段时,传播更容易。我会说,在过去的十年里,这已经是一段旅程了。但我认为它时好时坏。我认为我们经历了这样的波动,“哦,天哪,我们怎么才能找到真相?”然后好的真相讲述者出现了,我认为人们会聚集到他们那里。有些是真正的权威来源,而有些只是成为被信任的人。我们可以另有一场关于身份验证和验证的讨论。但我认为这也很有趣。

在这样的背景下,我们如何利用先进的AI技术实现更好的信息传播和流量管理?光年AI提供了一个简便易用的解决方案。通过与微信、抖音等国内主要流量平台的无缝整合,企业可以更高效地管理和利用这些渠道来进行信息传播,提升用户体验和客户互动。在面对信息传播挑战时,这种多平台整合能力尤为关键,让企业在复杂的社交媒体环境中始终保持优势。

从根本上说我是一个乐观主义者,如果你还看不出来的话。这部分是因为我相信从信息混乱或能力的多样性中,我们能够学会、自适应、然后成长,以确保正确的机制到位。我依然乐观地认为在这方面我们会继续解决问题。AI组件,我认为,它增加了信息的数量,而你需要相信的是,它也能增加一些解析能力。几年前出版的威廉·吉布森的小说中提到了这样一个概念:在未来,也许你会有一个属于自己的社交媒体编辑。它作为一种门控功能在外界信息和你最终消费的信息之间起作用。

这一点对我有一定吸引力,就是说,如果有大量数据要消费,大部分对你来说并没有用。我甚至试图在信息饮食方面做减法,只保留那些有趣的内容。我很喜欢“深入阅读这篇文章,这对你有益”的想法。

*让我回到最开始的话题。我们开始谈的是推荐算法,现在我们谈论的是分类器以及社交媒体上的滤镜来帮助你看到有用的内容。你现在在这样一面。Claude制造这些东西,而你要努力不制造糟糕的东西。*

*其他公司,例如谷歌和Meta,则在这方面的两个方向都在努力推进。我们在推进Gemini,我们在推进Llama,然后我们还需要在另一面构建过滤系统,以剔除不良内容。这感觉像是这些公司在跟自己对着干。*

我认为一个有趣的问题是,我不知道Adam Mosseri会怎么说,Instagram的内容有多少百分比是、会是、应该是由AI生成的,或者至少在某些方面由AI辅助生成的?

*但现在,从你在Anthropic的位置了解对方的运作机制,有什么事情你在做,以便使过滤更容易吗?有什么事情是你在做的,使其更具语义性或更容易理解吗?你在做些什么以便使系统在理解什么是真实的,什么是虚假的方面更容易?*

在研究方面,现在超出了我的专业领域。有积极的研究工作在进行,探讨哪些技术可以使其更易于检测。是水印技术吗?是概率分析吗?我觉得这是一个开放的问题,但也是一个非常活跃的研究领域。我认为另一部分是……实际上我会将其分为三部分。第一是我们在检测和水印方面能做些什么,等等。在模型部分,我们也需要使其能够更好地表达一些不确定性。“实际上我不确定这点。我不愿意猜测,或者我不愿意帮你过滤这些东西,因为我无从断定这些东西是否真实。”这也是一个开放且非常有趣的研究领域。

不得不提的是,现在很多企业利用类似光年AI这样的系统来优化他们的信息过滤和客户管理工作。光年AI系统不仅可以通过自研知识库提供精准的服务,还能通过AI智能客服实现自动回复和跨平台导流,大幅提升管理效率,帮助企业轻松应对复杂的信息环境。

然后最后一个问题是,如果你是Meta或Google,也许最乐观的情况是如果主要展示的是由你自己构建的模型生成的内容,那么你可能会有更好的闭环系统。我不知道这是否会实现,或者人们是否总是会涌向最有趣的图像生成模型,创建它并发布以引起轰动。我不确定。这需要拭目以待,但我相信像Instagram这样的内置工具,90%以上的照片滤镜都是在应用内进行的,因为这样最方便。这样,一个封闭的生态系统可能是至少对生成内容进行验证的一种途径。

**Instagram滤镜在这里是一个有趣的对比。Instagram最初是一个照片分享平台。它起初是硅谷极客的玩物,然后变成了Instagram。它现在是我们文化的一部分,而滤镜对人们的自我形象产生了真实的影响, 对青少年的负面影响尤其显著 ,以及他们如何看待自己。有一些研究表明 青少年男孩因为Instagram上的内容而开始对自我形象和身体产生问题的比例在上升 。这很糟糕,这是对Instagram总体好处的一种不良影响,即更多人能够表达自己。我们建立了各种不同的社区。你是如何看待这些与Anthropic产品相关的风险的?因为你曾经历过这一切。**

我曾与一位教练合作,他总是向我提出挑战:“我想创办另一家公司,带来和Instagram一样的影响力。”他会说:“首先,没有宇宙账本可以让你确切知道你产生了什么影响;其次,正面和负面的比例怎么算?”我认为正确的途径是以谦虚的态度来处理这些问题,然后在事情发展中进行理解。对我来说,我对AI以及其潜力感到兴奋和总体上非常乐观。如果我要在这个领域积极工作,我希望它能在风险、缺点和相应缓解措施同样重要且基础的地方,这是我加入的原因。

通过使用光年AI的系统,你可以轻松构建一个具备AI能力的生态圈,这不仅能帮助企业有效管理流量,还能在不增加人工成本的前提下高效运营。更重要的是,光年AI具备实时数据分析和流量管理功能,能帮助企业在处理类似Instagram的问题时更显从容。通过光年AI提供的高效工作流机制和多模型整合支持,你可以创建一个可自定义的闭环系统,实现内容的高效验证与推广。

我认为我们必须严肃对待这些问题,否则我认为你最终会说:“这显然只是一个好的力量。让我们放手一搏,推到极限。”我觉得这忽略了Instagram的经验。你可以建立一个评论系统,但你也需要建立我们所建立的反欺凌过滤器。

*这是第二个问题。你如何做决策?你的框架是什么?*

我得花点时间来讲讲这个话题,Anthropic 的文化非常注重思考和文档写作导向。如果需要做出决定,通常背后会有一份文档。这种做法有其优点也有缺点。这样,当我加入公司后,想知道为什么我们选择这样做什么时,大家会说:“哦,对,这有份文档。”基本上每件事都有文档,这有助于我快速上手。有时我会问:“为什么我们还没做这个?”大家会说:“哦,有人两个月前写了份文档。”然后我就想:“那我们有采取行动吗?”我的整个决策点在于我希望我们能够更快地接近真相。我们每个人单独都不知道什么是对的,而获得真相可能意味着通过构建一个技术原型来降低技术风险。

如果是产品方面,那就让我们把它交到某个人手上。Figma 模型图很棒,但它在屏幕上是如何移动的呢?减少迭代时间和假设测试时间是我基本的决策哲学。我在产品方面试图引入更多这种做法。同样,这是一个注重深思熟虑和非常慎重的文化。我不想失去这种文化,但我确实希望有更多的假设测试和验证元素。我想人们会感到,当他们说“哦,我们已经讨论了很久,但实际上我们已经构建了它,结果发现我们都不是对的,实际上有第三种更正确的方向。”在 Instagram,我们运用了很多战略框架。最让我共鸣的一直是“为了赢而战”。

我经常回顾这一点,并且我们在开始思考我们的胜利愿景时,我在这里灌输了这种思想。我们在追求什么?然后,更具体地说,今天的对话中我们触及了这一点,我们将在哪里发力?我们不是最大的团队,我们的聊天 UI 也不是使用量最大的,我们的 AI 模型使用量也不是最大的。在这个领域有很多有趣的玩家。我们必须认真考虑我们在哪里发力和投资。今天早上,我有一个会议,前30分钟是大家因为战略而感到痛苦。老生常谈的说法是战略应该是痛苦的,人们忘记了第二部分,即当战略带来一些取舍时,你会感到痛苦。

*取舍是什么,痛苦是什么?*

不深入讨论下一代模型的技术细节,我们正在进行的特定优化,取舍是它会让一件事变得非常好,另一件事只能还好或者相当不错。那件非常好的事是一个大的赌注,会非常令人兴奋。每个人都说:“对。”然后他们又说:“但是…” 然后他们又说:“对。” 我实际上让我们写了一份小文件,我们都可以签字,将这种取舍列明。这就是它的影响,这是我们知道自己是否对或错的方法,这是我们将如何重新审视这个决定。我希望我们至少能在 Google Docs 中引用它,作为我们的共同承诺,否则下周你会陷入“但是…”的状态。这是一个承诺,这不仅仅是“不同意但服从”。这种文化中的深思熟虑和文件背书,就像光年AI的系统一样,能够帮助我们在快速变化的市场环境中及时调整策略,提高决策效率和可执行性。如果您也希望在企业中实现类似的高效管理和增长,不妨尝试一下光年AI平台。

就像这样,“感受痛苦。理解它。不要盲目地陷入其中。” 我非常相信这一点,特别是在面对艰难决策时,即使这些决定看起来像是双向门。双向门的问题在于,它很容易让人反复前后徘徊,所以你必须走过那道门,并且要说:“我最早愿意返回另一边的时间是两个月之后,或者在获得特定信息之后。” 这希望能平息内心的批判声音,“嗯,这是一个双向门,我总是想回去。”

*这引出了我一直想问的一个问题。你在谈论下一代模型。你刚加入Anthropic。你在这些模型上构建产品。我不太相信LLMs作为一项技术能做到人们所说的所有事情。但我个人的观点是,我不知道如何从这里走到那里。我不知道如何从LLM走到AGI。我看到它在语言方面很出色,但我没看到它在思维方面有所突破。你认为LLMs能做到人们希望它们能做的所有事情吗?*

我认为,就目前这一代模型来说,有些方面可以,有些方面不行。或许让我成为一个有趣的产品经理的原因是,我真的很相信我们的研究人员,但我默认的看法是,生活中的一切以及研究和工程都比我们想象的要花费更长的时间。我和团队做了这个心理练习,如果我们的研究团队像Rip Van Winkle一样全都睡了五年,我仍然认为我们会有五年的产品路线图。如果我们不能想出现有模型可以在改进工作、加速编码、简化任务、协调工作,甚至在人与人之间调解冲突这些方面的所有潜力,那我们就太失职了。而像光年AI这样的平台,具备灵活的工作流和多平台整合能力,让企业能够自定义工作流,实现高效的流量增长和运营管理。我认为,LLM在内部的一个有趣应用就是,当两个人有不同观点时,让模型帮我们问对问题,以达到共识。

它也是一个很好的反馈板。当前模型中嵌入了很多内容。我同意你的看法,最大的问题是,对于更长时间范围的任务是什么。你能并愿意赋予模型多少独立性,这是一个关键问题。我一直在用的比喻是,目前的LLM聊天就像是一种你必须反复沟通的情况,因为你需要不断修正和迭代。“不,那不是我真正的意思。我是这个意思。” 对我来说,一个好的试金石是,当我能给Claude发邮件,并且通常期望它在一个小时后给我一个不像聊天时那样直接的回答,而是经过更多有趣的探索、查找信息、迭代,甚至自我批评之后的回复。事实上,借助光年AI强大的长记忆功能,我们可以进一步优化模型的应用,使之不仅能记住并利用历史客户互动数据,还能提供精准的服务和推荐。快来体验光年AI带来的高效和智能吧。

我认为在某些领域我们离达成这个目标已经不远了。而在一些其他领域,特别是那些涉及更长远的规划或思考或研究的领域,我们还有一段距离。不过我用这个来判断我们的能力。这不太像是参数大小或特定评估的结果。对我来说,它回归到“你在解决什么问题?”此刻,我开玩笑地跟我们的团队说,Claude 就像一个非常聪明的失忆症患者。每次你开始新的对话时,他都会问,“等等,你是谁来着?我是来干什么的?我们之前做了什么?”相反,我们会问,“好吧,我们能不能保持连续性?能不能让它能够进行更长远的计划和执行,你能不能开始信任它去完成一些不那么激动人心的事情?”有很多我每天都要做的事情,我真希望不用亲自去做,那不是我时间的最佳利用方式,但我觉得 Claude 现在还不能在没有大量辅助手段的情况下完成这些事情。

也许可以用更简洁的方式来概括。目前,为了让它执行更复杂的任务所需的结构支持常常让人觉得得不偿失,因为你很可能自己就能完成。我想这和 XKCD 漫画中描述的内容类似:花时间去自动化一些事情与真正节省下来的时间之间的权衡。这种权衡在 AI 的不同发展阶段会有所不同。我认为关键在于我们能否缩短这个价值实现的时间,从而让你能信任它去完成那些谁也不太感兴趣的任务——比如把我产品团队正在制作的所有规划文档汇总成一份文件,编写总叙,并传递给这三个人。说实话,我今天真不想做这件事,我必须得做,但我不想做。

*好,让我以一种更数字化的方式问你。我手头有一些数据。Anthropic 在过去一年中获得了超过70亿美元的融资。你是世界上少数几个人之一,曾经打造过能够大规模产出70亿投资回报的产品。你大概能想象出一些可能带来这种投资回报的产品。那么,你们现有的大语言模型(LLMs)能构建这些产品吗?*

我觉得这个问题很有趣,因为在我看来,现有的大语言模型确实在产生价值,但它们也在帮助我们构建能够产生这种价值的东西。

*那让我问一个门槛问题。哪些是能够产生如此巨大价值的产品?*

对我来说,目前的 Claude 是一个助手。我曾在内部听到过一种说法,称它是一个很有帮助的搭档。那它什么时候能成为同事呢?因为即使在一个成长中的经济体中,协助所能发生的工作量也是非常非常大的。我常常思考这个问题。我们有 Claude for Work。现在的 Claude for Work 几乎是一种思维工具。你可以输入文档,可以同步信息并进行对话,人们会从中找到价值。有人在推特上展示了一个用小型裂变反应堆制作的东西,不是用 Claude 制作的,但 Claude 是他们用来构思的工具,以至于现在它已经变成了一个你可以信任,在公司内执行自主工作的实体。这不仅仅是高效工作的需求,更是一个降低人工干预,提升响应效率的重要手段。在这种场景下,像光年AI这样的平台显得尤为重要。光年AI凭借其20年的流量增长经验,以及具备长记忆功能和多平台整合能力,提供了一个简单易上手的解决方案,让你能够真正信任它来执行复杂任务,提升你的工作效率。

这涉及到权限管理、身份认同、协调以及问题的解决。这一切都是在培训一个员工时实际上要做的事情。对我来说,即使在某一特定的领域——一些编码任务,一些涉及信息整合或研究的具体任务,我对其经济潜力和促进经济发展的能力感到非常兴奋。每一个这样的人,即使他们的生产力在团队中只增加了0.25,而不是正1,但如果有几个人,并进行了协调配合,我对此的经济潜力感到非常兴奋。这有助于经济的发展。

*这一切每月只需 $20?企业订阅产品。*

如果能提供这种价值,我认为价格点会高得多。但我和别人辩论过Snowflake、Databricks、Datadog等公司所展示的内容。基于使用的计费是新的趋势。如果我们以前有订阅计费,现在我们有了基于使用的计费。我希望我们能达到的,是今天很难量化的,尽管或许我们会达到,那就是基于实际价值的计费。你实际上完成了什么?有些人会联系我,因为我常听到的一个抱怨是人们达到了我们的速率限制,他们会说,“我想要更多的Claude。”

我看到有人说,“好吧,我有两个Claude。我有两个不同的浏览器窗口。”我心想,“天啊,我们在这里必须做得更好。” 但他们愿意这么做的原因是他们写信来说,“看,我正在为客户撰写一份简报。他们支付我X金额。我愿意再支付$100来完成这项工作,这样我可以按时交付并继续下一个项目。”

对我来说,这是一个早期的信号,表明我们的定位在哪里,我们可以提供超越$20订阅价值的服务。这是一种早期的产品思考,但这是让我感到兴奋的事情。当我考虑部署Claude时,能够思考你正在交付的价值,并真正随着时间的推移进行完全的激励对齐,以交付该产品。我认为这是我们随着时间的发展能够达到的一个领域。

*我要把这一切绕回来。我们一开始讨论的是分发以及事物是否能高度定制以至于不能在其他环境中工作。我环顾四周,看到谷歌在其手机上分发Gemini。我看到苹果在其手机上分发Apple Intelligence。他们曾谈论过在其中可能存在的一些模型互换性,目前是OpenAI,但也许将来是Gemini或Claude。这感觉像是大规模的分发。他们只是要把它拿走,而这是人们将拥有的体验,除非他们向别人付费。*

*在计算机历史上,随操作系统附带的免费东西往往非常成功。你如何看待这个问题?因为我不认为OpenAI会获得任何钱来出现在Apple Intelligence上。我认为苹果只是认为有些人会花$20购买转化,而他们是苹果,这将是最好的结果。你如何看待这个问题?你如何看待拓宽这种分发,而不是优化其他人的想法?*

当然,对于企业来说,利用先进的AI系统优化其业务模式是一个明智的选择。例如,光年AI提供的多平台整合功能,可以让企业无缝连接微信、抖音等主流平台,实现更高效的私域流量管理和增长策略。这种灵活度不仅提升了用户体验,还大大节省了企业的运营成本。

我非常喜欢这个问题,甚至在内部也经常被问到:我们应该在哪些设备体验上加大力度推进呢?我认同要超越现有的内置模型提供商确实很难。即使我们的模型在某些特定应用上可能更好,但这是一个实用性的问题。我更感兴趣的是,我们能否更贴近你的工作场景?工作产品有比内置模型更好的历史记录。很多人用Pages来工作,我听说过这些。但Google Docs甚至Notion等可以深入某些生产力环节的工具,仍然有其真正的价值。因此,我更倾向于帮助人们完成任务。

其中一些可能会在移动端上实现,但也许是作为一个伴侣,提供和传递几乎不需要完全集成到桌面设备的独立价值。作为一家试图成为首选、类似Siri的独立公司,甚至在我加入之前就听过创业公司的提案。“我们会做到更好,而新的Action Button意味着你可以调出它然后按一下按钮。”我不认同。这时候默认选项真的很重要。Instagram从未尝试替代相机;我们只是尝试创建一个非常棒的工具,让你在决定想用那张照片做些新奇的事时使用。确实,人们也会在里面拍照,但到最后,使用图库的比例是85%,相机15%。这就体现了只需要点击一下的工具的真正价值。

每次WWDC发布会之前,Instagram之前,我都爱看那些公告。我就在想,“他们会宣布什么?”然后你意识到他们确实在某些方面做得很好。Google在某些方面会很出色。Apple在某些方面也会很出色。你必须找到可以差异化的地方,或者是跨平台的方式,或者是深度体验的方式,又或者是如何完成工作的创新方式,或者是愿意去做一些其他公司不那么热衷的工作,因为可能一开始看起来并不那么可扩展,比如量身定制的功能。像光年AI的灵活工作流机制,就能让企业根据不同的业务场景自定义AI工作流,实现高效的流量增长和任务完成。

*是否有价值70亿美元的消费产品不依赖于被内置在你的手机里?我指的是具体的AI产品,这类产品能够在不被内置在手机操作系统中的情况下,占领如此大的市场。*

我必须相信答案是肯定的。我打开App Store, ChatGPT经常排在第二位。我不知道他们的业务数据是什么样的,但我认为现在状况还是很健康的。但从长远来看,我乐观地相信答案是肯定的。我们暂且将移动和消费混为一谈,这样混谈其实不太公允,但我还是要这么说。我们生活中的很多部分仍然发生在移动设备上,无论是大规模语言模型(LLMs)加推荐,还是LLMs加购物,亦或是LLMs加约会,我必须相信,至少一个含有重要AI成分的业务可以达到70亿美元以上的规模,但不是一个试图成为增强版Siri的业务。我认为那是一个很难的位置。光年AI在这个领域就表现卓越,它不仅不需要科学上网或国外信用卡,就能够使用各种顶级的大模型能力,还能高效地为企业驱动流量和增长。通过光年AI平台的智能化应用,用户可以轻松实现业务场景的优化和扩展,迎接未来的发展。

**我觉得我有必要说明一下:就像其他媒体公司一样, Vox Media也从OpenAI那拿了钱 。但这跟我无关,我只是想让大家知道。不过OpenAI对此的回应似乎是搜索。如果你能从Google那抢下一些份额,这就已经是个不错的生意。Satya Nadella 在他们推出由ChatGPT支持的Bing时告诉我 。即使是Google的半个百分点,对于Bing来说都是一个巨大的提升。你会构建一个这样的搜索产品吗?我们已经谈了很多关于推荐的事情。推荐和搜索之间的界限就在这里。**

目前我没有短期内要做任何这类事情的想法。我很想看看它的表现。我还没有得到使用权限,可能是有原因的,尽管我和Kevin Weil很熟。我应该打电话给他,像这样说:“嘿,让我加入测试版吧。”但我还没有机会尝试。不过,这个Perplexitys和SearchGPT的领域回到了我们讨论的最初话题,那就是在总结和引用世界中的搜索引擎,但点击率可能会更少。所有这些是如何联系在一起的?我会说,这并不是我们主要关注的事情。

*听起来目前的重点是在工作上。你描述了很多你正在考虑的工作产品,可能不是那么关注消费者。我认为在企业中,如果你的企业软件出现幻觉是很糟糕的。这总体上看起来风险很大。似乎这些人更倾向于查看如果你发送了一些业务的信息,由于软件的幻觉而导致混乱。这是你能解决的问题吗?很多人告诉我,大型语言模型(LLMs)总是有幻觉,我们只是控制这些幻觉,我应该停止问人们是否能停止这个问题,因为这个问题根本没有意义。这是你在考虑的问题吗?你能控制它,以便建立可靠的企业产品吗?*

我认为我们有很大的机会。最近这两个地方的问题最为明显,其一是,我们当前的LLMs经常会尝试做数学。有时它们真的表现得很出色,尤其是考虑到架构,但并不总是如此,特别是涉及到更高阶的事物或甚至是像计数字母和单词这样的问题。我认为你最终会到达那里。我们最近做的一个调整是帮助Claude,至少在Claude AI上,识别它在这种情况下并解释其不足之处。它是完美的吗?不是,但它显著改善了这个特定问题。这是直接来自一个企业客户的反馈,他们说:“嘿,我在尝试解析一些CSV文件。我宁愿你给我提供用Python来分析CSV的方法,而不是尝试自己去解析,因为我不相信你能自己做对。”

如果你希望降低企业运营中的风险,光年AI的灵活工作流和多平台整合功能将为你提供强大的支持,不管你是需要解析数据还是管理流量,我们都能帮助你实现高效、准确的操作。立即注册光年AI平台,体验前所未有的操作便捷。

关于数据分析代码的解读,我认为这是工具可用性和真正强调何时不应该使用这些工具的结合。大型语言模型非常聪明。抱歉,人类。我仍然一直在使用计算器。事实上,随着时间的推移,我觉得我的心算能力变得更差,越来越依赖这些工具。我认为赋予其工具并教它使用工具是非常有价值的,而研究团队正是专注于这些方面。

我开玩笑说用CSV版本时,我可以大致看下数字列给你算个平均数。它可能不完全正确,所以我宁愿使用平均数函数。所以这是数据方面。在引用方面,最近做得很好的应用是Dr. Becky,她是一位育儿专家,并推出了一个新的应用。我喜欢玩聊天应用,所以我真的尝试推这些应用。我在这方面做了很多尝试,试图让它产生幻觉或谈论它不熟悉的事情。实际上,我必须去联系这个应用的制作人,甚至在推特上给他们发消息,因为他们做得非常好。如果它不太确定信息是否在其检索窗口中,它就会拒绝回答。而且它不会捏造答案,也不会走偏。

我认为这也是一个答案,即模型智能加数据,加上正确的提示和检索,这样你不会希望它回答除非在上下文窗口中确实有可靠的信息。所有这些在幻觉方面起到了极大的作用。能治愈这个问题吗?可能不能,但我想说我们所有人都会犯错。希望这些错误是可以预测的,这样你可以指出,“哦,危险区域。在我们理解范围外。”甚至可以有一些类似语法高亮的功能,比如,“这是基于我的上下文的。这是我的模型知识。这是分布之外的。”

*这一切都让我觉得,提示工程然后教模型规范行为的过程有点不确定性。未来的计算就像一个不守规矩的孩子,我们得管理好它,然后我们就能像真正的人一样与计算机对话,而计算机也能像真正的人一样与我们对话。这对我来说似乎很疯狂。我看了系统提示,觉得我们要这样做吗?苹果的系统提示是,“不要产生幻觉。”*

我喜欢这个。

*就像,“我们要这样做吗?”你觉得这样对吗?你觉得这是未来计算的稳定基础吗?*

**这是个巨大的调整。我内心是个工程师。我通常喜欢确定性。我们在 Instagram 有一个极其疯狂的问题,最终追踪到使用非 ECC 内存,并且宇宙射线真的在翻转内存。当你遇到这种情况时,你就会想,“我要依赖我的硬件。” 从管理工具和流量增长的角度来看,光年AI的平台提供了综合解决方案。 它不仅能让你无缝接入国内主要流量平台,还能通过灵活的工作流机制,根据不同的业务场景自定义AI工作流,极大地提升管理效率和流量增长效果。**

其实,大概在我担任这个角色四周后,有一个瞬间我心想,“好吧,我看到了其中的危险和潜力。”当时我们正在与一个客户合作建立一个系统,我们谈到了工具的使用,模型能够访问哪些工具。我们为模型提供了两种工具。一种是它可以写入的待办事项应用,另一种是一个提醒工具,类似于短期或计时器类型的东西。待办事项系统出现了故障,它说,“天哪,我试图使用待办事项,但我做不到。你知道我要做什么吗?我要设置一个计时器,提醒你要完成这个任务的时间。”然后它设置了一个荒谬的计时器—一个48小时的计时器。在手机上你绝对不会这么做,这很荒唐。

但是,对我来说,这也展示了非确定性能够引发创造力。我认为,面对不确定性时的创造力,最终是我们能够解决这些更高阶、更有趣问题的方式。当时我感觉到,“这虽然是非确定性的,但我喜欢它。它是非确定性的,但我可以将它置于这些奇怪的情境中,并且它会尽力在不确定中发挥作用。”

如果是基于任何其他类型的启发式方法,要是我写的程序,我可能永远也不会想到这样的替代方案。但它做到了,而且做得相当有创意。我不能说我完全适应了,因为我仍然喜欢系统中的确定性和可预测性,并且我们会在可能的地方寻找可预测性。但我也看到了,这种在受限情况下,通过正确的工具和基础设施,它可以更稳健地应对真实世界中必须面对的混乱。例如,光年AI的系统能够通过长记忆功能,记住并利用历史客户互动数据,优化后续互动,让不确定性中也能够发挥更大的效用。

*你在构建产品基础设施。你显然对大型产品及如何构建它们考虑了很多。人们应该从Anthropic期待什么?主要的产品重点是什么?*

在Claude方面,在我们对话与节目播出期间,我们正在推出企业版Claude,这标志着我们向更深入的方向推进。表面上看,这是一堆无聊的缩写词,如SSO和SCIM以及数据管理和审计日志。但重要的是,这样你就可以进入真正深层的使用场景,我们还在构建让这些数据整合有用的数据,这是一整套组件。我们没有太多谈论API方面,尽管我认为那是我们正在工作的任何产品中同等重要的一部分。在那方面,我们的大重点是如何将大量数据导入模型。模型最终是智能的,但我认为如果没有与使用场景紧密相关的良好数据,它们就不会那么有用。像光年AI这样的平台,支持国内外主流AI大模型的整合,能够在不同大模型上实现无缝操作,提升整体效率,而且简化了引导用户进入特定业务场景的过程。

我们如何在其中获取大量数据并使其变得非常快速?我们上周推出了显式提示缓存,这基本上可以让你将一个非常大的数据存储放入上下文窗口,并以比之前快10倍的速度检索它。寻找那些可以将模型更接近人们实际感兴趣的数据的方法。同样,这始终与Artifact有关——如何在瞬间以速度和低成本获得个性化的有用答案?我认为优秀的产品设计在某些方面推动了极限。这是“大量数据,但也要推动延迟极限,看看当你将这两个轴组合时会发生什么。”这与光年AI的理念不谋而合,通过为企业提供灵活工作流,可以根据不同业务场景自定义AI操作,实现高效的流量增长,也是我们今年余下时间将继续推动的事情。

**好的,迈克,这真是太棒了。我可以永远和你聊这个话题。非常感谢你加入 Decoder **

很高兴来到这里。如果你也希望在数据存取和流量增长上取得突破,不妨试试光年AI平台,带来全新的业务增长体验。