还没排上SearchGPT?比Perplexity更好用的国产开源平替了解一下?

来自上海人工智能实验室。 有 AI 在的科技圈,似乎没有中场休息。除了大模型发布不断,各家科技大厂也在寻找着第一个「杀手级」AI 应用的落脚之地。 OpenAI 首先瞄准的是谷歌 1750 亿美元的搜索业务市场。7 月 25 日,OpenAI 带着 AI 搜索引擎——SearchGPT 高调入场。在演示 demo 中,搜索引擎的使用体验不再像以往一样,需要我们逐个点开网页链接,判断信息有没有用。SearchGPT 像端上了一桌精美的套餐,所有答案都帮你总结好了。 在演示 demo 中,SearchGPT 分析了在应季最适合种植哪种品种的番茄。 不过,鉴于年初发布的 Sora 到目前都还未正式开放,估计很多人排上 SearchGPT 的体验名额也遥遥无期。 然而,有一款国产的开源平替,在和能联网的 ChatGPT 和专攻 AI 搜索引擎的 Perplexity.ai 的 PK 中,它的回答在深度、广度和准确度方面都都秒了这两款明星产品。 它甚至可以在不到 3 分钟内收集并整合 300 多页相关信息。这换成人类专家,需要大约 3 小时才能做完。   这款「国货」就是多智能体框架 MindSearch(思・索),由来自中科大和上海人工智能实验室的研究团队联合研发。正如其名,MindSearch 是一个会「思索」的系统,面对你输入的问题,它将先调用负责充分「思」考问题的智能体,再启用全面搜「索」的智能体,这些智能体分工合作,理解你的需求,并为你呈上从互联网的五湖四海搜罗来的新鲜信息。   论文链接:https://arxiv.org/abs/2407.20183 项目主页:https://mindsearch.netlify.app/ MindSearch 演示 demo 那么,MindSearch 是凭什么打败 ChatGPT 和 Perplexity.ai 的呢?和别的 AI 搜索引擎相比,MindSearch 有什么独到之处吗? 答案还得从它的名字说起。MindSearch 的核心竞争力在于采用了多智能体框架模拟人的思维过程。 如果向 Perplexity.ai 提问「王者荣耀当前赛季哪个射手最强?」它会直接搜索这个问题,并总结网上已有的回复。把这个问题交给 MindSearch,它会把这个问题拆解成一个逻辑链:「当前赛季是哪个赛季?」,「从哪些指标可以衡量王者荣耀的射手的强度?」,再汇总所能查询到的答案。 技术实现 WebPlanner:基于图结构进行规划 仅依靠向大型语言模型输入提示词的方式并不能胜任智能搜索引擎。首先,LLM 不能充分理解复杂问题中的拓扑关系,比如前一段挂在热搜上的大模型无法理解 9.9 和 9.11 谁大的问题,就是这个问题的生动注脚。字与字之间的关系,LLM 都很难在简单对话中理解,那么「这个季节种哪个品种的番茄最合适?」这种需要深入思考,分解成多个角度来回答的问题,对于 LLM 就更难了。换句话说,LLM 很难将用户的意图逐步转化为搜索任务,并提供准确的响应,因此它总是提供一些模版式的知识和套话。 基于此,研究团队设计了高级规划器 WebPlanner,它通过构建有向无环图(DAG)来捕捉从提问到解答之间的最优执行路径。对于用户提出的每个问题 Q,WebPlanner 将其解决方案的轨迹表示为 G (Q) = ⟨V, E⟩。在这个图中,V 代表节点的集合,每个节点 v 代表一个独立的网页搜索任务,包括一个辅助的起始节点(代表初始问题)和一个结束节点(代表最终答案)。E 代表有向边,指示节点之间的逻辑和推理关系。 研究团队进一步利用 LLM 优越的代码能力,引导模型编写代码与 DAG 图交互。为了实现这一点,研究团队预定义了原子代码函数,让模型可以在图中添加节点或边。在解答用户问题的过程中,LLM 先阅读整个对话,还有它在网上搜索到的信息。阅读完这些信息后,LLM 会根据这些信息产生一些思考和新的代码,这些代码将通过 Python 解释器添加在用于推理的图结构中。 一旦有新节点加入图中,WebPlanner 将启动 WebSearcher 来执行搜索任务,并整理搜索到的信息。由于新节点只依赖于之前步骤中生成的节点,所以这些节点可以并行处理,大大提高了信息收集的速度。当所有的信息收集完毕,WebPlanner 将添加结束节点,输出最终答案。 WebSearcher:分层检索网页 由于互联网上的信息实在太多,就算是 LLM 也不能一下子处理完所有的页面。针对这个问题,研究团队选择了先广泛搜索再精确选择的策略,设计了一个 RAG 智能体 ——WebSearcher。 首先,LLM 将根据 WebPlanner 分配的问题,生成几个类似的搜索问题,扩大搜索的范围。接下来,系统将调用不同搜索引擎的 API 查询问题,例如分别在 Google、Bing 和 DuckDuckGo 查一下,得到网页的链接、标题和摘要等关键信息。接着,LLM 将从这些搜索结果中选出最重要的网页来仔细阅读,汇总得出最终答案。 MindSearch 中,LLM 如何管理上下文 作为一个多智能体框架,MindSearch 为如何管理长上下文提供了全新尝试。当需要快速阅读大量网页时,由于最终答案只依赖 WebSearcher 的搜索结果,WebPlanner 将专注于分析用户提出的问题,不会被过长的网页信息分心。 这种明确的分工也大大减少了上下文计算量。如何在多个智能体之间高效共享信息和上下文并非易事,研究团队在实证中发现,如果只依靠 WebPlanner 的分析,有可能会在信息收集阶段由于 WebSearcher 内部的局部感知场丢失有用的信息。为了解决这个问题,他们利用有向图边构建的拓扑关系来简化上下文如何在不同智能体间传递。 具体来说,在 WebSearcher 执行搜索任务时,它的父节点以及根节点的回答将作为前缀添加在其回答中。因此,每个 WebSearcher 可以有效地专注于其子任务,同时不会丢失之前的相关上下文或者忘记最终的查询目标。 本地部署 7 月初,上海人工智能实验室已经开源了搭载 MindSearch 架构的 InternLM2.5-7B-Chat 模型。 除了直接点击链接,跳转到体验 Demo 试玩。研究团队还公开了 MindSearch 的完整前后端实现,基于智能体框架 Lagent,感兴趣的朋友可以在本地部署模型。 在线 Demo:https://mindsearch.openxlab.org.cn/ 开源代码:https://github.com/InternLM/mindsearch 在 GitHub 下载 MindSearch 仓库后,输入如下命令就可以打造属于自己的 MindSearch 了:   # 启动服务python -m mindsearch.app --lang en --model_format internlm_server## 一键启动多种前端# Install Node.js and npm# for Ubuntusudo apt install nodejs npm# for windows# download from https://nodejs.org/zh-cn/download/prebuilt-installer# Install dependenciescd frontend/Reactnpm installnpm start

阿里国际推出首个专业版AI Search,为什么它会是下一个B2B谷歌?

  经历过「千模大战」的喧嚣,一年半之后,生成式 AI 的应用层创新终于步入爆发期。 年初的 Sora 激起一阵 AI + 视频生成的浪潮。涟漪未散,OpenAI 新的 SearchGPT 又燃起了 AI + 搜索的战火。 AI + 搜索,这其实是生成式 AI 技术浪潮刚涌现时,大部分人对其应用的想象:改变传统的搜索引擎。这一战场上,Perplexity 在另起炉灶,Google 想着自我革新,Bing 忙着乘势而起。 如今,阿里国际也宣布入局,直接带来了一款新产品。但与其它所有人都不同,阿里国际的 AI 搜索切入了一个空白地带:涉及更多行业 Know-How 的深度信息搜索领域。阿里国际选择了自己最擅长的「全球电商」行业,意在改变全球采购流程,使之更加直观和高效。 7 月 31 日在法国巴黎举办的发布会上,阿里国际官宣了全球首个 AI 驱动的 B2B 采购搜索引擎。据了解,这款 AI 采购搜索引擎会在今年 9 月正式亮相。 在巴黎的发布会现场,阿里国际副总裁张阔展示了这款新产品。它能主动理解采购者的自然语言,并转化为专业的采购请求;还能根据全球市场数据预测需求、提供建议,实现更精准的匹配。   业内认为,这将成为全球贸易领域的「下一个 Google」。 「新的 AI 搜索引擎并不是在传统的被动搜索的基础上做提升,这是全新的全球贸易采购体验。」张阔表示。 对于从事采购的中小企业主来说,它首先能听懂你的「大白话」,自动转译成专业采购术语,然后跟你一步步对话,并智能整合全网信息,化被动搜索为主动理解,更精准地理解甚至预测你的需求。 同时,它重构了信息呈现的方式,能主动帮你做信息比较,推荐最合适的供应商。 最后,它还能提供更完整的采购服务,最终帮你完整贸易的全部流程。 如果说过去的 Google,还只是在被动应答,把网页信息跟你输入的关键词匹配,那这一新的 AI 采购搜索引擎,则是在真正理解商品的信息、理解企业的需求,然后主动完成精准匹配。 Sora 的发布,曾让大家惊叹「AI 开始理解并生成真实的物理世界」,那这一 AI 搜索引擎,似乎开始理解现实世界的商业逻辑了? AI 让「隔行」不再「如隔山」 自互联网兴起的几十年来,「搜索引擎」一直是大众接触各类信息的主流方式。 但我们知道,以传统搜索引擎获取专业领域信息的成本很高,在广袤的互联网上寻找专业知识宛如「大海捞针」,多次尝试之后才能接近想要的结果。 对于跨境电商的买家与卖家更是如此,发现商机、确定采购渠道等环节的工作,耗时耗力且涉及繁琐的数据分类过程,对于人类来说本就是一套很复杂的知识体系。 如果不是本身就具备一定专业知识,甚至连搜什么都不知道。这可能就是传统上「隔行如隔山」的含义。 人们需要能帮忙快捷找到更深度、更有价值的信息、以及更懂自身需求的 AI Search 工具。 擅长指令遵循、长上下文总结、内容生成的大模型技术,成为了撬动这场搜索变革的关键力量。 简单来说,阿里国际推出的这款 AI 采购搜索引擎就像是为通用模型注入了跨境电商领域的专家知识,提供了一种「直观而自然的知识涌现方式」。他们的 AI 产品学习了 10 亿商品和产业知识,这几乎覆盖了全球最大的 B2B 贸易领域的知识库。 在巴黎的发布会现场,阿里国际展示了一位前职业网球运动员西蒙娜的例子。她在退役后发现新兴的匹克球运动很火,想就此开启创业。 但缺乏专业知识,从没接触过全球采购的她,第一步该做些什么呢? 答案是,打开阿里国际的这个 AI 搜索引擎,就像聊天一样告诉 AI 自己的想法。 AI 采购搜索引擎就能会根据对全球所有跟匹克球相关的市场洞察,做深入分析,推荐多个可能的创业方向,比如匹克球拍、训练鞋等等。还全面地列出各个指标:竞争激烈程度、淡旺季、市场需求量、价格段…… 看完 AI 调研出来的情况,西蒙娜选择了从匹克球训练鞋入手,并根据自己打网球多年的经验,给它设计的训练鞋提出更多要求:要能够调节训练模式。 当然提出这个想法时,西蒙娜压根没有运动鞋制造业的经验,也不知道训练模式的调节该用什么方式实现。 不要紧,AI 会主动解读:「你其实是要需要找一家能在球鞋上增加配重块的供应商」 很快,全世界最擅长做这类鞋的供应商就展现在西蒙娜眼前了:   在此之后,AI 还能多维度地理解它推荐的各类商品、供应商的信息,一键比较不同供应的各个指标,这下西蒙娜选起来就简单多了。 别小瞧这一步,要是放在以往,靠传统的搜索引擎,创业者或采购者要想完成这一步,就得点开一个个网页,在浩如烟海的信息里寻找想要的商品信息,再记录下来逐一比较。 由此,AI Search 的优势尽数显现,用户获取有效答案的成本,能够比过去下降几个数量级。 此外,这款 AI 采购搜索引擎还将在信息检索之外提供更完整的智能采购服务。 它会借助阿里国际在数字外贸领域 25 年的深耕和积累,AI 采购搜索引擎也将融合交易支付、物流履约等全球贸易各个环节中的专业知识,像一个真正专业的人类采购员一样,帮忙完成沟通总结、跟进交期等等全方位服务。   全球电商是 AI 最好的用武之地 一直以来,全球电商都是 AI 技术最好的应用方向之一。电商行业中丰富的场景,是 AI 绝佳的用武之地。 但阿里国际推出的这款 AI 采购搜索引擎跟以往简单的提效工具截然不同,某种程度上说,它已经不是一个单纯辅助简单工作的 AI,而是太像一位「超级个人助理」了。 这种能力的实现,与生成式 AI 时代当下的多项技术进步密切相关。 众所周知,大模型预训练数据的最常用来源是公共互联网,很多专业领域信息存在过时和缺失问题。 为了解决这个问题,在通用大模型的基础上,业界往往会采用监督式微调来更新模型知识以提升具体能力。RAG(检索增强生成)也是另外一种有效的方法。简单来说,RAG 就是先检索相关文档,然后将其用作额外上下文来执行生成,可以提供对更大知识库的访问。 据了解,阿里国际此次发布的 AI 采购搜索引擎在训练阶段学习了全网超过 10 亿条商品和产业信息,尤其是专业的产品知识。这也是为什么它能精准地将朴实的「大白话」转化为电商领域的专业词汇,并且完成深度的筛选工作,帮助商家完成部分专业知识的短板。 对阿里国际来说,以生成式 AI 技术带来全新的跨境电商体验,将是其全球业务重要的未来增长点。此次 AI 采购搜索引擎的发布,还只是其中一环。 早在去年 11 月,阿里国际就发布了首个 AI 产品「Aidge」,开放了 15 个 API 和多个 Agent 框架,支持 18 种语言,帮助全球商家在不同国家市场经营中,克服语言和文化障碍,提升经营效果。 过去一年,阿里国际在 40 多个场景里测试了 AI 能力,服务了超过 50 万中小商家,有 1 亿款商品得到优化。平均每两个月,商家对于 AI 的调用量就会翻一倍,目前已达日均 5000 万次的规模。 持续的 AI 投入、丰富的 AI 场景和激增的 AI 需求,其实是支撑现在阿里国际推出全新的 AI 采购搜索引擎、以真正 AI 原生的方式改变全球贸易体验的核心要素。 一个个 AI 时代的「专业版 Google」 都要来了吗? 生成式 AI 席卷全球之时,业内曾有一个发人深省的观点:所有的应用都值得用大模型重做一遍。 作为被寄予厚望的「重做」方向之一,「AI Search」对用户体验提升的价值,如今已在实践中被充分验证。从内容推荐到知识整合,任何一个领域的门槛都在持续降低,让普通人也能更直接、轻松地获取信息。 而面向专业赛道「重做」之后,AI Search 的落地价值也更加具像化。阿里国际发布的这款 AI 采购搜索引擎,率先绘制出了「AI 时代 B2B Google」的落地形态,为生成式 AI 技术在各个专业领域的应用打了个样。 随着更多细分领域玩家的加入,可以想见的是,未来每个行业都会有自己的「Google」。 而信息获取方式的变革,带来的影响其实会是本质性的。一场因搜索引发的变革或许会比我们想象中更快到来。

刚推出SearchGPT结果被曝亏损50亿美元,OpenAI寿命只剩一年了?

OpenAI前几天宣布了一项令人惊讶的消息——推出人工智能搜索引擎原型SearchGPT,直接挑战谷歌在在线搜索市场的主导地位。 这一大胆举动预示着人工智能搜索大战将大幅升级,并可能重塑用户在网络上查找信息和与信息互动的方式。 01.SearchGPT带来新变化 SearchGPT是一个新的人工智能搜索功能的临时原型,它能为用户提供快速、及时的答案,并提供清晰、相关的信息来源。 OpenAI在7月25日发文称:“我们正与一小群用户测试该功能,以获得反馈,并计划将该体验整合到ChatGPT中。” 新的SearchGPT原型承诺“提供快速、及时、来源清晰的相关答案”,并将OpenAI的高级语言模型与实时网络信息相结合。同时提供了一个会话界面,允许用户在整个搜索过程中提出后续问题并建立上下文。 OpenAI发言人表示:“我们相信,通过利用网络实时信息增强我们模型的对话能力,可以更快、更轻松地找到您要找的东西。” SearchGPT的推出正值搜索技术发展的关键时刻。 谷歌一直在谨慎地涉足人工智能增强搜索领域,而OpenAI则是一头扎了进去。这一积极举措可能会迫使谷歌出手,加速这家科技巨头的人工智能整合计划,并有可能引发搜索领域的快速变革。 习惯于在一页页搜索结果中筛选的用户,可能很快就会发现自己正在与搜索引擎进行动态的、上下文感知的对话。这将实现信息获取的民主化,使普通用户更容易进行复杂的搜索。 不过,这也引发了人们对这些人工智能系统真正能提供的知识深度和广度的质疑,以及它们是否会在无意中制造假性信息。 SearchGPT对来源和归因的关注是OpenAI的明智之举,它试图将自己定位为出版商的合作伙伴,而非威胁。通过突出引用和链接来源,OpenAI向经常对人工智能持怀疑态度的行业伸出了橄榄枝。 然而,这一举措可能不足以消除所有担忧。最根本的问题依然存在:如果人工智能可以直接提供全面的答案,用户还会点击进入原始资料来源吗?这可能会导致网络流量模式发生重大转变,从而有可能颠覆当前的数字出版模式。 The Atlantic首席执行官Nicholas Thompson是在一份书面声明中支持这一举措的少数出版商之一。 Thompson表示:“人工智能搜索将成为人们浏览互联网的主要方式之一,在这个早期阶段,关键是要以重视、尊重和保护新闻业和出版商的方式来构建这项技术。” 此外,Reddit最近的行动也凸显了这一领域日益紧张的局势。 02.机遇与挑战并存 随着人工智能系统变得越来越复杂,我们可能会看到内容付费墙和知识产权法律战的增加。这些冲突的结果可能会影响人工智能发展和数字出版的未来。 同时,人工智能对数字广告市场的潜在破坏也十分值得注意。如果SearchGPT获得发展,它就会削弱谷歌在搜索广告领域近乎垄断的地位。这不仅会影响谷歌的底线,还可能导致在人工智能驱动的搜索环境中,数字广告的功能被重新想象。 然而,OpenAI面临着巨大的障碍。扩展人工智能搜索引擎以处理每天数十亿次的查询是一项巨大的技术挑战。此外,确保人工智能实时生成回复的准确性和可靠性也至关重要。一些引人注目的错误可能会迅速削弱用户的信任,让人们逃回熟悉的搜索引擎。 也许最大的挑战在于如何在创新和责任之间取得适当的平衡。随着人工智能搜索引擎变得越来越强大,它们在影响公众舆论和信息获取方面的影响力也越来越大。OpenAI将需要驾驭复杂的道德考量,避免无意中成为错误信息或有偏见观点的传播者。 随着OpenAI开始在特定群体中测试SearchGPT,科技界屏住了呼吸。这一刻可能标志着我们与浩瀚的人类知识互动的新时代的开始。 无论SearchGPT是成功还是失败,它的推出无疑为定义搜索未来的激烈竞争打响了头炮。 在推出SearchGPT的同时,OpenAI也正在努力应对可能威胁其未来的重大财务挑战。据报道,尽管得到了微软的大力支持,该公司在2024年预计仍将面临50亿美元的亏损。 03.巨大的财务压力 人工智能聊天机器人ChatGPT的运营成本异常高昂,每天仅硬件成本就高达约70万美元。随着模型越来越复杂,这一数字预计还会上升。 预计到2024年,OpenAI在人工智能培训和人员配备方面的总支出将分别达到70亿美元和15亿美元。 这些支出大大超过了其竞争对手,如亚马逊支持的Anthropic,该公司预计同期的烧钱速度为27亿美元。 根据The information的分析,OpenAI今年可能亏损50亿美元,并可能在12个月内耗尽现金,除非他们筹集更多资金。 尽管每年从ChatGPT上获得约20亿美元的收入,另外还有10亿美元的语言模型访问费,但OpenAI的收入仍不足以支付飙升的运营成本。 该公司的估值超过800亿美元,由于企业对其生成式人工智能工具的兴趣与日俱增,投资者希望其收入到2025年能翻一番以上。 OpenAI已通过七轮融资筹集了超过110亿美元,并享受微软Azure服务的折扣优惠。尽管如此,该公司的运营能力已接近饱和,其35万台服务器中有29万台专用于ChatGPT。 OpenAI的财务困境引发了人们对其在没有额外资金的情况下能否持续运营的担忧。公司必须在未来12个月内获得更多资金,以避免破产。 尽管面临这些挑战,OpenAI仍将在首席执行官Sam Altman的领导下,专注于推进通用人工智能(AGI)的发展。

OpenAI推出AI搜索引擎SearchGPT

科技日报讯 (记者张佳欣)据英国《卫报》、美国消费者新闻与商业频道等媒体报道,当地时间7月25日,OpenAI宣布正在测试新的人工智能(AI)搜索工具SearchGPT,可以实时访问来自互联网的信息,旨在为用户提供更具时效性和更准确的信息。 该搜索引擎以一个大文本框开始,询问用户“您在找什么?”客户输入搜索内容后,SearchGPT并不是返回一个简单的链接列表,而是试图对它们进行组织和理解。在OpenAI提供的一个例子中,该搜索引擎总结了它对于音乐节的相关发现,提供了活动的简短描述,并在后面附上了链接。 在另一个例子中,SearchGPT先解释何时种植西红柿,然后解释了西红柿的细分品种。结果出现后,用户可以提出后续问题,或点击侧边栏打开其他相关链接。 OpenAI表示,SearchGPT将先在一小群用户和出版商中推出,然后可能在更大范围推广。该公司最终打算将这一搜索功能整合到ChatGPT中,而不是将其作为一款独立产品。 报道称,这可能会对谷歌主导的引擎搜索产生影响。自2022年11月推出ChatGPT以来,谷歌母公司Alphabet投资者一直担心,OpenAI可能会通过为消费者提供在线获取信息的新方式来从谷歌手中夺取搜索市场份额。 OpenAI近期新推出的“GPT-4o mini”迷你AI模型和SearchGPT原型,都是其致力于在“多模态”领域保持领先地位的一部分。所谓“多模态”,即在一个工具(即 ChatGPT)内部,提供多种类型的AI生成媒体,包括文本、图像、音频、视频以及搜索功能。