星尘智能获数千万美元融资,专注 AI 机器人商业化;OpenAI 部分开放 GPT-4o 语音,今秋扩至所有付费用户

01 今日融资快报 人形机器人星尘智能获数千万美元 Pre-A 轮融资,专注 AI 机器人商业化 AI机器人公司星尘智能(Astribot)宣布完成数千万美元Pre-A轮融资,由经纬创投领投,道彤投资及清辉投资等产业资本跟投,老股东云启资本跟投。华兴资本担任独家财务顾问。 星尘智能于2022年12月在深圳成立,致力于让数十亿人拥有AI机器人助理。公司专注研发“新一代最强AI机器人助理”,能像人一样学习、思考和劳动,与人流畅智能交互,会使用人的工具和设备、帮人完成枯燥、困难或危险的任务。(Z Potentials) Figma 完成 F 轮融资,多家知名投资方参与投资 界面设计工具提供商Figma宣布完成F轮融资。本轮融资由a16z、Alkeon Capital、Atlassian、Coatue、Durable Capital Partners、Fidelity Management and Research Company、Franklin Venture Partners、General Catalyst、Iconiq Capital、KPCB、SurgoCap、Thrive Capital、XN和红杉资本(海外)等多家知名投资方共同参与。 供应链可视化初创公司 Altana 在 C 轮融资中筹集了 2 亿美元 这家总部位于纽约的初创公司提供了所谓的“价值链管理系统”,该系统使企业能够通过人工智能洞察其供应链。本轮融资使 Altana 的估值达到 10 亿美元。 此轮融资由美国创新技术基金 领投,该基金是由前传奇娱乐首席执行官、后来成为科技投资者和企业家的Thomas Tull创立的风险基金。其他投资者包括 Salesforce Ventures、Google Ventures、March Capital、Omers Ventures、Friends and Family Capital 和 Activate Capital。 保险业 AI 解决方案提供商 Gradient AI 获 5600 万美元 C 轮融资 Gradient AI是一家保险业AI解决方案提供商,主要利用高级数据分析和机器智能来解决保险业和医疗保健行业中的问题。本轮投资由Centana Growth Partners牵头,现有投资者MassMutual Ventures、Sandbox Insurtech Ventures和Forte Ventures参与了此次投资。 医疗软件服务提供商 VitalHub 以 3400 万美元收购 MedCurrent 医疗保健软件和服务提供商VitalHub Corp.宣布收购临床决策支持公司MedCurrent Corporation。该交易价值3400万加元。此次收购将整合MedCurrent的人工智能驱动的OrderWise平台,该平台优化诊断测试并减少不必要的测试,以及VitalHub的患者流程软件。 AI 和物联网解决方案提供商 Trio Mobil 获 2650 万美元种子轮融资 Trio Mobil是一家人工智能和物联网解决方案提供商,致力于提高工作场所的安全性和效率,提供一套强大的解决方案,可满足设施和仓库内部物流以及高速公路运营的安全和效率要求。公司通过其专门的增长股权战略NewSpring growth获得了由NewSpring领投的2650万美元增长融资,现有投资者212和TIBAS Ventures也参与了本轮融资。 AI 治理软件 Credo AI 获 2100 万美元融资 Credo AI 的使命是让组织能够负责任地大规模构建、采用、采购和使用人工智能。Credo AI 的开创性人工智能治理、风险管理和合规平台可帮助组织衡量、监控和管理人工智能风险,同时确保遵守新兴的全球法规和标准,例如欧盟人工智能法案、NIST 和 ISO。 本轮融资来自 CrimsoNox Capital、Mozilla Ventures 和 FPV Ventures,现有投资者 Sands Capital、Decibel VC、Booz Allen Hamilton 和 AI Fund 也参与其中。这使得该公司的融资总额达到 4130 万美元。 软件供应链管理初创公司 Lineaje 筹集 2000 万美元 软件供应链管理初创公司 Lineaje 今天宣布,它已经筹集了 2000 万美元的新资金,用于提升其人工智能能力、提供安全的开源软件、降低企业软件维护成本并扩大其全球业务。 Prosperity7 Ventures、Neotribe Ventures 和 Hitachi Ltd. 领投了 A 轮融资,Tenable Ventures Inc.、Carahsoft Technology Corp.、Wipro Ventures、SecureOctane、Alumni Ventures Group 以及 ZScaler Inc.、CrowdStrike Holdings Inc. 和 Trellix Inc. 的高管也参与了本轮融资。 企业 AI 平台 Intelmatix 获 2000 万美元融资 Intelmatix是一家深度科技 B2B 初创公司,其目标客户是 MENA(中东和北非)地区希望帮助利用人工智能力量进行决策的企业,该公司已完成 2000 万美元的 A 轮融资。Intelmatix在 2024 年 3 月推出了其企业 AI 平台 EDIX,并已获得了 10 家企业客户。 该公司的 A 轮融资由 Shorooq Partners 领投,其他投资者包括 Olayan Financing Company、Rua Growth Fund 等。 金融科技公司 Aveni 获 1400 万美元的资金 Aveni已获得1400万美元的资金,用于推进AI在金融服务行业的使用。这笔融资将使Aveni与投资者劳埃德银行集团和全国合作开发FinLLM,这是一种金融服务特定的大型语言模型。 专为 ERP 设计的 AI 连接器 Monto 获得 900 万美元种子融资 Monto 是首款专为任何 ERP 设计的 AI 连接器,使 B2B 财务团队能够从企业客户使用的任何 AP 门户无缝获取报酬。该平台将 Monto 客户的 ERP 系统连接到客户的支付平台,并将这些企业带入 B2B 支付的未来,实现一键式付款流程。 此轮融资由 Scale Venture Partners 领投,Verissimo Ventures、F2 Venture Capital、Firsthand Alliance 和 Room40 Ventures 跟投。连续创业者 Ariel Maislos 以及来自 Intuit、Plaid、Salesforce 等公司高管的金融科技天使也参与其中。 AI 基础设施初创公司 Hyperbolic Labs 融资 700 万美元 人工智能基础设施初创公司 Hyperbolic Labs Inc. 表示,该公司已完成 700 万美元的种子轮融资,以改变人工智能开发人员获取计算和推理资源的方式。本轮融资由 Polychain Capital 和 Lightspeed Faction 领投,Chapter One、LongHash、Bankless Ventures、Republic Digital、Nomad Capital、CoinSummer Labs 和 Third Earth Capital 等其他投资者以及 Balaji Srinivasan、Illia Polosukhin、Sandeep Nailwal、Casey Caruso、Tekin Salimi 和 Santiago Santos 等天使投资人也参与了本轮融资。 AI 驱动的金融科技初创公司 Powder 获 500 万美元种子融资 在首席执行官 Kanishk Parashar 的领导下,Powder 创建了用于精确文档分析的 AI 代理,以快速构建提案、汇总外部资产、了解财产并按账户类型、号码、实体、税务状况和资产分类自动组织投资组合。融资支持者包括 YCombinator、General Catalyst、Funder’s Club、Elefund、Litquidity Ventures 和 Script Capital,以及 Jon Xu 和 Bryant Chou。 AI 语音公司 Gnani AI 获 400 万美元 A 轮融资 由 Ganesh Gopalan 和 Ananth Nagaraj 创立,是一家语音优先的生成式人工智能初创公司。在其 A 轮融资中从 Info Edge Ventures 筹集了 400 万美元。Gnani 提供无代码语音优先平台,具有多种产品功能,例如全渠道会话自动化、代理辅助、语音生物识别、全渠道分析等。 AI 解决方案提供商 Axle Automation 获得 250 万美元种子轮融资 Axle Automation是一家合规团队人工智能解决方案提供商,专注于利用生成式人工智能来自动化和增强AML合规流程,该公司专注于简化运营,例如加强尽职调查,从而使金融机构能够有效地扩大其合规工作,通过自动化这些传统上手动且效率低下的流程,旨在减少欺诈、合规风险和运营成本,同时增加收入。Axle Automation宣布其种子轮融资成功结束。本轮融资由 Diagram Ventures 领投,Mistral Ventures、Uphonest Capital、StreamingFast 和其他战略天使投资者参投。 AI 驱动的法律公司 DecoverAI 筹集 200 万美元种子资金 DecoverAI 成立于 2024 年,由首席执行官 Ravi Tandon、首席技术官 Janar Ramalingam 和首席运营官兼首席风险官 Kevin J. Van Horn 领导,是一家法律技术公司,专注于提供人工智能驱动的解决方案,以提高法律专业人士的效率和效果。其目标是建立一个智能人工智能系统,包含现实世界法律工作流程所需的功能,包括发现证据、将其与研究相结合,甚至生成不同的叙述策略来协助法律专业人士。此轮融资由利奥资本领投,其他知名投资者跟投。 AI 伴侣设备 Friend 获 250 万美元融资 Friend由哈佛大学辍学生、曾因创建COVID-19追踪网站获得威比奖的Avi Schiffmann开发。这款项链不用于提高生产力,而是作为一种情感玩具,通过连接到手机并持续监听用户的声音,来提供伴侣式的交流。 Schiffmann 已以 5000 万美元估值筹集了 250 万美元资金,投资者包括 Caffeulated Capital 的 Raymond Tonsing、Z Fellows 创始人 Cory Levy、Perplexity 首席执行官 Aravind Srinivas、Solana 创始人 Anatoly Yakovenko 和 Raj Gokal、Morning Brew 首席执行官兼联合创始人 Austin Rief(约旦)在 Figma 从事人工智能工作的 Singer 和 Google 高级产品经理 Logan Kilpatrick。Friend计划以99美元的价格接受预订,预计于2025年1月发货。 机器人公司洛必德获得 B+ 轮投资 洛必德是一家机器人研发与运营商,核心产品为服务机器人,公司致力于构建机器人工程师文化, 研发机器人,提供机器人有关的服务。盈科资本投资成员企业洛必德科技宣布完成B+轮融资。此轮融资将进一步推动公司在自动驾驶和人形机器人的技术研发和产业化进程。 AI 数据提供商 Deepnote 收购 Hyperquery Deepnote 是一家位于加利福尼亚州旧金山的人工智能数据工作区提供商,收购了位于加利福尼亚州旧金山的数据科学和分析领域竞争对手 Hyperquery。交易金额并未披露。Deepnote 正在将 Hyperquery 的功能和客户集成到其人工智能驱动的数据笔记本中。 Airtable 收购 AI 人才入职初创公司 Dopt Airtable 收购 Dopt,后者专注于帮助初创公司为新用户提供产品入门体验。Dopt 近期推出了多项功能,使得用户能够将人工智能辅助工具集成到服务中,这也是 Airtable 收购的主要原因。Dopt 团队将加入 Airtable 的 AI 组。Airtable 正专注于人工智能,并推出了 Airtable Cobuilder,允许用户通过描述创建应用程序 (欢迎添加微信AIyanxishe2,了解更多AIGC、融资情况,与志同道合的朋友一同畅聊时新AI产品) 02 今日大厂风闻 OpenAI向部分用户开放GPT-4o语音模式,今秋将扩大至所有付费用户 OpenAI宣布开始向部分ChatGPT Plus用户推出GPT-4o的语音模式。据OpenAI介绍,高级语音模式能提供更自然的实时对话,允许用户随时打断,并能感知和响应用户的情绪。实时响应和可打断对话是目前语音助手公认的技术难点。语音模式将于今年秋季向所有ChatGPT Plus用户开放,初期的功能将比较有限。 阿里通义免费开放奥运AI大模型 阿里通义宣布免费开放奥运AI大模型。据了解,此模型具备奥运专业知识与翻译功能。即日起用户可以在通义App免费使用。今年,巴黎奥运会是AI应用最广泛的一届奥运会。阿里巴巴的云计算和AI技术,正在全面支撑奥运转播和赛事运营。 周鸿祎宣布 360 安全大模型免费 周鸿祎称 360“要把大模型拉下神坛”,不希望大模型成为少数厂商奇货可居赚钱的工具,让每个企业都“用得起、用得好”。当前,360 全线安全产品已集成安全大模型的能力,对所有购买 360 标准产品的用户免费提供大模型标准能力,产品加量不加价。 快手可灵AI官方打假:目前没有APP 7月31日,快手官方发布“可灵AI打假声明”称,可灵AI目前没有App,更未在任何一家应用商店和网站上线可供下载的App,凡是标着“可灵AI”、暗示为可灵AI官方或得到官方授权的App都是假的。 百度飞桨 PaddleX 3.0-beta 昇腾版发布,支持多场景、低代码开发 PaddleX3.0-beta昇腾版是由飞桨推出的端云协同低代码开发工具,旨在帮助开发者以低成本和零门槛的方式解决产业中的实际问题。PaddleX3.0-beta昇腾版提供了便捷的开发范式,开发者无需深入了解底层原理,通过统一的命令和配置即可完成数据校验、训练、评估、推理等不同任务。此外,PaddleX还支持快速模型优化,暴露了关键超参数供开发者调整。训练好的模型可以通过简单的Python API集成到项目中。 国内首个亿级参数地震波大模型”谛听”在成都发布 谛听地震波大模型由国家超级计算成都中心、中国地震局地球物理研究所和清华大学共同开发,它拥有亿级参数,是国内首个、国内外最大规模的地震学专业 AI 训练数据集之一。该模型经过半年多的研究,已经可以投入使用,并且预计将于 2024 年 8 月完成十亿参数量级的版本预训练。此外,该模型已显著提升了地震信号的识别准确率和速度,对于突破中小地震波模型性能瓶颈、提高地震大数据智能处理能力具有重要意义。 此芯科技发布异构AI PC芯片,布局端侧AI生态 此芯 P1 采用 6nm 制造工艺,具备 AI 异构计算资源、全方位的安全引擎、多样化的外设接口以及多操作系统支持等特性。此芯科技的 “一芯多用” 战略旨在构建端侧 AI 生态,面向全球与本土双市场,打造新一代 AI PC 算力底座,支持混合人工智能部署。 03 今日产品动态 GitStart AI Ticket Studio 旨在通过AI来简化和优化软件开发过程中的 Bug 报告和功能请求。它能够自动化地生成详细、清晰的工程票据,减少沟通成本,提高开发效率。该工具集成了自然语言处理和机器学习技术,可以理解开发者和项目经理的描述,然后转化为标准化的、易于理解的任务描述。用户可以通过简单的描述来启动这个过程,AI 将自动填充必要的细节,包括问题的重现步骤、相关截图和日志,以及可能的解决方案。这样的工具对于提升团队协作和加速软件迭代至关重要。 🔗 https://gitstart.com/?ref=producthunt 1.Midjourney V6.1版本上线,优化远景人脸,细节更丰富 Midjourney V6.1 版本的上线带来了多项重要更新,包括图像连贯性的突破、画质的全面提升、微观细节的精准把控等。在处理复杂结构如人体和动植物时,表现出色,尤其是在细节如手臂、腿部和手掌的自然流畅表现上。新版本在减少像素伪影、增强纹理表现力方面取得了显著进展,特别是在皮肤质感和 8bit 复古风格的呈现上。标准图像任务的处理速度提升约 25%, 能更准确地生成文字,可以调用旧任务中的个性化模型和数据。 🔗 discord.gg/midjourney 2.RenderNet推出自动配音功能 Narrator RenderNet推出新的 Narrator 功能。用户上传自己的视频,并添加相应的脚本,系统将自动帮助角色与脚本中的话语进行口型同步。 🔗 https://rendernet.ai/ 04 特别关注 苹果公布一篇 47 页的论文,详细介绍了自家开发的两个基础语言模型 AFM-on-device,参数约 30 亿,以及更大的服务器端模型 AFM-server。论文中详细描述了模型的基于 Transformer 的密集解码器架构,以及进行的多项优化设计,旨在提高效率。训练过程包括核心预训练、持续训练和长上下文训练三个阶段,使用了多样化的高质量数据。后训练优化则采用了监督微调和基于人类反馈的强化学习来提升模型能力。此外,论文还提供了评估结果,展示了模型的性能。 🔗https://machinelearning.apple.com/papers/apple_intelligence_foundation_language_models.pdf

代码生成三问:如何打造 24 小时在线的 AI 程序员?

作者丨张进 编辑丨陈彩娴 2024 年年初,拥有编程全栈技能的 Devin 惊艳全球,让外界看到了 AI 改变一个行业——替代程序员的可能性。 Devin 发布数周后,其背后的公司 Cognition 也随即获得 1.75 亿美元融资,估值从 3.5 亿美元一跃升至 20 亿美元。紧接着,4 月,一家 AI 编码辅助创业公司 Augment 宣布完成 2.52 亿美元的融资,投后估值接近独角兽,代码生成赛道的多米诺骨牌效应开始出现…… 到上半年,硅谷代码生成类的公司估值起步价已经高达 2 亿美金,头部公司甚至 20 亿美金。而据一位行业人士分析,代码生成的概念之所以受到追捧,其中一个重要原因是“人类的数据不够用了”。 AGI 时代的一个重要组成是人类必须依靠机器生成的数据,而代码生成的数据被部分从业者认为是“人类通往 AGI 过程中最有逻辑性与严谨的数据”。 与此同时,网络上为大模型代码生成提效欢呼的声音越来越多。例如,一位中国开发者就提出,Claude 3.5 Sonnet 只要 500+ 行的 html 就能实现一个不错的功能;还有开发者称,其借助 GPT-4o 辅助代码写作,以前开发小程序需要一个月,现在只需要七天…… 根据开发者的反馈,大模型的代码生成能力正在真切地提升每位开发者的工作效率。 事实上,程序员对于“AI 代码生成”的想象早有年头。在这波生成式 AI 浪潮之前,市场上就已出现一系列的 AI 编程工具,例如 Tabnine、Kite 等,但受限于它们的技术路径,过去的产品对于上下文逻辑的理解和代码生成的质量不尽人意。 清流资本合伙人刘博告诉 AI 科技评论,AI 编码工具的其中一个效果评估指标是代码文件中由模型生成的代码占比,上一代工具只能做到 10-20%,而新一代的 AI 编程工具最高可以做到 40-50%——这是质的飞跃,同时新一代工具对编程上下文的理解也显著更好。 微软 CEO 称,两年前上线的 AI 编程工具 GitHub Copilot(后接入 GPT-4 模型后更名为“Copilot X”)已经开始获利、并拥有 180 万付费订阅用户。 迄今大模型狂飙一年半,在所有基于大模型的新 AI 工具中,coding 场景的 PMF 和付费意愿最先被验证,GitHub Copilot 仅用 14 个月便达到了 1 亿美元 ARR,是历史上增长最快的 SaaS 产品——这与其他场景里昙花一现的 AI 产品形成鲜明对比。 几乎所有的通用大模型公司都推出了代码大模型和 AI 编程助手,如 OpenAI codex、Meta Code Llama、智谱 CodeGeeX、百度的 comate、腾讯云的 AI 代码助手、DeepSeek Coder…… 国内创业公司也开始增多:一站式 DevOps 研发管理平台 Coding 创始人张海龙创立了 AI Agent 公司 Babel,企业智能化软件开发解决方案提供商 aiXcoder 也因此受到资本关注、并在2023年迅速完成了 A+ 轮融资。 多方势力角逐,创业公司在混乱中争取生机,而创业公司、通用大模型公司、科技大厂各方仍然面临 AI 领域发展的通用问题:To C 还是To B,技术路径选择通用大模型还是垂直模型,要不要自研模型,以及如何在 GitHub Copilot 的笼罩下突围。 值得注意的是,受限于底层技术大模型的能力,目前各种 AI 编程产品仍然集中于 coding 阶段,在代码补全和代码生成两个场景 PK,所以本质上,现在的 AI 编程产品依然是 AI coding。 但尽管如此,“24 小时 AI 程序员”的生产力仍然让所有人着迷。 为什么对 coding 情有独钟? 当前大多数 AI coding 产品主攻代码补全和代码生成两个高频场景。 软件开发的智能化最开始就是从代码生成和代码补全开始的。因为技术容易实现,不会颠覆程序员的开发模型,代码补全是整个行业做的比较成熟的功能,不管是大厂还是初创公司,产品都能用起来,且正确率较高。 在一个已有的项目中根据上下文去增加新功能叫代码补全,即开发者用自然语言表达一个需求,用代码生成。代码生成现在正处于从文件级代码到项目级代码的突破。 代码生成还处于初级阶段,简单的函数能生成得比较好,但并不是完全靠大模型,需要外挂一些知识库配合,不能达到100%准确,若再想扩展到一个文件级的代码生成,难度则会增高,往仓级别的难度会更高,而 Devin 展示的就是往仓级别去实现。 一位研究代码智能的专家告诉 AI 科技评论,代码补全现在是兵家必争之地,是已经真正落地、也是程序员使用最多的场景。相对来说,代码生成功能的使用频率相对少一些,目前要真正融入到日常的开发成为高频选项还有一些距离,原因是代码生成需要改变程序员的开发模式、开发习惯。 代码生成目前依然是通过跟一个对话机器人对话,用自然语言表达需求来让大模型生成一段代码,在这个过程中不断交互、表达需求,需求表达地越清晰、生成的代码越准确。 这过程中涉及到需求拆解。将一个大的需求拆解成一个个的小任务,再去生成,需求拆解对于当前大模型来说还有难度。 同时,由于编程思维跟自然语言表达是两回事,对于开发者来说,一个人代码写的好,并不意味着用自然语言表达业务逻辑好,它需要具备两方面的能力。一是要熟悉业务,二是要扎实的计算机理论知识,包括算法,操作系统,软件工程,计算机安全等,这其实对开发者的个人素养提出了很高的要求。 除了代码补全和代码生成两个高频场景,其他产品寻求差异化的出口是提供代码注释、代码解读、代码 bug 修复、代码优化、漏洞检测等能力。 例如国内智谱 CodeGeeX 便开发了独有的功能,例如去年年底推出的工具箱,就是基于模型具备Code Interpreter代码解释器能力,可以批量处理多种格式的文件、批量实现数据可视化、绘制数学函数图等。 CodeGeeX 负责人郑勤锴认为,在这些事情上为开发者节省了时间,开发者就能将工作更多放在顶层设计上——怎么把代码的架构设计地更好、功能考虑地更完善,从而提高软件的质量。 智谱在2022年就完成了CodeGeeX代码大模型的训练,并同时推出了 CodeGeeX插件产品。 跟GitHub Copilot 一样,CodeGeeX定位是智能辅助编程,但辅助也分为不同层级,目前已经从单个文件辅助拓展到了项目级辅助编程,因为实际开发场景中不可能只有单文件,大多都是多文件。 CodeGeeX负责人郑勤锴称,往项目级拓展的挑战在于项目生成的成功率,因为代码项目往往不只是一小段代码或者一个文件的代码组成,而是同时需要完成项目中跨文件的代码理解和生成补全。让模型能充分理解更长的信息,并提取到关键部分,这对模型的要求很高。 对于参数量10B以下的代码大模型,从海量的代码中准确提取信息是一个关键性的挑战。CodeGeeX4支持128K上下文,能够处理和利用更长代码文件、包括项目代码中的信息,是模型更深入理解复杂和细节丰富的代码的关键点。 如何跟 GitHub Copilot 竞争? 一位投资人认为,做 AI 编程助手没人能拼得过 GitHub Copilot。 GitHub Copilot 主要 To C,面向个人开发者定价每月 10 美元(约 66.9 元人民币)或每年 100 美元(约 669 元人民币)。 To B 企业用户月费 39 美元,企业用户可以将代码部署到云端,而不必在本地反复克隆;企业用户可以内建知识库,形成个性化的Copilot Chat(在原有Copilot的基础之上,开发者可以直接用自然语言和Copilot对话来解决遇到的问题),甚至是对底层模型进行微调。 除了占据时间上的先发优势,GitHub Copilot 拥有两大先天优势,一是背靠拥有上亿开发者的代码托管平台 GitHub,二是底层接入的是 OpenAI 最强的模型。 站在今天来看,微软对开发者市场的战略一直很清晰:2015 年推出跨平台代码编辑器 VScode,从用户侧统一IDE;2018 年收购 GitHub,拥有大量代码数据(包括商用的未公开的数据);2019 年,微软向 OpenAI 投资了 10 亿美金,并获得了 OpenAI 技术的商业化授权。 于是,在 2020 年 OpenAI 推出了 GPT-3 后,拿着最多的代码数据去训练模型,隔年 AI 编程工具 GitHub Copilot被推出,成为全球最早一款大模型 AI 编程工具,抢占了先发优势。 今年 4 月微软 CEO 称 GitHub Copilot 已经拥有 180 万付费订阅用户。 但也有多位从业者认为 GitHub Copilot 并非能一统天下。 “对于国内市场而言,商业化机会在 B 端。”清流资本合伙人刘博告诉 AI 科技评论。 首先,AI 编程产品面向的中大型企业 B 端市场大概是几十亿人民币的规模,用户付费意愿非常明确,这一市场规模和客单价在软件服务市场上已经比较客观。 对于国内 B 端用户而言,他们有两个需求是 GitHub Copilot 无法满足的:1)模型本地部署,如果云端调用 GitHub Copilot 会有代码泄露的风险同时本地部署后可以根据客户的私有代码进一步训练,显著提升代码生成的效果;2)大客户需要选择国内的产品作为供应商,避免数据外流。 照着以上标准来找标的,清流资本在去年 9 月参与了国内面向企业的智能化软件开发解决方案提供商 aiXcoder A+ 轮投资。 跟 GitHub copilot 不同,aiXcoder 聚焦 To B,为企业提供基于代码大模型的智能化软件开发解决方案,包含私有化部署、企业领域知识与大模型融合、定制化开发等服务。 清流资本合伙人刘博告诉 AI 科技评论,B 端市场的打法是当公司在一个行业里已经渗透了足够多的客户后,就能成为 AI Coding工具实质上的行业标准,成为行业里其他企业采购 AI Coding 工具时必须邀请参与竞标的供应商。 因此从国内的商业化角度出发,先发优势和聚焦很重要。 aiXcoder孵化自北京大学软件工程研究所,在2013年就开始研究深度学习跟代码结合,早在 2022 年 6 月便发布了中国首个百亿级参数的代码大模型 aiXcoder-13B,能够支持方法级(函数级)的代码补全。 aiXcoder COO 李力行认为,代码大模型落地时,如何跟企业的领域知识或者私域知识相结合非常关键,从而保证生成的代码更准确,因为代码生成要用到很多上下文信息,以及一些外部的领域知识,领域知识是指企业的业务逻辑、业务知识等等。 一位资深从业者认为,高质量的数据才是模型能力的区隔。 公开的数据可能有一天终会达到瓶颈,但世界上还有大量的私有数据可能永远不会被公开,它们存在于各个 B 端企业内部,与企业业务逻辑强耦合。aiXcoder 在为客户做本地部署的时候会基于这些私有化数据进行再训练,给每个企业打造专属的代码大模型。 通用大模型还是垂直模型? GitHub Copilot 占据了 C 端优势地位,国内玩家不约而同选择了 C 端免费策略,如智谱 CodeGeeX、百度Comate、腾讯云 AI 代码助手都推出了面向个人开发者的免费工具,这几家厂商跟 aiXcoder 一样、将商业化看向 B 端。 它们共同的思路是拿代码数据在各自的基座大模型上进行预训练或者微调,相同的代码数据来自GitHub和其他可公开访问的源代码,百度、阿里、腾讯这些大厂还有一部分内部代码的积累。 收集数据的方式、选取数据的类型、训练的方法……整个训练过程多个环节的差异导致各个代码模型效果各异。 例如智谱 CodeGeeX 推出一体机的模式,开箱即用,提供完善的软硬件和使用方式,特点是可以结合企业内部的代码仓库、知识库来加强代码能力,优势是代码是私有化安全的。 企业更关注怎么跟企业内部的代码、数据文档做结合,在模型训练阶段对这些代码并不了解,包括企业内部自己定义的 API 接口等等。 为了让模型更懂企业的代码,CodeGeeX 提供了几个方向:定制化的微调方案,在企业内部去用它们自己的代码去对模型进行强化,还包括 RAG 检索增强方案,即把企业代码和文档作为知识库来辅助预测。 有投资人并不看好创业公司做代码大模型,他们认为 AI Coding 这块未来依然是通用大模型公司的事情,大模型公司更擅长做这件事,创业公司很难产生差异化,而且竞争对手太多了。 而且,软件 To B 一直面临的问题是国内 B 端客户用不起,这是国内 SaaS 一直没做起来的原因之一。 的确,根据开发者的反馈,如 GPT-4o、Claude 3.5 Sonnet 这样的通用大模型现在也能保持不错的代码效果。 一位从业者认为,未来可能会有一个在所有模态上都很强的六边形战士模型,但真正从B端商业化落地来看,不太有太多公司有能力本地部署这样一个参数量巨大的六边形战士模型,市场仍然需要一个代码垂直模型。 那么创业公司如何跟大厂竞争? 大厂在理论上可以做所有的事情,但: 首先,大厂需要在所有能做的事情里去选择以及决定对应的资源调配,对于大厂而言,有太多方向可以得到比单个 B 端 coding 场景更多的资源,比如通用大模型、AGI 等,而创业公司 100% 聚焦在一件事上; 其次,在垂直场景里,大厂的认知不一定比创业公司更深。B 端 AI coding是一个非常垂直且专业的场景,在大模型的基础上仍然需要大量进阶的代码 knowhow 和对客户需求的深度洞察。 aiXcoder COO李力行认为,首先需要通过全流程的数据治理和个性化训练,使大模型能够深刻理解并掌握企业领域知识,落地企业专属代码大模型;随后,利用多 agent 等方式结合传统软件开发工具和方法,高效地解决企业复杂的软件开发任务。 Agent 是趋势 软件开发是一个复杂的系统工程,coding只占其中很少的部分,还涉及到需求理解、debugging、优化、部署等多个环节。而以 GitHub Copilot 为首的 AI 编程辅助产品现在只能写点“函数砖头”,砌墙的事还得程序员亲自来。 但 Devin 的出现满足了外界对 AI 软件开发的想象力,不止于 coding 阶段。 在 3 月初创公司 Cognition 的 demo 演示中,Devin 化身为一个拥有“全栈技能”的AI程序员,一个能够独立完成任务的自助系统,在快速原型设计、修复bug和复杂数据的可视化上表现优秀。 从交互上,Devin 带来了一种新的AI软件开发形态,包括命令行、浏览器等组件,是第一个脱离 IDE 的软件开发形态。从实际任务上,Devin 愿景是完成整个软件开发的需求任务,这种能完成更复杂开发任务的 Agent 已经成为业内确定的产品趋势。 而 Devin 则被称为 Agent 的“ChatGPT 时刻”。 一位 AI Agent 创业者赵聪认为,issue level 的 coding 都需要用 Agent 来实现,解决的是更复杂的问题,自动解 issue。issue 等同于文件级的代码,而现在的代码生成、补全都是在单文件上,解 issue 往往是针对整个项目,拥有多个文件。 aiXcoder COO 李力行看好 Agent 在软件开发领域的应用,他认为多 Agent 协作也让全流程代码生成等更加复杂的开发任务成为可能。在2024年, aiXcoder 推出基于Agent技术的智能化软件开发系统2.0,通过大模型+软件开发工具调用解决企业项目级代码生成问题,确保复杂开发场景下代码生成的高效性、准确性和可靠性。 Devin 想要去解决一个问题,或者说修改一个仓密度的代码,大家都在朝着 Devin 的方向做探索,但大模型能力现在几乎还达不到。目前 Agent 还处于探索、实验阶段。 距离 Devin 发布已经过去五个月,依然没有任何更进一步的消息。其 CEO Scott 也透露,他们尚无明确的公开预览(public preview)时间表,目前仍在内测阶段,即无确定的产品形态。 CodeGeeX 负责人郑勤锴则认为,Agent 只是实现某个功能的路径,现在的 Agent 很多只是简单的工具调用。重要的还是看最终实现的功能,能达到多高的可用性。 赵聪认为未来的创业机会在 AI Agent,因为 AI 编程赛道上 Copilot 微软已经做了,很难再与之竞争,所以只能往前走,即直接替代人。开发者平时很多工作都类似于拿着螺丝刀拧螺丝,Copilot 就是把螺丝刀换成了电钻,而 AI 程序员则是给开发者配个小弟,所以 Copilot 依然是个好工具,但 AI 程序员就是生产力,这是完全不同的两件事。 但做 AI 程序员不是科学问题,而是个工程问题。这里涉及路径选择的问题,在做 AI 程序员时有公司是自己做模型,赵聪认为这是错误的路径,他不相信所谓的小模型/垂直模型,觉得模型就只有大模型,因为只有大模型能带来智力。 未来面临的挑战是,所有人都要往 project level coding 走,要依赖底层模型的进化,但模型太贵。赵聪认为GPT-4 至少得再降价 10 倍,才具有真正的可能性。 在软件工程中,AI 难以解决的两大问题是:1)复杂项目的业务上下文理解。2)每家公司独特的工程架构、逻辑和实践。在解决这两个问题之前,AI Agent 还无法完全替代人类程序员。 但多位从业者一致认为,随着 AI 不断进化,未来高级程序员不会被替代,拧螺丝的初级程序员被替代已经能看到,未来程序员的培养路径也跟现在不一样,就像高科技种地,不需要真的从种地开始学,而是先从学习使用工具开始。 未来 C 端应该更好地服务普通人,而不仅仅是开发者,如果普通人也能通过 AI 实现编程,那么 C 端有可能完成一次爆发,而这需要更强的模型能力,端到端仍然需要 Agent 来实现。 但可以肯定的是,未来程序员逐渐都会离不开 AI 编程工具。