Skip to content
AI资讯
AI大模型
AI营销
标签:
OpenAI
OpenAI开发ChatGPT「反作弊神器」,99.9%超高命中率!但没发布
OpenAI又左右互搏上了,给AI生成的文本打水印,高达99.9%准确率抓「AI枪手」作弊代写。 去各大高校图书馆转一圈,会发现头上一副耳机、手边一杯咖啡,电脑上一个AI工具网页几乎成了当代大学生标配。 学生热衷于在ChatGPT的帮助下完成作业,教师们却头疼于无法杜绝学生用ChatGPT作弊的行为。 人工智能可以根据一个提示,在几秒钟内免费创建整篇论文或研究论文。教师和教授表示,他们迫切需要帮助来打击滥用行为。 《每日邮报》2023年1月30报道称,UNSW的1名学生使用ChatGPT自动生成论文被抓,这也是全澳第一个使用AI技术作弊被抓的学生。 UNSW人工智能教授Toby Walsh表示,各大高校都在评估如何阻止学生使用AI技术作弊。 随后,新州、昆州和塔州都封锁了校园网络对于ChatGPT的访问,以防学生通过该技术作弊。 但Walsh教授表示,阻止校园网络访问ChatGPT是没有意义的,因为学生们可以通过代理绕过封锁。 「想要彻底阻止学生作弊,只能把他们放在一个没有网络的环境里,给他们一张纸和一支笔。」 CDT最近进行的一项调查发现,59%的中学教师确信有些学生使用了AI来帮助完成学业,比前一个学年上升了17个百分点。 要想靠老师和学校的盯梢,避开ChatGPT的诱惑很难办到,解铃还须系铃人——让AI企业亲自出马解决抓「AI枪手」。 据悉,OpenAI已经开发出一款能够高精度识别ChatGPT生成文本的工具,但迟迟未发布。 「文本水印」抓作弊,成功率99.9% ChatGPT由人工智能系统提供支持,生成原理是根据输入内容预测句子中接下来出现的token。 OpenAI正在讨论的反作弊工具将稍微改变token的选择方式,这些变化会留下一种称为水印的图案。 这些水印肉眼无法察觉,但可以通过OpenAI的检测技术发现,检测器提供整个文档或部分文档由ChatGPT编写的可能性的分数。 根据内部文件,当ChatGPT创建足够多的新文本时,水印的有效率可以达到99.9%。 虽然准确率超高,OpenAI工作人员仍然担心,换一种方式可以轻松卡Bug,通过简单的技术来删除水印。 例如让Google将文本翻译成另一种语言,然后再翻译回来,或者让ChatGPT在文本中添加表情符号,然后手动删除它们。 另一方面,公司内部普遍认为,谁可以使用该探测器将也是一个棘手的问题。 如果拥有该工具的人太少,工具基本上就没有用处。如果太多人获得访问权限,有些人可能会尝试破译水印技术。 OpenAI员工也讨论过,直接向教育工作者或外部公司提供检测器,帮助学校识别人工智能撰写的论文和抄袭作品。 谷歌其实也开发过一种水印工具,可以检测Gemini AI生成的文本,叫做SynthID,正处于Beta测试阶段,尚未广泛使用。 OpenAI有一个工具可以确定图像是否是使用文本到图像生成器DALL-E 3创建的,该工具于去年春天发布用于测试。 该知情员工表示,该公司优先考虑音频和视频水印而不是文本,因为其危害更为严重,尤其是在美国繁忙的选举年。 AI文本分类器 早在2023年1月,OpenAI就发布了一种算法,旨在检测多个AI模型(包括其自己的模型)编写的文本。 但它的成功率仅为26%,七个月后OpenAI就将其撤回。 其他公司和研究人员还开发了一些工具来检测人工智能创建的文本,许多教师表示他们已经使用过这些工具。 但它们有时无法检测由高级大语言模型编写的文本,并且准确率很低,可能产生误报。 最近在佐治亚州一所私立高中任教的教育工作者人工智能顾问Mike Kentz表示,起初,学生们确实被震慑到,以为老师们已经完全掌握了一种方法,可以弄清楚他们是否使用了人工智能代写。 但到了年底……他们慢慢发现,等一下,我的老师好像不知道。 一些老师鼓励学生使AI来帮助研究或提供想法反馈。但问题是,当学生使用像ChatGPT这样的应用程序来完成所有工作时,学生甚至不会去检查自己交的是什么。 去年,犹他大学政治学教授Josh McCrain给学生布置了一份写作作业,作业要求插入了难以辨认的小文字,其中提到了和作业无关的蝙蝠侠。 如果他们将作业复制并粘贴到人工智能中,作业提示内容就会被合并,「蝙蝠侠」就会干扰作业内容。果然,少数学生提交了作业——一篇蝙蝠侠论文。McCrain教授正在调整写作作业,更多地关注人工智能不太熟悉的时事,并恳求学生不要将他们的工作外包给人工智能。「这就是我试图向学生们强调这一点的地方:你需要自己学习这些东西。」McCrain教授说。 争论不休 知情人士称,有关水印工具的讨论早在OpenAI于2022年11月推出ChatGPT之前就已经开始。 它是由计算机科学教授Scott Aaronson开发的,过去两年他在德克萨斯大学休假期间一直在OpenAI从事安全工作。 2023年初,OpenAI联合创始人之一John Schulman在一份共享的Google文档中概述了该工具的优缺点。 OpenAI高管随后决定,在采取进一步行动之前,他们将征求一系列人士的意见。 在接下来的一年半时间里,OpenAI高管反复讨论,并寻求新数据集优化算法,犹豫是否发布该技术。 内部文件显示,2023年4月,OpenAI委托进行了一项调查,结果显示,世界范围的人们以四比一的比例支持人工智能检测工具的想法。 同月,OpenAI对ChatGPT用户进行了调查,发现69%的人认为作弊检测技术会导致使AI技术错误指控。 近30%的人表示,如果ChatGPT部署了水印功能,而竞争对手没有部署水印,他们会减少使用。 另外,OpenAI内部还有一种反对的声音是反作弊工具可能会损害ChatGPT的写作质量。 知情人士称,OpenAI今年早些时候进行了一项测试,发现文本水印不会降低输出质量。 6月初,OpenAI高级员工和研究人员再次聚会讨论该项目。该组织一致认为水印技术效果良好,但去年的ChatGPT 用户调查结果仍然是一个头疼的问题。 内部文件显示,OpenAI需要在今年秋天之前制定一项计划,围绕AI透明度以及相关潜在新法律来左右公众舆论—— 「如果做不到这一点,我们就有可能失去负责任企业的信誉。」 参考资料:https://www.wsj.com/tech/ai/openai-tool-chatgpt-cheating-writing-135b755a?mod=tech_lead_story
谷歌终于赢了OpenAI一回:实验版本Gemini 1.5 Pro超越GPT-4o
这么强的模型,谷歌给大家免费试用。 近两日,谷歌在不断发布最新研究。继昨日放出最强端侧 Gemma 2 2B 小模型后,刚刚,Gemini 1.5 Pro 实验版本 (0801) 已经推出。 用户可以通过 Google AI Studio 和 Gemini API 进行测试和反馈。 既然免费,那我们帮大家测试一下最近比较火的比大小问题。当我们问 Gemini 1.5 Pro (0801) 9.9 和 9.11 哪个数大时,模型一次就能回答正确,并给出了理由。 当我们继续追问「Strawberry 单词里面有多少个 r」时,然而 Gemini 1.5 Pro (0801) 却翻车了。在提示语中施加「咒语」一步一步来,模型分析到第四步就出错了。 Google AI Studio 测试地址:https://aistudio.google.com/app/prompts/new_chat 不过,从官方评测来看,Gemini 1.5 Pro (0801) 各项指标还是很能打的。新模型迅速夺得著名的 LMSYS Chatbot Arena 排行榜榜首,并拥有令人印象深刻的 ELO 分数,得分为 1300。 这一成就使 Gemini 1.5 Pro (0801) 领先于 OpenAI 的 GPT-4o(ELO:1286)和 Anthropic 的 Claude-3.5 Sonnet(ELO:1271)等强大竞争对手,这或许预示着人工智能格局的转变。 Gemini 团队关键成员 Simon Tokumine 称 Gemini 1.5 Pro (0801) 是谷歌迄今为止制造的最强大、最智能的 Gemini (模型)。 除了拿到 Chatbot Arena 榜首,Gemini 1.5 Pro (0801) 在多语言任务、数学、Hard Prompt 和编码等领域也表现相当出色。 具体而言,Gemini 1.5 Pro (0801) 在中文、日语、德语、俄语方面均表现第一。 但在编码、Hard Prompt 领域,Claude 3.5 Sonnet、GPT-4o、Llama 405B 仍然处于领先地位。 在 win-rate 热图上:Gemini 1.5 Pro (0801) 对阵 GPT-4o 的胜率为 54%,对阵 Claude-3.5-Sonnet 的胜率为 59%。 Gemini 1.5 Pro (0801) 在 Vision 排行榜上也第一! 网友纷纷表示,谷歌这次真是出乎所有人的预料,没有提前官宣就突然开放测试最强模型,这次压力给到了 OpenAI。 虽然 Gemini 1.5 Pro (0801) 取得了很高的成绩,但它仍处于实验阶段。这意味着该模型在广泛使用之前可能会进行进一步的修改。 网友评测 有网友对 Gemini 1.5 Pro (0801) 的内容提取能力、代码生成能力、推理能力等进行了测试,我们来看下他的测试结果。 来源:https://x.com/omarsar0/status/1819162249593840110 首先,Gemini 1.5 Pro (0801) 的图像信息提取功能很强,例如输入一张发票图像,将发票细节用 JSON 格式编写出来: 再来看下 Gemini 1.5 Pro (0801) 的 PDF 文档内容提取功能,以经典论文《Attention Is All You Need》为例,提取论文章节目录: 让 Gemini 1.5 Pro (0801) 生成一个帮助学习大型语言模型(LLM)知识的 Python 游戏,该模型直接生成了一整段代码: 值得一提的是,Gemini 1.5 Pro (0801) 还给出了详细的代码解释,包括代码中函数的作用、该 Python 游戏的玩法等等。 这段程序可以直接在 Google AI Studio 中运行,并且可以试玩,例如做道关于 Tokenization 定义的选择题: 如果觉得选择题太简单无聊,可以进一步让 Gemini 1.5 Pro (0801) 生成一个更复杂的游戏: 得到一个 LLM 专业知识句子填空游戏: 为了测试 Gemini 1.5 Pro (0801) 的推理能力,网友提问了一个「吹蜡烛」问题,但模型回答错误: 尽管有一些瑕疵,但 Gemini 1.5 Pro (0801) 的确表现出接近 GPT-4o 的视觉能力,以及接近 Claude 3.5 Sonnet 的代码生成和 PDF 理解、推理能力,值得期待。 参考链接: https://www.youtube.com/watch?v=lUA9elNdpoY https://x.com/lmsysorg/status/1819048821294547441
星尘智能获数千万美元融资,专注 AI 机器人商业化;OpenAI 部分开放 GPT-4o 语音,今秋扩至所有付费用户
01 今日融资快报 人形机器人星尘智能获数千万美元 Pre-A 轮融资,专注 AI 机器人商业化 AI机器人公司星尘智能(Astribot)宣布完成数千万美元Pre-A轮融资,由经纬创投领投,道彤投资及清辉投资等产业资本跟投,老股东云启资本跟投。华兴资本担任独家财务顾问。 星尘智能于2022年12月在深圳成立,致力于让数十亿人拥有AI机器人助理。公司专注研发“新一代最强AI机器人助理”,能像人一样学习、思考和劳动,与人流畅智能交互,会使用人的工具和设备、帮人完成枯燥、困难或危险的任务。(Z Potentials) Figma 完成 F 轮融资,多家知名投资方参与投资 界面设计工具提供商Figma宣布完成F轮融资。本轮融资由a16z、Alkeon Capital、Atlassian、Coatue、Durable Capital Partners、Fidelity Management and Research Company、Franklin Venture Partners、General Catalyst、Iconiq Capital、KPCB、SurgoCap、Thrive Capital、XN和红杉资本(海外)等多家知名投资方共同参与。 供应链可视化初创公司 Altana 在 C 轮融资中筹集了 2 亿美元 这家总部位于纽约的初创公司提供了所谓的“价值链管理系统”,该系统使企业能够通过人工智能洞察其供应链。本轮融资使 Altana 的估值达到 10 亿美元。 此轮融资由美国创新技术基金 领投,该基金是由前传奇娱乐首席执行官、后来成为科技投资者和企业家的Thomas Tull创立的风险基金。其他投资者包括 Salesforce Ventures、Google Ventures、March Capital、Omers Ventures、Friends and Family Capital 和 Activate Capital。 保险业 AI 解决方案提供商 Gradient AI 获 5600 万美元 C 轮融资 Gradient AI是一家保险业AI解决方案提供商,主要利用高级数据分析和机器智能来解决保险业和医疗保健行业中的问题。本轮投资由Centana Growth Partners牵头,现有投资者MassMutual Ventures、Sandbox Insurtech Ventures和Forte Ventures参与了此次投资。 医疗软件服务提供商 VitalHub 以 3400 万美元收购 MedCurrent 医疗保健软件和服务提供商VitalHub Corp.宣布收购临床决策支持公司MedCurrent Corporation。该交易价值3400万加元。此次收购将整合MedCurrent的人工智能驱动的OrderWise平台,该平台优化诊断测试并减少不必要的测试,以及VitalHub的患者流程软件。 AI 和物联网解决方案提供商 Trio Mobil 获 2650 万美元种子轮融资 Trio Mobil是一家人工智能和物联网解决方案提供商,致力于提高工作场所的安全性和效率,提供一套强大的解决方案,可满足设施和仓库内部物流以及高速公路运营的安全和效率要求。公司通过其专门的增长股权战略NewSpring growth获得了由NewSpring领投的2650万美元增长融资,现有投资者212和TIBAS Ventures也参与了本轮融资。 AI 治理软件 Credo AI 获 2100 万美元融资 Credo AI 的使命是让组织能够负责任地大规模构建、采用、采购和使用人工智能。Credo AI 的开创性人工智能治理、风险管理和合规平台可帮助组织衡量、监控和管理人工智能风险,同时确保遵守新兴的全球法规和标准,例如欧盟人工智能法案、NIST 和 ISO。 本轮融资来自 CrimsoNox Capital、Mozilla Ventures 和 FPV Ventures,现有投资者 Sands Capital、Decibel VC、Booz Allen Hamilton 和 AI Fund 也参与其中。这使得该公司的融资总额达到 4130 万美元。 软件供应链管理初创公司 Lineaje 筹集 2000 万美元 软件供应链管理初创公司 Lineaje 今天宣布,它已经筹集了 2000 万美元的新资金,用于提升其人工智能能力、提供安全的开源软件、降低企业软件维护成本并扩大其全球业务。 Prosperity7 Ventures、Neotribe Ventures 和 Hitachi Ltd. 领投了 A 轮融资,Tenable Ventures Inc.、Carahsoft Technology Corp.、Wipro Ventures、SecureOctane、Alumni Ventures Group 以及 ZScaler Inc.、CrowdStrike Holdings Inc. 和 Trellix Inc. 的高管也参与了本轮融资。 企业 AI 平台 Intelmatix 获 2000 万美元融资 Intelmatix是一家深度科技 B2B 初创公司,其目标客户是 MENA(中东和北非)地区希望帮助利用人工智能力量进行决策的企业,该公司已完成 2000 万美元的 A 轮融资。Intelmatix在 2024 年 3 月推出了其企业 AI 平台 EDIX,并已获得了 10 家企业客户。 该公司的 A 轮融资由 Shorooq Partners 领投,其他投资者包括 Olayan Financing Company、Rua Growth Fund 等。 金融科技公司 Aveni 获 1400 万美元的资金 Aveni已获得1400万美元的资金,用于推进AI在金融服务行业的使用。这笔融资将使Aveni与投资者劳埃德银行集团和全国合作开发FinLLM,这是一种金融服务特定的大型语言模型。 专为 ERP 设计的 AI 连接器 Monto 获得 900 万美元种子融资 Monto 是首款专为任何 ERP 设计的 AI 连接器,使 B2B 财务团队能够从企业客户使用的任何 AP 门户无缝获取报酬。该平台将 Monto 客户的 ERP 系统连接到客户的支付平台,并将这些企业带入 B2B 支付的未来,实现一键式付款流程。 此轮融资由 Scale Venture Partners 领投,Verissimo Ventures、F2 Venture Capital、Firsthand Alliance 和 Room40 Ventures 跟投。连续创业者 Ariel Maislos 以及来自 Intuit、Plaid、Salesforce 等公司高管的金融科技天使也参与其中。 AI 基础设施初创公司 Hyperbolic Labs 融资 700 万美元 人工智能基础设施初创公司 Hyperbolic Labs Inc. 表示,该公司已完成 700 万美元的种子轮融资,以改变人工智能开发人员获取计算和推理资源的方式。本轮融资由 Polychain Capital 和 Lightspeed Faction 领投,Chapter One、LongHash、Bankless Ventures、Republic Digital、Nomad Capital、CoinSummer Labs 和 Third Earth Capital 等其他投资者以及 Balaji Srinivasan、Illia Polosukhin、Sandeep Nailwal、Casey Caruso、Tekin Salimi 和 Santiago Santos 等天使投资人也参与了本轮融资。 AI 驱动的金融科技初创公司 Powder 获 500 万美元种子融资 在首席执行官 Kanishk Parashar 的领导下,Powder 创建了用于精确文档分析的 AI 代理,以快速构建提案、汇总外部资产、了解财产并按账户类型、号码、实体、税务状况和资产分类自动组织投资组合。融资支持者包括 YCombinator、General Catalyst、Funder’s Club、Elefund、Litquidity Ventures 和 Script Capital,以及 Jon Xu 和 Bryant Chou。 AI 语音公司 Gnani AI 获 400 万美元 A 轮融资 由 Ganesh Gopalan 和 Ananth Nagaraj 创立,是一家语音优先的生成式人工智能初创公司。在其 A 轮融资中从 Info Edge Ventures 筹集了 400 万美元。Gnani 提供无代码语音优先平台,具有多种产品功能,例如全渠道会话自动化、代理辅助、语音生物识别、全渠道分析等。 AI 解决方案提供商 Axle Automation 获得 250 万美元种子轮融资 Axle Automation是一家合规团队人工智能解决方案提供商,专注于利用生成式人工智能来自动化和增强AML合规流程,该公司专注于简化运营,例如加强尽职调查,从而使金融机构能够有效地扩大其合规工作,通过自动化这些传统上手动且效率低下的流程,旨在减少欺诈、合规风险和运营成本,同时增加收入。Axle Automation宣布其种子轮融资成功结束。本轮融资由 Diagram Ventures 领投,Mistral Ventures、Uphonest Capital、StreamingFast 和其他战略天使投资者参投。 AI 驱动的法律公司 DecoverAI 筹集 200 万美元种子资金 DecoverAI 成立于 2024 年,由首席执行官 Ravi Tandon、首席技术官 Janar Ramalingam 和首席运营官兼首席风险官 Kevin J. Van Horn 领导,是一家法律技术公司,专注于提供人工智能驱动的解决方案,以提高法律专业人士的效率和效果。其目标是建立一个智能人工智能系统,包含现实世界法律工作流程所需的功能,包括发现证据、将其与研究相结合,甚至生成不同的叙述策略来协助法律专业人士。此轮融资由利奥资本领投,其他知名投资者跟投。 AI 伴侣设备 Friend 获 250 万美元融资 Friend由哈佛大学辍学生、曾因创建COVID-19追踪网站获得威比奖的Avi Schiffmann开发。这款项链不用于提高生产力,而是作为一种情感玩具,通过连接到手机并持续监听用户的声音,来提供伴侣式的交流。 Schiffmann 已以 5000 万美元估值筹集了 250 万美元资金,投资者包括 Caffeulated Capital 的 Raymond Tonsing、Z Fellows 创始人 Cory Levy、Perplexity 首席执行官 Aravind Srinivas、Solana 创始人 Anatoly Yakovenko 和 Raj Gokal、Morning Brew 首席执行官兼联合创始人 Austin Rief(约旦)在 Figma 从事人工智能工作的 Singer 和 Google 高级产品经理 Logan Kilpatrick。Friend计划以99美元的价格接受预订,预计于2025年1月发货。 机器人公司洛必德获得 B+ 轮投资 洛必德是一家机器人研发与运营商,核心产品为服务机器人,公司致力于构建机器人工程师文化, 研发机器人,提供机器人有关的服务。盈科资本投资成员企业洛必德科技宣布完成B+轮融资。此轮融资将进一步推动公司在自动驾驶和人形机器人的技术研发和产业化进程。 AI 数据提供商 Deepnote 收购 Hyperquery Deepnote 是一家位于加利福尼亚州旧金山的人工智能数据工作区提供商,收购了位于加利福尼亚州旧金山的数据科学和分析领域竞争对手 Hyperquery。交易金额并未披露。Deepnote 正在将 Hyperquery 的功能和客户集成到其人工智能驱动的数据笔记本中。 Airtable 收购 AI 人才入职初创公司 Dopt Airtable 收购 Dopt,后者专注于帮助初创公司为新用户提供产品入门体验。Dopt 近期推出了多项功能,使得用户能够将人工智能辅助工具集成到服务中,这也是 Airtable 收购的主要原因。Dopt 团队将加入 Airtable 的 AI 组。Airtable 正专注于人工智能,并推出了 Airtable Cobuilder,允许用户通过描述创建应用程序 (欢迎添加微信AIyanxishe2,了解更多AIGC、融资情况,与志同道合的朋友一同畅聊时新AI产品) 02 今日大厂风闻 OpenAI向部分用户开放GPT-4o语音模式,今秋将扩大至所有付费用户 OpenAI宣布开始向部分ChatGPT Plus用户推出GPT-4o的语音模式。据OpenAI介绍,高级语音模式能提供更自然的实时对话,允许用户随时打断,并能感知和响应用户的情绪。实时响应和可打断对话是目前语音助手公认的技术难点。语音模式将于今年秋季向所有ChatGPT Plus用户开放,初期的功能将比较有限。 阿里通义免费开放奥运AI大模型 阿里通义宣布免费开放奥运AI大模型。据了解,此模型具备奥运专业知识与翻译功能。即日起用户可以在通义App免费使用。今年,巴黎奥运会是AI应用最广泛的一届奥运会。阿里巴巴的云计算和AI技术,正在全面支撑奥运转播和赛事运营。 周鸿祎宣布 360 安全大模型免费 周鸿祎称 360“要把大模型拉下神坛”,不希望大模型成为少数厂商奇货可居赚钱的工具,让每个企业都“用得起、用得好”。当前,360 全线安全产品已集成安全大模型的能力,对所有购买 360 标准产品的用户免费提供大模型标准能力,产品加量不加价。 快手可灵AI官方打假:目前没有APP 7月31日,快手官方发布“可灵AI打假声明”称,可灵AI目前没有App,更未在任何一家应用商店和网站上线可供下载的App,凡是标着“可灵AI”、暗示为可灵AI官方或得到官方授权的App都是假的。 百度飞桨 PaddleX 3.0-beta 昇腾版发布,支持多场景、低代码开发 PaddleX3.0-beta昇腾版是由飞桨推出的端云协同低代码开发工具,旨在帮助开发者以低成本和零门槛的方式解决产业中的实际问题。PaddleX3.0-beta昇腾版提供了便捷的开发范式,开发者无需深入了解底层原理,通过统一的命令和配置即可完成数据校验、训练、评估、推理等不同任务。此外,PaddleX还支持快速模型优化,暴露了关键超参数供开发者调整。训练好的模型可以通过简单的Python API集成到项目中。 国内首个亿级参数地震波大模型”谛听”在成都发布 谛听地震波大模型由国家超级计算成都中心、中国地震局地球物理研究所和清华大学共同开发,它拥有亿级参数,是国内首个、国内外最大规模的地震学专业 AI 训练数据集之一。该模型经过半年多的研究,已经可以投入使用,并且预计将于 2024 年 8 月完成十亿参数量级的版本预训练。此外,该模型已显著提升了地震信号的识别准确率和速度,对于突破中小地震波模型性能瓶颈、提高地震大数据智能处理能力具有重要意义。 此芯科技发布异构AI PC芯片,布局端侧AI生态 此芯 P1 采用 6nm 制造工艺,具备 AI 异构计算资源、全方位的安全引擎、多样化的外设接口以及多操作系统支持等特性。此芯科技的 “一芯多用” 战略旨在构建端侧 AI 生态,面向全球与本土双市场,打造新一代 AI PC 算力底座,支持混合人工智能部署。 03 今日产品动态 GitStart AI Ticket Studio 旨在通过AI来简化和优化软件开发过程中的 Bug 报告和功能请求。它能够自动化地生成详细、清晰的工程票据,减少沟通成本,提高开发效率。该工具集成了自然语言处理和机器学习技术,可以理解开发者和项目经理的描述,然后转化为标准化的、易于理解的任务描述。用户可以通过简单的描述来启动这个过程,AI 将自动填充必要的细节,包括问题的重现步骤、相关截图和日志,以及可能的解决方案。这样的工具对于提升团队协作和加速软件迭代至关重要。 🔗 https://gitstart.com/?ref=producthunt 1.Midjourney V6.1版本上线,优化远景人脸,细节更丰富 Midjourney V6.1 版本的上线带来了多项重要更新,包括图像连贯性的突破、画质的全面提升、微观细节的精准把控等。在处理复杂结构如人体和动植物时,表现出色,尤其是在细节如手臂、腿部和手掌的自然流畅表现上。新版本在减少像素伪影、增强纹理表现力方面取得了显著进展,特别是在皮肤质感和 8bit 复古风格的呈现上。标准图像任务的处理速度提升约 25%, 能更准确地生成文字,可以调用旧任务中的个性化模型和数据。 🔗 discord.gg/midjourney 2.RenderNet推出自动配音功能 Narrator RenderNet推出新的 Narrator 功能。用户上传自己的视频,并添加相应的脚本,系统将自动帮助角色与脚本中的话语进行口型同步。 🔗 https://rendernet.ai/ 04 特别关注 苹果公布一篇 47 页的论文,详细介绍了自家开发的两个基础语言模型 AFM-on-device,参数约 30 亿,以及更大的服务器端模型 AFM-server。论文中详细描述了模型的基于 Transformer 的密集解码器架构,以及进行的多项优化设计,旨在提高效率。训练过程包括核心预训练、持续训练和长上下文训练三个阶段,使用了多样化的高质量数据。后训练优化则采用了监督微调和基于人类反馈的强化学习来提升模型能力。此外,论文还提供了评估结果,展示了模型的性能。 🔗https://machinelearning.apple.com/papers/apple_intelligence_foundation_language_models.pdf
OpenAI 推出 GPT-4o 语音模式 ChatGPT Plus 用户的全新体验
7月31日,OpenAI 宣布部分 ChatGPT Plus 用户将即日起开始测试全新的 GPT-4o 语音模式(Alpha 版本),并计划在今年秋季逐步推广至所有 ChatGPT Plus 订阅用户。 今年 5 月,OpenAI 首席技术官米拉・穆拉蒂(Mira Murati)在一次演讲中介绍了 GPT-4o 的创新之处。她表示:“在 GPT-4o 中,我们训练了一个全新的跨文本、视觉和音频的端到端统一模型,这意味着所有输入和输出都由同一个神经网络处理。”由于 GPT-4o 是首个结合所有这些模式的模型,OpenAI 目前仍在探索该模型的功能及其局限性。 原计划在今年 6 月底邀请一小部分 ChatGPT Plus 用户测试 GPT-4o 语音模式,但由于需要更多时间来打磨该模型,提高其检测和拒绝某些内容的能力,官方在 6 月宣布推迟测试。此前曝光的信息显示,GPT-3.5 模型的平均语音反馈延迟为 2.8 秒,而 GPT-4 模型的延迟为 5.4 秒,因此在语音交流方面不太优秀。即将推出的 GPT-4o 则可以极大地缩短延迟时间,近乎实现无缝对话。 据光年AI了解,GPT-4o 语音模式不仅反应快速,其声音更是堪比真人。OpenAI 表示,GPT-4o 语音模式可以感知语音中的情感语调,包括悲伤、兴奋或歌唱。 OpenAI 发言人林赛・麦卡勒姆(Lindsay McCallum)表示:“ChatGPT 不能假冒他人的声音,包括个人和公众人物的声音,并且会阻止与预设声音不同的输出。” 随着 GPT-4o 语音模式的逐步推广,用户将能够体验到更加自然和流畅的语音交流。这不仅是技术上的突破,也为未来的人机互动设立了新的标准。OpenAI 在不断探索和提升的道路上,致力于为用户带来更优质的体验。#热点引擎计划# OpenAI 的这一最新进展,预示着人工智能技术在语音交互领域的又一次飞跃。我们期待着在不久的将来,更多用户能够体验到 GPT-4o 带来的全新语音互动体验。
刚推出SearchGPT结果被曝亏损50亿美元,OpenAI寿命只剩一年了?
OpenAI前几天宣布了一项令人惊讶的消息——推出人工智能搜索引擎原型SearchGPT,直接挑战谷歌在在线搜索市场的主导地位。 这一大胆举动预示着人工智能搜索大战将大幅升级,并可能重塑用户在网络上查找信息和与信息互动的方式。 01.SearchGPT带来新变化 SearchGPT是一个新的人工智能搜索功能的临时原型,它能为用户提供快速、及时的答案,并提供清晰、相关的信息来源。 OpenAI在7月25日发文称:“我们正与一小群用户测试该功能,以获得反馈,并计划将该体验整合到ChatGPT中。” 新的SearchGPT原型承诺“提供快速、及时、来源清晰的相关答案”,并将OpenAI的高级语言模型与实时网络信息相结合。同时提供了一个会话界面,允许用户在整个搜索过程中提出后续问题并建立上下文。 OpenAI发言人表示:“我们相信,通过利用网络实时信息增强我们模型的对话能力,可以更快、更轻松地找到您要找的东西。” SearchGPT的推出正值搜索技术发展的关键时刻。 谷歌一直在谨慎地涉足人工智能增强搜索领域,而OpenAI则是一头扎了进去。这一积极举措可能会迫使谷歌出手,加速这家科技巨头的人工智能整合计划,并有可能引发搜索领域的快速变革。 习惯于在一页页搜索结果中筛选的用户,可能很快就会发现自己正在与搜索引擎进行动态的、上下文感知的对话。这将实现信息获取的民主化,使普通用户更容易进行复杂的搜索。 不过,这也引发了人们对这些人工智能系统真正能提供的知识深度和广度的质疑,以及它们是否会在无意中制造假性信息。 SearchGPT对来源和归因的关注是OpenAI的明智之举,它试图将自己定位为出版商的合作伙伴,而非威胁。通过突出引用和链接来源,OpenAI向经常对人工智能持怀疑态度的行业伸出了橄榄枝。 然而,这一举措可能不足以消除所有担忧。最根本的问题依然存在:如果人工智能可以直接提供全面的答案,用户还会点击进入原始资料来源吗?这可能会导致网络流量模式发生重大转变,从而有可能颠覆当前的数字出版模式。 The Atlantic首席执行官Nicholas Thompson是在一份书面声明中支持这一举措的少数出版商之一。 Thompson表示:“人工智能搜索将成为人们浏览互联网的主要方式之一,在这个早期阶段,关键是要以重视、尊重和保护新闻业和出版商的方式来构建这项技术。” 此外,Reddit最近的行动也凸显了这一领域日益紧张的局势。 02.机遇与挑战并存 随着人工智能系统变得越来越复杂,我们可能会看到内容付费墙和知识产权法律战的增加。这些冲突的结果可能会影响人工智能发展和数字出版的未来。 同时,人工智能对数字广告市场的潜在破坏也十分值得注意。如果SearchGPT获得发展,它就会削弱谷歌在搜索广告领域近乎垄断的地位。这不仅会影响谷歌的底线,还可能导致在人工智能驱动的搜索环境中,数字广告的功能被重新想象。 然而,OpenAI面临着巨大的障碍。扩展人工智能搜索引擎以处理每天数十亿次的查询是一项巨大的技术挑战。此外,确保人工智能实时生成回复的准确性和可靠性也至关重要。一些引人注目的错误可能会迅速削弱用户的信任,让人们逃回熟悉的搜索引擎。 也许最大的挑战在于如何在创新和责任之间取得适当的平衡。随着人工智能搜索引擎变得越来越强大,它们在影响公众舆论和信息获取方面的影响力也越来越大。OpenAI将需要驾驭复杂的道德考量,避免无意中成为错误信息或有偏见观点的传播者。 随着OpenAI开始在特定群体中测试SearchGPT,科技界屏住了呼吸。这一刻可能标志着我们与浩瀚的人类知识互动的新时代的开始。 无论SearchGPT是成功还是失败,它的推出无疑为定义搜索未来的激烈竞争打响了头炮。 在推出SearchGPT的同时,OpenAI也正在努力应对可能威胁其未来的重大财务挑战。据报道,尽管得到了微软的大力支持,该公司在2024年预计仍将面临50亿美元的亏损。 03.巨大的财务压力 人工智能聊天机器人ChatGPT的运营成本异常高昂,每天仅硬件成本就高达约70万美元。随着模型越来越复杂,这一数字预计还会上升。 预计到2024年,OpenAI在人工智能培训和人员配备方面的总支出将分别达到70亿美元和15亿美元。 这些支出大大超过了其竞争对手,如亚马逊支持的Anthropic,该公司预计同期的烧钱速度为27亿美元。 根据The information的分析,OpenAI今年可能亏损50亿美元,并可能在12个月内耗尽现金,除非他们筹集更多资金。 尽管每年从ChatGPT上获得约20亿美元的收入,另外还有10亿美元的语言模型访问费,但OpenAI的收入仍不足以支付飙升的运营成本。 该公司的估值超过800亿美元,由于企业对其生成式人工智能工具的兴趣与日俱增,投资者希望其收入到2025年能翻一番以上。 OpenAI已通过七轮融资筹集了超过110亿美元,并享受微软Azure服务的折扣优惠。尽管如此,该公司的运营能力已接近饱和,其35万台服务器中有29万台专用于ChatGPT。 OpenAI的财务困境引发了人们对其在没有额外资金的情况下能否持续运营的担忧。公司必须在未来12个月内获得更多资金,以避免破产。 尽管面临这些挑战,OpenAI仍将在首席执行官Sam Altman的领导下,专注于推进通用人工智能(AGI)的发展。
OpenAI推出AI搜索引擎SearchGPT
科技日报讯 (记者张佳欣)据英国《卫报》、美国消费者新闻与商业频道等媒体报道,当地时间7月25日,OpenAI宣布正在测试新的人工智能(AI)搜索工具SearchGPT,可以实时访问来自互联网的信息,旨在为用户提供更具时效性和更准确的信息。 该搜索引擎以一个大文本框开始,询问用户“您在找什么?”客户输入搜索内容后,SearchGPT并不是返回一个简单的链接列表,而是试图对它们进行组织和理解。在OpenAI提供的一个例子中,该搜索引擎总结了它对于音乐节的相关发现,提供了活动的简短描述,并在后面附上了链接。 在另一个例子中,SearchGPT先解释何时种植西红柿,然后解释了西红柿的细分品种。结果出现后,用户可以提出后续问题,或点击侧边栏打开其他相关链接。 OpenAI表示,SearchGPT将先在一小群用户和出版商中推出,然后可能在更大范围推广。该公司最终打算将这一搜索功能整合到ChatGPT中,而不是将其作为一款独立产品。 报道称,这可能会对谷歌主导的引擎搜索产生影响。自2022年11月推出ChatGPT以来,谷歌母公司Alphabet投资者一直担心,OpenAI可能会通过为消费者提供在线获取信息的新方式来从谷歌手中夺取搜索市场份额。 OpenAI近期新推出的“GPT-4o mini”迷你AI模型和SearchGPT原型,都是其致力于在“多模态”领域保持领先地位的一部分。所谓“多模态”,即在一个工具(即 ChatGPT)内部,提供多种类型的AI生成媒体,包括文本、图像、音频、视频以及搜索功能。