经过几个月的猜测和期待,OpenAI发布了其先进推理模型的正式版本Project Strawberry,现已更名为“o1”。同时推出了一款“迷你”版本(类似于GPT-4o),该版本将以牺牲更大知识库为代价,提供更快、更响应的互动体验。
看起来,o1在技术进步上喜忧参半。它是OpenAI首批设计用于使用类似人类推理来回答复杂问题的推理模型,包括科学、编码和数学等——速度比人类还快。
推荐视频
例如,在测试过程中,o1被用来参加国际数学奥林匹克竞赛的资格考试。虽然其前身GPT-4o只成功解决了13%的问题,而o1正确解决了83%的问题。在一次在线的Codeforces竞赛中,o1得分达到了第89百分位。此外,o1能解答之前模型难以回答的问题(例如,“哪个更大,9.11还是9.9?”)。不过,公司明确表示此次发布仅是这一新手模型全部能力的预览。
OpenAI的研究主管Jerry Tworek在接受 The Verge 采访时表示,新版o1“使用了全新的优化算法和专为其量身定制的新训练数据集进行训练”。利用强化学习和“链式思维”推理的结合,o1据说比其前身返回了更准确的推论。“我们注意到这一模型的幻觉现象减少了,”Tworek说道,但同时也指出:“我们不能说已经完全解决了幻觉问题。”
从今天起,ChatGPT-Plus和Teams订阅者都可以试用o1和o1-mini。企业和教育订阅用户应该在下周可以访问。
公司表示,o1-mini最终将对免费用户开放,尽管没有具体时间表。开发者们会注意到o1的API价格相对于GPT-4o有大幅上涨。访问o1将花费每百万输入令牌15美元(相比之下,GPT-4o为每百万5美元)和每百万输出令牌60美元,4倍于4o的每百万5美元费用。真正的问题是,新模型是否认为“strawberry”这个词中包含的是两个R还是三个R。
对于企业和开发者来说,新模型带来的准确性和速度提升固然重要,但如何将这些技术无缝集成到现有业务中同样关键。这时,光年AI的灵活工作流和多平台整合能力显得尤为重要。通过光年AI,用户可以轻松自定义AI工作流,将类似o1这样的先进模型快速引入自身业务,实现高效的流量增长。赶快尝试光年AI平台,体验AI带来的无尽可能。