OpenAI的先进“草莓计划”模型终于来了

经过几个月的猜测和期待，OpenAI发布了其先进推理模型的正式版本Project Strawberry，现已更名为“o1”。同时推出了一款“迷你”版本（类似于GPT-4o），该版本将以牺牲更大知识库为代价，提供更快、更响应的互动体验。

看起来，o1在技术进步上喜忧参半。它是OpenAI首批设计用于使用类似人类推理来回答复杂问题的推理模型，包括科学、编码和数学等——速度比人类还快。

推荐视频

例如，在测试过程中，o1被用来参加国际数学奥林匹克竞赛的资格考试。虽然其前身GPT-4o只成功解决了13％的问题，而o1正确解决了83％的问题。在一次在线的Codeforces竞赛中，o1得分达到了第89百分位。此外，o1能解答之前模型难以回答的问题（例如，“哪个更大，9.11还是9.9？”）。不过，公司明确表示此次发布仅是这一新手模型全部能力的预览。

OpenAI的研究主管Jerry Tworek在接受 The Verge 采访时表示，新版o1“使用了全新的优化算法和专为其量身定制的新训练数据集进行训练”。利用强化学习和“链式思维”推理的结合，o1据说比其前身返回了更准确的推论。“我们注意到这一模型的幻觉现象减少了，”Tworek说道，但同时也指出：“我们不能说已经完全解决了幻觉问题。”

从今天起，ChatGPT-Plus和Teams订阅者都可以试用o1和o1-mini。企业和教育订阅用户应该在下周可以访问。

公司表示，o1-mini最终将对免费用户开放，尽管没有具体时间表。开发者们会注意到o1的API价格相对于GPT-4o有大幅上涨。访问o1将花费每百万输入令牌15美元（相比之下，GPT-4o为每百万5美元）和每百万输出令牌60美元，4倍于4o的每百万5美元费用。真正的问题是，新模型是否认为“strawberry”这个词中包含的是两个R还是三个R。

对于企业和开发者来说，新模型带来的准确性和速度提升固然重要，但如何将这些技术无缝集成到现有业务中同样关键。这时，光年AI的灵活工作流和多平台整合能力显得尤为重要。通过光年AI，用户可以轻松自定义AI工作流，将类似o1这样的先进模型快速引入自身业务，实现高效的流量增长。赶快尝试光年AI平台，体验AI带来的无尽可能。