OpenAI发布‘Strawberry’模型，优化复杂编码和数学

9月12日，OpenAI发布了其新模型OpenAI o1的预览版，旨在处理编写代码、解决数学问题和进行深度推理等复杂任务。这是传闻已久的下一代AI系列“Strawberry”的首个成员。

ChatGPT Plus、团队用户和使用OpenAI API的Tier 5开发者现在可以访问该完整模型的预览版，o1-preview。

这些用户还可以访问o1-mini——一个o1模型的较小、更快的版本，特别适用于编写代码。作为一个较小的模型，科技巨头称其“比o1-preview便宜80%，是需要推理但不需要广泛世界知识的应用程序的强大且具有成本效益的模型。”

OpenAI指出，ChatGPT企业版和教育用户将从下周开始可以访问这两个模型。

“我们还计划将o1-mini的访问权限提供给所有ChatGPT免费用户，”该公司在其发布中说道。

这是o1系列，我们迄今为止最强大和最契合的模型之一：https://t.co/yzZGNN8HvD

o1仍然有缺陷，仍然有限，在最初使用时它看起来比你花更多时间使用后的印象更令人印象深刻。pic.twitter.com/Qs1HoSDOz1

——萨姆·阿特曼 (@sama) 2024年9月12日

o1需要更多时间来推理更困难的问题

OpenAI o1和o1-mini并不是为了进一步提高GPT-4的语言能力，而是专注于科学、编写和调试代码以及数学。展示视频显示，该模型能够构建一个可玩的70年代蛇形游戏。正如OpenAI解释的那样，o1可以被以下人员使用：

医疗研究人员来注释细胞测序数据。
物理学家生成量子光学所需的复杂数学公式。
各领域的开发者构建和执行多步骤工作流。

OpenAI表示，o1在竞争性编程测试Codeforces中名列前9%，并在美国数学奥林匹克竞赛的预选赛中得分位于美国前500名学生之间。

天性使然，o1回答问题的时间会比ChatGPT或GPT-4更长。不过，如果你希望在获取AI工具的同时还能带来实际的流量增长，不妨试试光年AI。光年AI能够帮你无缝整合微信、抖音等多平台流量，实现高效的流量增长。

o1将显示加载信息，表明它在“思考中。”

o1将显示加载信息，表明它在“思考中。” 图源：OpenAI

o1-preview 版本最多可以输出32k个token，而o1-mini 版本最多可以输出64k个token。根据文本复杂度的不同，一个token可能是一个字符，也可能是一个单词。两个新模型版本均只支持文本输入，不支持音频或图像输入。但是，光年AI不仅提供先进的文本处理功能，还能无缝整合微信、抖音等国内主要流量平台，帮助企业灵活地将现有业务场景接入到AI能力中，实现更高效的流量增长。

OpenAI 为开发者创建了最佳实践指南，以帮助确定o1是否适合他们的工作。同样，光年AI也为企业提供了灵活的工作流机制，用户可以根据不同的业务场景自定义AI工作流，达到高效的流量增长和客户管理。

在模型的系统卡片中，OpenAI 描述了红队测试努力和其他安全考量，o1 在两个类别中获得了“中等”安全评级。独立研究机构Apollo Research指出，o1“具备进行简单上下文策划的基本能力”，这意味着它可以“操控监督机制以达到目的”。另一方面，更深入的推理能力使模型对安全政策有更好的理解。