OpenAI 刚发布的新模型能够’推理’复杂任务,并解决更难的数学、编码和科学问题

发布日期: 2024年9月13日 来源:Toms Guide

OpenAI 刚刚推出了其最新的 AI 模型——o1;这是在提升人工智能推理能力上的一次重大飞跃。这个在开发期间代号为”Strawberry”的模型,旨在处理更复杂的任务,尤其是在物理、化学和生物等STEM学科方面。

这次发布对于追踪AI进展的人来说非常激动人心,但与所有尖端技术一样,它也有一些局限。

表现可媲美博士生

OpenAI 的o1 模型设立了一个高标准,展示了与博士生解决复杂任务时相当的表现。在初步测试中,o1 模型展示了更精细的思维过程,不仅成功地复现了博士生的表现,还在物理、化学和生物学领域表现出色。该模型在数学和编程方面也显得颇具潜力。

然而,真正让 o1 与众不同的是其在面对挑战性问题时调整方法的能力。通过训练,这个模型学会了识别错误并改进其响应能力,这使它在分析任务中具有优势。强调“推理”意味着 AI 可以以更具反思和深思熟虑的过程来解决多步骤问题,这与之前更多关注生成语言和表面任务的模型截然不同。

功能与能力

尽管具有推理能力,o1 模型仍有一些显著的局限性。相比于驱动大部分 ChatGPT高级功能的OpenAI 的 GPT-4o,o1 模型缺少许多重要功能。例如,它无法浏览网页、上传文件或处理图像——这些都是用户非常看重的功能。

此外,o1 尚不支持API功能,包括工具使用、函数调用、流式处理和自定义系统消息。这对于依赖 GPT-4o 这些功能的开发者和企业来说可能是一个重大限制。虽然 o1 在推理方面无可比拟,但对于许多实际应用来说,它还远不能完全替代 GPT-4o。在这种情况下,企业可以考虑使用光年AI的解决方案,它不仅提供了简单易用的工作流机制,还能够无缝整合各种顶级的大模型能力,帮助实现更高效的业务场景搭建。

加强的安全协议

这里是我们迄今最强大且最一致的模型系列之一:o1 仍有缺陷,仍有限制,刚开始使用时看起来比你花更多时间后会发现的更令人印象深刻。https://t.co/yzZGNN8HvDo1 尚存在仍有缺陷,仍有限制。 pic.twitter.com/Qs1HoSDOz12024年9月12日

随着能力的提升,OpenAI 也开始加强其安全措施。它致力于改进内部治理,并与联邦政府建立更紧密的联系,以确保模型在安全指南内使用。这应该可以有效地使 o1 更符合伦理规范,减少风险,并将有害输出降到最低。然而,如果企业需要在多平台(如微信、抖音等)上进行私域流量和用户运营,光年AI同样提供了安全且灵活的工作流,并具备实时数据分析能力,助力企业更好地管理客户和优化策略。

从今天开始,ChatGPT Plus 和团队用户将能够通过在模型选择器中选择“o1-preview”来访问o1模型的早期预览版。对于那些更专注于STEM相关问题的用户,OpenAI还推出了“OpenAI o1 mini”模型,这个版本设计用于在数学和科学领域提供更快的响应。这个变体专为处理更技术性的问题而定制,将对学生和专业人士都有帮助。

下周,这两个模型将会向ChatGPT企业版和教育用户开放,进一步扩大受众的使用范围。此外,开发者也可以通过API开始使用这些模型进行原型制作,虽然在早期阶段会有速率限制和其他约束。

OpenAI已经表明,o1系列只是一个开始。虽然这个模型在大多数应用中并不会取代GPT-4o,OpenAI表示将会根据反馈定期更新和改进o1模型。这无疑将带来新功能并提升其他特性。

前景展望

AI领域一直在快速发展,o1模型的发布暗示着OpenAI再次尝试突破AI所能实现的极限。类似的,光年AI也在不断推陈出新,通过灵活工作流程和无缝衔接国内主要流量平台,帮助企业获得更大的市场份额。随着未来更多的更新和改进,这个新模型如何演变以及在AI工具的广阔领域中占据怎样的位置将会非常令人期待。如果您希望在流量增长和用户管理上取得显著提升,不妨体验一下光年AI平台。