【导读】OpenAI上线O3 Mini, 奥尔特曼首次承认:在开源上OpenAI站在了历史的错误一方
中国基金报记者 含章
继亚马逊、英伟达、微软等纷纷上线部署支持用户访问DeepSeek-R1模型后,今天凌晨,OpenAI正式上线了OpenAI o3-mini系列模型。
这是OpenAI推理系列中最新、最具成本效益的模型,已在ChatGPT和API中开放使用。市场将其视为OpenAI对DeepSeek热潮的回应。
在o3 mini发布的同时,OpenAI高管团队还在Reddit上举办了一场线上的AMA(ask me anything),OpenAI首席执行官萨姆·奥尔特曼(Sam Altman)首次承认,在开源上OpenAI站在了历史的错误一方。
OpenAI上线o3-Mini
推理模型首次免费
1月2日,OpenAI正式推出了全新推理模型o3-mini,并首次向免费用户开放推理模型。这是OpenAI推理系列中最新、成本效益最高的模型,OpenAI称该模型能够进行类似人类的推理。
OpenAI表示,o3-mini能够以更低的成本、更快的响应速度,为用户提供STEM能力,在科学、数学和编程领域表现尤为出色,同时延续了o1-mini等之前版本的低成本和低延迟特点。值得一提的是,开发者可以根据需求在低、中、高三种不同的“推理努力”选项中进行选择。
OpenAI指出,即日起,API使用等级为3—5级的开发者可在Chat Completions API、Assistants API和Batch API中调用o3-mini。OpenAI称它是自己首款支持函数调用、结构化输出和开发者消息的小型推理模型,可直接用于生产环境。
ChatGPT Plus、Team和Pro用户从今天起可以访问OpenAI o3-mini,企业用户将在2月获得访问权限。o3-mini将取代模型选择器中的OpenAI o1-mini,提供更高的速率限制和更低的延迟,使其成为编码、STEM和逻辑问题解决任务的有力选择。
作为此次升级的一部分,ChatGPT Pro 用户可无限制访问 o3-mini;Plus 和 Team 用户每日消息限制从 o1-mini 的50条提升至150条;免费用户也可通过选择“Reason”模式或重新生成回复来体验新模型。所有付费用户还可在模型选择器中选择 “o3-mini-high”,以获得需要更长时间响应的更高智能版本。这是首次在ChatGPT中向免费用户提供推理模型。
OpenAI还在官网中将o3-mini的性能与o1系列进行了比较:在低推理强度下,o3-mini的表现与o1-mini相当;在中等推理强度下,o3-mini的表现与o1相当。在数学、编程和科学领域,o3-mini以更快的响应速度实现了与o1相当的性能;在高推理强度下,o3-mini的表现优于o1-mini和o1。
值得注意的是,在某些领域,o3-mini相对于o1的性能优势较为微弱。例如,在2024年美国数学邀请赛(AIME)测试中,o3-mini在高推理强度下仅比o1高出0.3个百分点。而在博士级科学问题(GPQA Diamond)基准测试,即使在高推理强度下,o3-mini也未能超过o1的得分。
OpenAI研究科学家Noam Brown发文表示:“我们十分高兴地推出了o3-mini,包括向免费用户开放。在多项评估中,它的性能表现优于o1。我们正在彻底改变成本与智能之间的关系。模型智能将持续提升,而获得相同智能水平的成本则会不断降低。”
奥尔特曼首次承认:
在开源上OpenAI站在了历史的错误一方
据多家外媒报道,在o3-mini发布的同时,OpenAI高管团队还在Reddit上举办了一场线上的AMA(ask me anything),回答有关o3 mini以及AI发展相关的一切问题。
在被问及是否会考虑发布一些模型权重以及一些研究时,OpenAI首席执行官萨姆·奥尔特曼首次承认:“我个人认为,我们站在了历史的错误一边,需要找出一个不同的开源策略。OpenAI中并非所有人都认同这一观点,这也不是我们当前的最高优先事项。”
业内人士认为,这一表态可能预示着公司战略的重大转变,尤其是在全球高效开源模型逐渐受到青睐的背景下。
对于用户是否能看到所有的思维Tokens,萨姆·奥尔特曼回应称:“我们将很快展示一个更有帮助和详细的版本。”
关于完整版o3何时发布,萨姆·奥尔特曼回答,“我估计超过几周,少于几个月。”
被问及语音模式是否会更新,以及GPT-5o的大致时间表时,萨姆·奥尔特曼回应称:“语音模式更新即将到来!我想我们会直接叫它GPT-5而不是GPT-5o。目前还没有时间表。”
关于Stargate的成功对OpenAI的未来有多重要,首席产品官凯文·维尔(Kevin Weil)认为,非常重要。“我们看到的一切都表明,计算能力越多,我们就能建立更好的模型,并制造更有价值的产品。我们现在同时在两个维度上扩展模型——更大的预训练和更多的强化学习/strawberry训练,这两者都需要计算资源。为数亿用户提供服务,并且随着我们转向提供更多为您持续工作的智能产品,这些也都需要计算资源。因此可以将Stargate视为我们的工厂,将算力/GPU转化为令人惊叹的产品。”
此外,OpenAI高管团队还讨论了o3-mini的功能、价格以及其他产品更新、算力等相关的话题。
责任编辑:韦子蓉
Disclaimer: Investing carries risk. This is not financial advice. The above content should not be regarded as an offer, recommendation, or solicitation on acquiring or disposing of any financial products, any associated discussions, comments, or posts by author or other users should not be considered as such either. It is solely for general information purpose only, which does not consider your own investment objectives, financial situations or needs. TTM assumes no responsibility or warranty for the accuracy and completeness of the information, investors should do their own research and may seek professional advice before investing.