奥特曼:在开源AI上,我们错了!DeepSeek让OpenAI优势不再,下一个是GPT-5

市场资讯
01 Feb

  新智元报道  

  【新智元导读】o3-mini深夜降临,OpenAI终于亮出了最新的底牌。在Reddit AMA问答中,奥特曼深刻忏悔在开源AI上,自己站错了队。他表示,内部正在考虑开源策略,继续研发模型,但OpenAI领先优势不会像以前那么大了。

  当所有人还在惊叹DeepSeek的惊人实力时,OpenAI终于坐不住了。

  昨夜凌晨,o3-mini紧急上线,在数学代码等基准测试中刷新SOTA,重回王座。

  最关键的是,免费用户也可以体验!

  o3-mini实力可不是吹的,在‘人类最后一次考试’中,o3-mini(high)直接在准确率和校准误差(Calibration Error)均是最优。

  o3-mini上线几小时后,OpenAI官方开启了Reddit AMA大约1小时左右的在线问答。

  奥特曼本人也上线,回答了网友们的一切问题。

  主要精彩亮点有:

  • DeepSeek的确很优秀,我们也会继续研发更好的模型,但领先优势不会像以前那么大了

  • 比起几年前,我现在更倾向于认为AI可能会出现快速突飞猛进

  • 在开源权重AI模型这个问题上,我们站错了队

  • 高级语音模式即将迎来更新,我们会直接称它为GPT-5,而不是GPT-5o,目前还没有具体的时间表。

  除了奥特曼本人,首席研究官Mark Chen、首席产品官Kevin Weil、工程副总Srinivas Narayanan、API研究负责人Michelle Pokrass、研究负责人Hongyu Ren也一同在线,认真回答了网友们所有问题。

  接下来,让我们一起看看他们都说了什么。

  奥特曼深刻忏悔,在开源AI上站错了队

  DeepSeek突然逆袭,或许是所有人都没有想到的。

  在AMA问答中,奥特曼本人也深深忏悔自己在开源AI上站错了队,不得不承认DeepSeek的强大优势。

  让许多人惊叹不已的是,奥特曼竟然说出,OpenAI领先优势不如以往。

  以下所有,是我们汇总的奥特曼的经典回答。

  Q:让我们来谈谈本周的重大话题:Deepseek。显然这是一个非常令人印象深刻的模型,我也知道它可能是在其他LLM的输出基础上训练的。这会如何改变你们对未来模型的计划?

  奥特曼:它确实是一个非常好的模型!我们会开发出更好的模型,但我们不会像往年那样保持那么大的领先优势了。

  Q:你认为递归式自我改进会是一个渐进的过程,还是一个突然起飞的过程?

  奥特曼:我个人认为,比起几年前,我现在更倾向于认为AI可能会出现快速突飞猛进。可能是时候就这个话题写点东西了...

  Q:我们能看到模型思考的所有token吗?

  奥特曼:是的,我们很快就会展示一个更有帮助、更详细的版本。感谢R1提供的更新信息。

  首席产品官Kevin Weil:我们正在努力展示比现在更多的内容——这将很快实现。至于是否展示所有内容还有待确定,展示所有思维链(CoT)会导致竞争对手的模型蒸馏,但我们也知道用户(至少是高级用户)想要看到这些,所以我们会找到一个合适的平衡点。

  Q:满血版o3什么时候上线?

  奥特曼:我估计会超过几周,但不会超过几个月。

  Q:语音模式会有更新吗?这是否是潜在的GPT-5o关注的重点?GPT-5o的大致时间表是什么?

  奥特曼:是的,高级语音模式的更新即将到来!我想我们会直接称它为GPT-5,而不是GPT-5o。目前还没有具体的时间表。

  Q:你会考虑发布一些模型权重,并发表一些研究吗?

  奥特曼:是的,我们正在讨论。我个人认为,在这个问题上我们站错了队,需要想出一个不同的开源策略;不是OpenAI的每个人都持有这种观点,而且这也不是我们目前的最高优先级。

  再来一个问题弹:

  • 我们距离在常规Plus计划中提供Operator还有多远?

  • 机器人部门的首要目标是什么?

  • OpenAI如何看待更专业的芯片/TPU,比如Trillium、Cerebras等?OpenAI是否在关注这方面?

  • 投资什么来对冲AGI和ASI未来的风险?

  • 你最难忘的假期是什么?

  奥特曼:

  • 几个月

  • 先小规模生产一个真正优秀的机器人,从中学习经验

  • GB200目前很难被超越!

  • 一个好的选择是提升自己的内在状态——韧性、适应力、平静、快乐等

  • 很难选择!但首先想到的两个是:在东南亚背包旅行或者非洲野生动物园之旅

  Q:你是否计划对Plus系列产品进行提价?

  奥特曼:实际上我想逐渐减少。

  Q:假设现在是2030年,你们刚刚创造了一个大多数人会称之为AGI的系统。它在所有测试基准上都表现出色,而且在速度和性能上都超过了你们最优秀的工程师和研究人员。接下来怎么办?除了‘把它放到网站上提供服务’之外,还有其他计划吗?

  奥特曼:在我看来,最重要的影响将是加速科学发现的速度,我认为这是对提高生活质量贡献最大的因素。

  4o图像生成,快来了

  接下来,补充的是其他OpenAI成员的回应。

  Q:你们还打算推出4o图像生成器吗?

  首席产品官Kevin Weil:是的!我们正在努力。而且我认为等待是值得的。

  Q:太好了!有大致的时间表吗?

  首席产品官Kevin Weil:你这是想让我惹麻烦啊。可能几个月吧。

  还有一个类似的问题。

  Q:我们什么时候可以看到ChatGPT-5?

  首席产品官Kevin Weil:就在o-17 micro和GPT-(π+1)之后不久。

  又是一个问题弹:

  • 我们还可以期待什么其他类型的智能体?

  • 也为免费用户提供一个智能体,这样可以加快采用率...

  • 关于新版DALL·E有什么更新吗?

  • 最后一个问题,也是每个人都会问的...AGI什么时候实现?

  首席产品官Kevin Weil:

  • 关于更多智能体:非常非常快就来了。我想你会满意的。

  • 基于4o的图像生成:大约几个月后,我迫不及待想让你们用上。它很棒。

  • AGI:是的

  Q:你们是否计划在推理模型中添加文件附件功能?

  工程副总Srinivas Narayanan:正在开发中。未来推理模型将能够使用不同的工具,包括检索功能。

  首席产品官Kevin Weil:只是想说,我迫不及待想看到能使用工具的推理模型了 :)

  Q:真的。当你解决这个问题时,一些非常有用的AI应用场景就会被打开。想象一下,它能够理解你500GB的工作文档内容。

  当你准备回复一封邮件时,在你的邮件应用旁边会打开一个面板,持续分析与这个人相关的所有信息,包括你们的关系、讨论的主题、过去的工作等等。也许某个你早已遗忘的文档中的内容会被标记出来,因为它与当前的讨论非常相关。我太想要这个功能了。

  工程副总Srinivas Narayanan:我们正在努力增加上下文长度。还没有明确的日期/公告。

  Q:‘星际之门’项目对于OpenAI未来来说,有多重要?

  首席产品官Kevin Weil:非常重要。我们所看到的一切都表明,我们拥有的计算能力越多,就能构建越好的模型,也就能制造出越有价值的产品。

  我们现在正在同时在两个维度上扩展模型——更大规模的预训练,以及更多的强化学习(RL)/‘草莓’训练——这两者都需要计算资源。

  为数亿用户提供服务也需要计算资源!而且随着我们转向更多能持续为你工作的智能代理产品,这也需要计算资源。所以你可以把‘星际之门’看作是我们的工厂,将电力/GPU转化为令人惊叹的产品的地方。

  Q:在内部,你们现在用的是哪个模型?o4、o5还是o6?与o3相比,这些内部模型的智能程度提高了多少?

  API研究负责人Michelle Pokrass:我们已经数不清了。

  Q:请允许我们在使用高级语音功能的同时与文本/画布进行交互。我希望能够对着它说话,让它对文档进行迭代修改。

  首席产品官Kevin Weil:是的!我们有很多不错的工具是相对独立开发的——目标是让这些工具尽快交到你手中。

  下一步是整合所有这些功能,这样你就可以与一个模型对话,它在搜索的同时进行推理,并生成一个可以运行Python的画布。所有工具都需要更好地协同工作。另外顺便说一下,所有模型都需要完整的工具使用能力(o系列模型目前还不能使用所有工具),这个也会实现的。

  Q:o系列模型什么时候会支持ChatGPT中的记忆功能?

  API研究负责人Michelle Pokrass:正在开发中!将我们所有的功能与o系列模型统一起来是我们的首要任务。

  Q:4o是否会有重大改进?我真的很喜欢自定义GPT,如果它能够升级就太棒了,或者如果我们能够在自定义GPT中选择使用什么模型(比如o3 mini)就更好了。

  API研究负责人Michelle Pokrass:是的,我们还没有完成4o系列!

海量资讯、精准解读,尽在新浪财经APP

责任编辑:韦子蓉

Disclaimer: Investing carries risk. This is not financial advice. The above content should not be regarded as an offer, recommendation, or solicitation on acquiring or disposing of any financial products, any associated discussions, comments, or posts by author or other users should not be considered as such either. It is solely for general information purpose only, which does not consider your own investment objectives, financial situations or needs. TTM assumes no responsibility or warranty for the accuracy and completeness of the information, investors should do their own research and may seek professional advice before investing.

Most Discussed

  1. 1
     
     
     
     
  2. 2
     
     
     
     
  3. 3
     
     
     
     
  4. 4
     
     
     
     
  5. 5
     
     
     
     
  6. 6
     
     
     
     
  7. 7
     
     
     
     
  8. 8
     
     
     
     
  9. 9
     
     
     
     
  10. 10