发布这篇博客后,我们收到了许多请求,希望对更多顶尖模型进行进一步的基准测试。 九月,OpenAI发布了GPT o1,依靠额外的推理时计算来增强“推理”能力。我们很想看看这些新模型在我们内部基准测试中会有怎样的表现;增加推理时计算是否会带来显著提升?
一出手,曾在国际数学奥赛中拿下83%解题率的 o1模型 就败下阵来,并且Claude 3.5 Sonnet、GPT-4o、Gemini 1.5 Pro等全都未攻破2%这一防线。 一打听,这个新数学基准名为 FrontierMath ,由 Epoch ...
这种发展瓶颈已经波及行业巨头。有报道称OpenAI的新型Orion模型相比GPT-4提升有限,谷歌的Gemini2.0也遇到类似困境。Anthropic方面,其首席执行官Dario Amodei表示正在重新规划Opus3.5的开发路线。
OpenAI CEO奥特曼谈AGI发展及创业机会。 AGI 2025年到来,ASI几千天内降临,奥特曼在最新专访中金句频出。不仅如此,他的话还得到了德扑之父、自家员工的证实。 就在最近,OpenAI CEO奥特曼在最新访谈里,再次爆出不少金句。 YC总裁兼CEO Garry Tan对奥特曼展开了一次访问,谈论了OpenAI的起源,公司的下一步发展,以及他对于创始人该如何驾驭一个庞大公司的建议。 在 ...
随着2024年诺贝尔物理学奖和化学奖授予了人工智能 (AI)相关研究,科学智能(科学和AI深度融合)及其研究方向引发了从科学家到公众的广泛关注。在与从事科学智能领域前沿研究学者的大量深度访谈基础上,上智院联合合作伙伴,共同概括科学智能新范式,并梳理和凝练了科学智能的十大前沿方向。
随着人工智能(AI)达到当前大型语言模型的极限,OpenAI等公司正在探索模仿人类思维过程的新训练技术。这些方法已被纳入OpenAI最新的o1模型中,预计将重新定义AI格局,并影响从能源到芯片类型等资源的需求。
周一,摩根士丹利维持对英伟达(NASDAQ: NVDA)的"增持"评级,同时将目标价从150.00美元上调至160.00美元。这一调整源于分析师预期公司10月份的毛利率将有所改善。英伟达此前预计毛利率将从7月的75.7%下降到10月的75.0%。然而 ...
人工智能实验室Safe Superintelligence(SSI)和OpenAI的联合创始人伊利亚-苏茨克沃尔(Ilya ...
主持人:再让我问 Kevin 一个问题。现在有很多团队在尝试用 OpenAI o1。这款模型显然能做更复杂的事情。此外,对于那些已经在应用中使用了 GPT-4 或类似模型的团队,显然不能简单地用 o1 ...
猛料来了,OpenAI下一代旗舰模型被曝提升不如预期。 消息来自The Information,具体指代号“猎户座”(Orion)的模型相对GPT-4的提升幅度,小于GPT-4相对GPT-3,已进入收益递减阶段。