o1 news - 搜索 News

13 小时

包括Zaremba在内的18名团队成员，在首席研究官Bob McGrew的带领之下围坐一团。随着成员们的踊跃发言，o1的发展历程也逐渐被揭开——受AlphaGo和早期GPT模型的启发，想到了将两张背后的范式结合。

1 天

【新智元导读】o1诞生，对于OpenAI团队来说，是最具革命性的时刻。在22分钟完整版采访视频中，他们分享了自己对新模型的思考，以及背后的开发故事。有时候，当被问及意大利首都是什么问题时，我们几乎不用思考，即刻就能得出答案。但有时候，涉及商业企划书 ...

17 小时

o1谎称自己没有CoT？清华UC伯克利：RLHF让模型学会撒谎，伪造证据PUA人类

新智元报道编辑：编辑部 ...

1 天

TLDR，o1 技术细节推测汇总了解一下？

3、北大对齐团队分析了 o1 的技术细节，指出 o1 的核心技术在于强化学习的搜索与学习机制，基于 LLM 已有的推理能力，迭代式的 bootstrap ...

8 小时

Open AI o1引发范式革命：Kimi创始人杨植麟深度剖析下一代AI模型

在谈到o1模型时，杨植麟表示，这一新模型标志着AI发展的新范式。o1通过强化学习的方式，突破了以往依赖静态数据的局限，能够自主生成数据并进行自我学习。这种方法不仅提高了数据的质量和计算效率，还为AI的进一步发展提供了新的可能性。他指出，o1的推出是对 ...

1 天

OpenAI o1金牌团队揭秘AI超越人类惊人时刻！22分完整版视频全公开

【新智元导读】o1诞生，对于OpenAI团队来说，是最具革命性的时刻。在22分钟完整版采访视频中，他们分享了自己对新模型的思考，以及背后的开发故事。

15 小时

o1谎称自己没有CoT？清华UC伯克利：RLHF让模型学会撒谎摸鱼，伪造 ...

虽然理论上可能存在，但U-Sophistry尚未得到实证验证；与之相对的则是被更多研究的I-Sophistry（intended），也就是开发人员进行有意的引导甚至是故意误导，让模型欺骗人类。 - R^ {human} （human ...

20 小时

启明星 | 阶跃星辰姜大昕：AI技术加速发展，o1开启Scaling Law新范式

阶跃星辰在持续努力迭代模型，探索C端产品的功能和形态，希望能让AI解决更多生活中的难题。近期，阶跃星辰全新升级了智能助手“跃问”。目前用户已经可以在“跃问”官网或App限时体验Step-2万亿参数语言大模型。此外，“跃问”还推出了新功能“拍照问”，支 ...

13 小时

o1 研发团队完整采访：Ilya 早期曾参与，灵感源于 AlphaGo

刚刚，OpenAI 发布了 o1 研发团队的完整访谈，为我们揭秘了 o1 的「成长历程」。o1 如何一步步蜕变，最终成为一个「智商高达 120」的非凡存在？他们是将强化学习和监督学习两种范式结合起来的？这背后是无数的突破与挑战，OpenAI o1 的研究人员与 OpenAI 研究团队的负责人 Bob McGrew 畅谈了研发过程中的「Aha moments」—— ...

红板报 on MSN1 天

北大AI奥数评测，o1-mini比o1-preview分数还高

Omni-MATH团队投稿量子位 | 公众号 QbitAI OpenAI的o1系列一发布，传统数学评测基准都显得不够用了。 MATH-500，满血版o1模型直接拿下94.8分。更难的奥数邀请赛AIME 2024，o1也获得83.3%的准确率。

红板报 on MSN1 天

OpenAI 已经向企业和教育用户开放 O1 系列模型

品玩9月23日讯，据 venturebeat 报道，OpenAI 已向所有 ChatGPT Enterprise 和 ChatGPT Edu 客户提供其最新的人工智能模型 o1-preview 和 o1-mini。 o1系列模型旨在处理复杂的推理任务 ...

来自MSN15 小时

预训练的 Scaling Law 正在走入死胡同，o1 让更多创业公司重新复活

GPT-4o 读万卷书，「o1」行万里路。整理 | 宛辰编辑 | 靖宇北京时间 9 月 13 日凌晨，OpenAI 在官网发布了其最新一代模型，没有延续过去 GPT 系列的名称，新模型起名为 o1，当前可以获取 o1-Preview 和 o1 ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果