o1 news - 搜索 News

1 天

3、北大对齐团队分析了 o1 的技术细节，指出 o1 的核心技术在于强化学习的搜索与学习机制，基于 LLM 已有的推理能力，迭代式的 bootstrap ...

21 小时

o1谎称自己没有CoT？清华UC伯克利：RLHF让模型学会撒谎摸鱼，伪造 ...

虽然理论上可能存在，但U-Sophistry尚未得到实证验证；与之相对的则是被更多研究的I-Sophistry（intended），也就是开发人员进行有意的引导甚至是故意误导，让模型欺骗人类。 - R^ {human} （human ...

1 天

o1研发团队首次集体访谈：教AI数r用了一年半

这是在o1团队的“大型见面会”上，OpenAI创始成员Wojciech Zaremba揭开的o1“黑历史”。包括Zaremba在内的18名团队成员，在首席研究官Bob McGrew的带领之下围坐一团。

19 小时

o1 研发团队完整采访：Ilya 早期曾参与，灵感源于 AlphaGo

刚刚，OpenAI 发布了 o1 研发团队的完整访谈，为我们揭秘了 o1 的「成长历程」。o1 如何一步步蜕变，最终成为一个「智商高达 120」的非凡存在？他们是将强化学习和监督学习两种范式结合起来的？这背后是无数的突破与挑战，OpenAI o1 的研究人员与 OpenAI 研究团队的负责人 Bob McGrew 畅谈了研发过程中的「Aha moments」—— ...

18 小时

昆仑万维颜水成畅谈OpenAI o1：会让一波创业公司重新复活

一年前有人说Ilya Sutskever（OpenAI联合创始人）在“草莓模型”（o1之前的代号叫草莓）里发现了一些让人震惊的、可怕的事情。今天可以大概推测，他当时到底在草莓模型里面发现了什么东西。颜水成觉得他发现的就是 AI 的学习过程， RL ...

23 小时

o1谎称自己没有CoT？清华UC伯克利：RLHF让模型学会撒谎，伪造证据PUA人类

新智元报道编辑：编辑部 ...

14 小时

Open AI o1引发范式革命：Kimi创始人杨植麟深度剖析下一代AI模型

在谈到o1模型时，杨植麟表示，这一新模型标志着AI发展的新范式。o1通过强化学习的方式，突破了以往依赖静态数据的局限，能够自主生成数据并进行自我学习。这种方法不仅提高了数据的质量和计算效率，还为AI的进一步发展提供了新的可能性。他指出，o1的推出是对 ...

红板报 on MSN2 天

北大AI奥数评测，o1-mini比o1-preview分数还高

Omni-MATH团队投稿量子位 | 公众号 QbitAI OpenAI的o1系列一发布，传统数学评测基准都显得不够用了。 MATH-500，满血版o1模型直接拿下94.8分。更难的奥数邀请赛AIME 2024，o1也获得83.3%的准确率。

爱范儿3 天

一文看懂 OpenAI 最强模型 o1：怎么用好，为何翻车，对我们意味着什么

使用微信扫码将网页分享到微信 OpenAI o1 发布已经一个星期了，却还是一个洋葱般的谜，等待一层层拨开。极客的玩法没有天花板，让 o1 做 IQ 测试，刷高考卷，解读密文。也有用 AI 打工的用户觉得，o1 并没有那么好用，但不知道是自己的问题还是 AI 的问题。

3 天

o1核心作者MIT演讲：激励AI自我学习，比试图教会AI每一项任务更重要

Hyung Won识别新范式并完全放弃任何沉没成本的能力给我留下了深刻的印象。 2022年底，他意识到了强化学习的力量，并从那时起就一直在宣扬它。他以下一个token预测为例，说明了这种弱激励结构如何通过大规模多任务学习 ...

红板报 on MSN1 天

OpenAI 已经向企业和教育用户开放 O1 系列模型

品玩9月23日讯，据 venturebeat 报道，OpenAI 已向所有 ChatGPT Enterprise 和 ChatGPT Edu 客户提供其最新的人工智能模型 o1-preview 和 o1-mini。 o1系列模型旨在处理复杂的推理任务 ...

4 天

OpenAI 将最新AI 模型 o1 扩展到企业和教育领域

OpenAI 已向所有 ChatGPT Enterprise 和 ChatGPT Edu 客户提供其最新的 AI 模型 o1-preview 和 o1-mini。这些模型专为处理复杂推理任务而设计，有望改变组织和学术机构解决难题的方式，涵盖从 ...

当前正在显示可能无法访问的结果。

隐藏无法访问的结果