搜索优化
Rewards
English
搜索
Copilot
图片
视频
地图
资讯
购物
更多
航班
旅游
酒店
房地产
笔记本
Top stories
Sports
U.S.
Local
World
Science
Technology
Entertainment
Business
More
Politics
时间不限
过去 1 小时
过去 24 小时
过去 7 天
过去 30 天
按相关度排序
按时间排序
1 天
TLDR,o1 技术细节推测汇总了解一下?
3、北大对齐团队分析了 o1 的技术细节,指出 o1 的核心技术在于强化学习的搜索与学习机制,基于 LLM 已有的推理能力,迭代式的 bootstrap ...
21 小时
o1谎称自己没有CoT?清华UC伯克利:RLHF让模型学会撒谎摸鱼,伪造 ...
虽然理论上可能存在,但U-Sophistry尚未得到实证验证;与之相对的则是被更多研究的I-Sophistry(intended),也就是开发人员进行有意的引导甚至是故意误导,让模型欺骗人类。 - R^ {human} (human ...
1 天
o1研发团队首次集体访谈:教AI数r用了一年半
这是在o1团队的“大型见面会”上,OpenAI创始成员Wojciech Zaremba揭开的o1“黑历史”。 包括Zaremba在内的18名团队成员,在首席研究官Bob McGrew的带领之下围坐一团。
19 小时
o1 研发团队完整采访:Ilya 早期曾参与,灵感源于 AlphaGo
刚刚,OpenAI 发布了 o1 研发团队的完整访谈,为我们揭秘了 o1 的「成长历程」。o1 如何一步步蜕变,最终成为一个「智商高达 120」的非凡存在?他们是将强化学习和监督学习两种范式结合起来的?这背后是无数的突破与挑战,OpenAI o1 的研究人员与 OpenAI 研究团队的负责人 Bob McGrew 畅谈了研发过程中的「Aha moments」—— ...
18 小时
昆仑万维颜水成畅谈OpenAI o1:会让一波创业公司重新复活
一年前有人说Ilya Sutskever(OpenAI联合创始人)在“草莓模型”(o1之前的代号叫草莓)里发现了一些让人震惊的、可怕的事情。今天可以大概推测,他当时到底在草莓模型里面发现了什么东西。 颜水成觉得他发现的就是 AI 的学习过程, RL ...
23 小时
o1谎称自己没有CoT?清华UC伯克利:RLHF让模型学会撒谎,伪造证据PUA人类
新智元报道 编辑:编辑部 ...
14 小时
Open AI o1引发范式革命:Kimi创始人杨植麟深度剖析下一代AI模型
在谈到o1模型时,杨植麟表示,这一新模型标志着AI发展的新范式。o1通过强化学习的方式,突破了以往依赖静态数据的局限,能够自主生成数据并进行自我学习。这种方法不仅提高了数据的质量和计算效率,还为AI的进一步发展提供了新的可能性。他指出,o1的推出是对 ...
红板报 on MSN
2 天
北大AI奥数评测,o1-mini比o1-preview分数还高
Omni-MATH团队 投稿量子位 | 公众号 QbitAI OpenAI的o1系列一发布,传统数学评测基准都显得不够用了。 MATH-500,满血版o1模型直接拿下94.8分。 更难的奥数邀请赛AIME 2024,o1也获得83.3%的准确率。
爱范儿
3 天
一文看懂 OpenAI 最强模型 o1:怎么用好,为何翻车,对我们意味着什么
使用微信扫码将网页分享到微信 OpenAI o1 发布已经一个星期了,却还是一个洋葱般的谜,等待一层层拨开。 极客的玩法没有天花板,让 o1 做 IQ 测试,刷高考卷,解读密文。也有用 AI 打工的用户觉得,o1 并没有那么好用,但不知道是自己的问题还是 AI 的问题。
3 天
o1核心作者MIT演讲:激励AI自我学习,比试图教会AI每一项任务更重要
Hyung Won识别新范式并完全放弃任何沉没成本的能力给我留下了深刻的印象。 2022年底,他意识到了强化学习的力量,并从那时起就一直在宣扬它。 他以 下一个token预测 为例,说明了这种 弱激励结构 如何通过 大规模多任务学习 ...
红板报 on MSN
1 天
OpenAI 已经向企业和教育用户开放 O1 系列模型
品玩9月23日讯,据 venturebeat 报道,OpenAI 已向所有 ChatGPT Enterprise 和 ChatGPT Edu 客户提供其最新的人工智能模型 o1-preview 和 o1-mini。 o1系列模型旨在处理复杂的推理任务 ...
4 天
OpenAI 将最新AI 模型 o1 扩展到企业和教育领域
OpenAI 已向所有 ChatGPT Enterprise 和 ChatGPT Edu 客户提供其 最新 的 AI 模型 o1-preview 和 o1-mini。这些模型专为处理复杂推理任务而设计,有望改变组织和学术机构解决难题的方式,涵盖从 ...
当前正在显示可能无法访问的结果。
隐藏无法访问的结果
反馈