事实上,早在一年多以前,就已经有人指出了这位当时还声名不显的研究者的巨大贡献:他是 GPT 原始论文等多篇奠基性研究成果的第一作者!而更让人惊讶的是, 他并没有博士学位,也没有硕士学位 ;并且他的许多研究成果最早都是在 Jupyter ...
近期,一款由中国新兴AI企业DeepSeek研发的开源大模型DeepSeek-V3,在全球范围内引起了广泛关注。这款模型不仅性能卓越,而且训练成本相对较低,给业界带来了不小的震动。