【行业资讯】梁文峰在《自然》发表封面论文 DS成首个经过严格学术审查的大模型
中国杭州AI初创公司DeepSeek开发的R1模型近日在《自然》杂志发表了同行评议版本,成为首个经过严格学术审查的主要大语言模型。DeepSeek 创始人兼 CEO 梁文峰为该论文的通讯作者。
这一里程碑式事件不仅揭示了该公司如何以仅29.4万美元的训练成本创造出震撼全球AI产业的模型,更重要的是,它为整个人工智能行业树立了透明度和科学严谨性的新标准。
今年1月,当DeepSeek R1模型发布时,其卓越的推理能力和极低的开发成本瞬间引发全球科技股大幅下跌,纳斯达克指数单日暴跌超过3%,英伟达等AI龙头企业市值蒸发数千亿美元。如今,随着经过同行评议的正式论文发布,这家中国公司的技术路径得到了学术界的认可,同时也为其创新方法提供了更可靠的科学依据。
根据《自然》杂志论文的补充材料首次披露,R1的训练成本仅为29.4万美元,加上构建基础模型的约600万美元,总投入远低于竞争对手动辄数千万美元的开发费用。更值得注意的是,DeepSeek主要使用英伟达H800芯片进行训练,这些芯片自2023年起被美国出口管制禁止向中国销售。
DeepSeek的成功不仅仅是技术突破,更是对全球AI产业发展模式的深刻挑战。其开源策略使R1成为AI社区平台Hugging Face上最受欢迎的开放权重模型,下载量已达1090万次。这种开放模式与美国科技巨头的封闭生态系统形成鲜明对比,为全球AI研发提供了新的范式。
0人