中国人工智能公司深度求索(DeepSeek)创始人梁文锋有关DeepSeek-R1大语言模型的论文,登上了学术期刊《自然》(Nature)的封面。 据《科技日报》报道,梁文锋及DeepSeek团队星期三(9月17日)在《自然》封面发表了开源人工智能(AI)模型DeepSeek-R1所采用的大规模推理模型训练方法。 梁文锋团队报告称,模型使用了强化学习而非人类示例来开发推理步骤,减少了训练成本和复杂性。DeepSeek-R1在被展示优质的问题解决案例后,会获得一个模板来产生推理过程,这一模型通过解决问题获得奖励,从而强化学习效果。 团队总结说,未来研究可以聚焦优化奖励过程,以确保推理和任务结果更可靠。 《自然》在社论中称,目前没有任何一种主流大型语言模型在学术期刊中经历过独立的同行评审,这一状况随着《自然》杂志发表有关R1模型的详细信息而发生变化。 社论称,R1模型已经过八名专家评审,评估了原创性、方法论和稳健性,并呼吁其他公司效仿DeepSeek的做法。“在一个未经证实的言论和炒作屡见不鲜的行业中,所有这些都是朝着透明度和可重复性迈出的可喜一步。” |
电话:647-830-8888|www.66.ca 多伦多六六网
GMT-4, 2025-9-19 12:01 PM , Processed in 0.044399 second(s), 23 queries .
Powered by Discuz! X3.4
Copyright © 2001-2020, Tencent Cloud.