中国AI人工智慧聊天机器人DeepSeek在周三发表的一篇论文中,公布了其R1模型的建构成本仅花费了24.9万美元,外媒指出,这笔钱“低得荒谬可笑”(ridiculously low)。 DeepSeek在先前的一篇研究论文中提到 ,其V3模型(类似于Claude等标准聊天机器人模型系列)的训练成本为560 万美元。 这个数字一直存在争议,一些专家质疑它是否包含了所有开发成本(包括基础设施、研发、资料等等),还是只包含了最终的训练运作成本。无论如何,这仍然只是OpenAI等公司建立模型所花费的一小部分,OpenAI执行长奥特曼本人估计GPT-4的成本超过1亿美元。 建立人工智慧模型需要耗费大量资源,包括资料、GPU、 资料中心的能源和水资源消耗、人员成本等等,这可能是一项成本高昂的任务,尤其是对于拥有更大训练资料集的更先进或更强大的模型而言。 对于中国实验室而言, 由于旨在抑制竞争的出口禁令, 取得美国制造的芯片也面临额外的障碍。据报道,DeepSeek能够透过策略性地优化旧芯片来创建成功的模型 ,这也使其拥有竞争优势。 DeepSeek 在论文中指出,它使用512块辉达H800芯片(一款性能较低、专为中国市场设计的产品)来构建R1版本。 DeepSeek发表的一篇论文中,公布其R1模型的建构成本仅花费了24.9万美元。(取自网络) |
电话:647-830-8888|www.66.ca 多伦多六六网
GMT-4, 2025-10-6 10:08 PM , Processed in 0.044861 second(s), 23 queries .
Powered by Discuz! X3.4
Copyright © 2001-2020, Tencent Cloud.