多伦多 六六网  www.66.ca

 找回密码
 立即注册

扫描二维码登录本站

搜索

“低得荒谬可笑” DeepSeek R1模型惊人成本曝

2025-9-22 03:00 PM| 发布者: ★kings★| 查看: 87| 评论: 0|来自: 自由时报

中国AI人工智慧聊天机器人DeepSeek在周三发表的一篇论文中,公布了其R1模型的建构成本仅花费了24.9万美元,外媒指出,这笔钱“低得荒谬可笑”(ridiculously low)。

DeepSeek在先前的一篇研究论文中提到 ,其V3模型(类似于Claude等标准聊天机器人模型系列)的训练成本为560 万美元。

这个数字一直存在争议,一些专家质疑它是否包含了所有开发成本(包括基础设施、研发、资料等等),还是只包含了最终的训练运作成本。无论如何,这仍然只是OpenAI等公司建立模型所花费的一小部分,OpenAI执行长奥特曼本人估计GPT-4的成本超过1亿美元。

建立人工智慧模型需要耗费大量资源,包括资料、GPU、 资料中心的能源和水资源消耗、人员成本等等,这可能是一项成本高昂的任务,尤其是对于拥有更大训练资料集的更先进或更强大的模型而言。

对于中国实验室而言, 由于旨在抑制竞争的出口禁令, 取得美国制造的芯片也面临额外的障碍。据报道,DeepSeek能够透过策略性地优化旧芯片来创建成功的模型 ,这也使其拥有竞争优势。

DeepSeek 在论文中指出,它使用512块辉达H800芯片(一款性能较低、专为中国市场设计的产品)来构建R1版本。

DeepSeek发表的一篇论文中,公布其R1模型的建构成本仅花费了24.9万美元。(取自网络)


鲜花

握手

雷人

路过

鸡蛋

最新评论

电话:647-830-8888|www.66.ca 多伦多六六网

GMT-4, 2025-10-6 10:08 PM , Processed in 0.044861 second(s), 23 queries .

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

返回顶部