摆脱辉达？传DeepSeek R2全部用华为芯片

2025-4-30 04:00 AM| 发布者: 拷拉| 查看: 140| 评论: 0|来自: 快科技

　　年初中企深度求索的DeepSeek R1大模型的问世撼动美国AI圈，甚至引发辉达的股价暴跌。在中国与全球AI竞争对手的高度关注下，市场传出更强的新版本DeepSeek R2即将在5月面世，将彻底摆脱辉达芯片，全部基于华为升腾910B（Ascend 910B）芯片。

　　陆媒报道，市场最新爆料，R2大模型将采用更先进的混合专家模型（MoE），总参数量较前代R1提升约1倍，预计达1.2兆（R1总参数量为6710亿），单位推理成本较GPT-4大减97.4%。

　　当下，中国与美国科技战、贸易战愈演愈烈，辉达H20芯片面临新一波出口管制。在DeepSeek R2预期发布时间临近的情况下，各界高度关注中国指标性的大模型，在缺乏美国芯片资源下的发展动向。

　　据传，R2规模与ChatGPT的GPT-4 Turbo以及谷歌的Gemini 2.0 Pro相当，还将结合更智慧的门控网络层（Gating Network），进而优化高负载推理任务的性能。

　　消息指出，R2将彻底摆脱辉达芯片，训练全程均未使用辉达显卡，全部基于华为的升腾910B（Ascend 910B）芯片集群平台。

　　如果这一消息属实，这将降低中国对海外高端AI芯片的依赖。

（示意图）

上一篇：什么原因？北京迟迟不敢发布…下一篇：俗语“宁让男大一辰不让女大一春”啥意思？

		自动登录	找回密码
密码			立即注册

相关分类