阿里发布最新开源模型成本仅为DeepSeek1/3

2025-4-29 04:00 AM| 发布者: Im小乖| 查看: 92| 评论: 0|来自: 界面新闻

　　阿里巴巴4月29日凌晨发布开源新一代通义千问模型Qwen3（简称千问3），参数量仅为DeepSeek-R1的1／3，成本大幅下降，同时是国内首个“混合推理模型”，将“快思考”与“慢思考”集成进同一个模型，大大节省算力消耗。据官方说法，Qwen3的旗舰版本 Qwen3-235B-A22B，在代码、数学、通用能力等基准测试中，达到了与 DeepSeek-R1、o1、o3-mini、Grok-3 和 Gemini-2.5-Pro同一层级水准。

　　据了解，Qwen3系列模型依旧采用宽松的Apache2.0协定开源，并首次支持119多种语言，全球开发者、研究机构和企业均可免费在魔搭社区、HuggingFace等平台下载模型并商用，也可以通过阿里云百炼调用Qwen3的API服务。个人用户可立即通过通义APP直接体验Qwen3，夸克也即将全线接入Qwen3。

　　至于Qwen3 的“混合推理”具体说明上，相当于把顶尖的推理模型和非推理模型集成到同一个模型，目前据称热门模型中只有Qwen3、Claude3.7以及Gemini 2.5 Flash可以做到。

　　在“推理模式”下，Qwen3会执行更多中间步骤，如分解问题、逐步推导、验证答案等，给出更深思熟虑的答案；在“非推理模式”下，模型会直接生成答案，让同一个模型内能完成“快思考”与“慢思考”。这类似于人类在回答简单问题时，凭经验或直觉快速作答，面对复杂难题时再深思熟虑，仔细思考给出答案。

　　同时，Qwen3的部署成本还大幅下降，仅需4张H20即可部署Qwen3满血版，显存占用仅为性能相近模型的三分之一。

鲜花

握手

雷人

路过

鸡蛋

收藏分享邀请

上一篇：热文：2025年墙内居民生存指南下一篇：山寨抄袭？中国皮卡概念车造型引争议

		自动登录	找回密码
密码			立即注册


微信热文	闲聊灌水	时政热点	生活情感	交友聚会	娱乐活动	吃喝玩乐	购物省钱	移民留学	安家置业
投资理财	就业创业	亲子宝贝	学习教育	美食厨房	保健医疗	旅游胜地	汽车天下	体育健身	AI智能

阿里发布最新开源模型成本仅为DeepSeek1/3

最新评论

相关分类

阿里发布最新开源模型 成本仅为DeepSeek1/3

最新评论

相关分类

阿里发布最新开源模型成本仅为DeepSeek1/3