6月30日,华为正式宣布开源盘古大模型openPangu 2.0 Flash版本,标志着这家科技巨头在自主大模型领域的开源战略迈出关键一步。此次开源内容涵盖模型权重、基础推理代码及训推算子,已全面上线开源平台,供全球开发者下载使用。

从封闭走向开放:余承东亲自挂帅
这一时间节点的到来,源于两周前华为开发者大会(HDC 2026)上的一次高调宣告。华为常务董事、产品投资评审委员会主任、终端BG董事长余承东亲自登台,正式发布openPangu 2.0,并宣布将于6月30日起陆续开源7大核心组件,包括模型结构、模型权重、技术报告、推理代码、预训练代码、后训练代码及训练算子。
余承东在演讲中坦言了一段颇为罕见的自我反思:华为在全世界都不知道大模型为何物时,便发布了国内首个大模型,是行业的"绝对先驱",但后来因种种原因"没做好,不应该"。他透露,去年国庆节前夕,他重新受命负责盘古大模型业务,并随即以一句强硬表态定下基调——"在余承东字典里,没有第二,只有第一。"
双版本格局:Flash先行,Pro七月跟进
openPangu 2.0采用Pro与Flash双轨并行的产品策略,两者均支持512K超长上下文窗口,以覆盖从轻量化部署到旗舰级应用的不同算力需求。
Flash版本作为首发开源版本,总参数量为92B,激活参数量仅为6B,以极高的稀疏比(最大28:1)实现了出色的推理效率,主要面向轻量化部署场景。Pro版本则是旗舰主力,总参数量达到505B,激活参数量18B,大幅强化了Agent任务执行能力,其模型权重与基础推理代码将于7月上线开源平台。更多开源组件将在今年下半年陆续向社区开放。
技术底色:昇腾原生架构与稀疏MoE创新
openPangu 2.0的技术亮点之一,在于其深度适配华为昇腾(Ascend)NPU的架构设计。官方数据显示,在昇腾硬件加持下,该模型单卡吞吐率可达业界主流开源模型的2倍,体现了软硬协同优化的显著红利。
在模型架构上,openPangu 2.0采用了一种名为混合分组专家(MoGE,Mixture of Grouped Experts)的创新设计。该架构在全局路由器之上,将专家网络按设备数量分组,每个Token被约束为在其所属分组内激活固定数量的专家,而非从全局专家池中自由竞选。这一机制从构造上将设备间的负载不均衡得分锁定为零,从根本上消除了传统MoE路由中"某张卡忙死、另一张卡闲置"的经典痛点,使大规模分布式推理的效率与稳定性得到保障。
基准测试表现:优势明显,短板亦存
从第三方基准测试的初步评估来看,openPangu 2.0的思维链(Thinking)模式表现可圈可点:在AIME 2026上位列全球约第8名,在LiveCodeBench V6上排名第9,展现出较强的数学与代码推理能力。相对薄弱的环节则在于博士级科学问答(GPQA-Diamond,约第26名)以及软件工程实战评测(SWE-bench Verified,约第50名),存在进一步提升的空间。
开源战略的更深意涵
openPangu 2.0的开源,是中国头部科技企业在大模型领域持续扩大开放生态的又一缩影。在DeepSeek、通义千问等国产开源模型已积累大量全球开发者社区口碑的背景下,华为此番不仅拿出了模型权重,更同步释放训练算子与推理代码,体现出对全链路开源的更高诚意。
尤为值得关注的是,openPangu 2.0全程基于华为昇腾NPU训练,这意味着整套开源生态——从硬件、芯片软件栈(CANN)到模型本身——均构建于自主可控的技术体系之上,在当前国际芯片供应链高度不确定的环境下,这一点具有超越模型性能本身的战略意义。
目前,模型权重已在开源平台上线,同时提供基于昇腾推理系统、MindIE及vLLM-Ascend的推理示例代码,亦支持在Transformers框架(torch 2.1.0及以上)中运行,量化权重将于近期发布。