华为发布全新架构的昇腾AI计算集群Atlas 900 SuperCluster-科技创新

9月20日，在华为全联接大会2023期间，华为常务董事、ICT基础设施业务管理委员会主任、企业BG总裁汪涛发表了“加速行业智能化”主题发言，分享了加速行业智能化的观点、举措和实践，正式发布了全新架构的昇腾AI计算集群Atlas 900 SuperCluster，并基于最新推出的行业智能化参考架构，发布了金融、政务、制造、电力、铁路等九大行业智能化解决方案。

　　值得一提的是，全新一代计算集群Atlas 900 SuperCluster，可支持超万亿参数大模型训练的超级集群，以及更开放易用的CANN 7.0 和大模型超级流水线，使能百模千态，加速行业智能化。汪涛表示：“智能化已经掀开新篇章。面对智能时代的机遇与挑战，让我们携手奋进，共筑坚实的算力底座，使能百模千态，深入场景，赋能千行万业，加速行业智能化。”

　　华为常务董事、ICT基础设施业务管理委员会主任、企业BG总裁汪涛发表主题发言

　　行业智能化面临数据、算力、算法、应用部署四大挑战

　　人工智能取得了突破性进展，大模型呈现出百模千态的繁荣局面；在千行万业，人工智能也开始走深向实，服务于越来越多的业务场景。但是，行业智能化的进程中正面临着数据、算力、算法、应用部署等挑战。

　　面对上述挑战，汪涛提出，加速行业智能化关键需要从智联万物、智算万数、智赋万业三个方面着手，协同推进，从而解决AI在行业场景落地难的问题，实现百模千态与行业场景深度融合，赋能千行万业。

　　推出全新架构的昇腾AI计算集群 Atlas 900 SuperCluster

　　随着人工智能进入大模型时代，大算力正在成为人工智能发展的核心引擎。华为改变传统的服务器堆叠模式，以系统架构创新打造AI集群，实现算力、运力、存力的一体化设计，突破大算力瓶颈。

　　面向万亿参数大模型时代，华为推出全新架构的昇腾AI计算集群——Atlas 900 SuperCluster，可支持超万亿参数的大模型训练。新集群采用了全新的华为星河AI智算交换机CloudEngine XH16800，借助其高密的800GE端口能力，两层交换网络即可实现2250节点（等效于18000张卡）超大规模无收敛集群组网。

　　新集群同时使用了创新的超节点架构，大大提升了大模型训练能力。进一步发挥了华为在计算、网络、存储、能源等领域的综合优势，从器件级、节点级、集群级和业务级全面提升系统可靠性，将大模型训练稳定性从天级提升到月级。

　　此外，硬件使能是释放大算力的关键，也是大模型开发的基础。为了加速大模型的创新，华为发布了更开放、更易用的CANN7.0，不仅全面兼容业界的AI框架、加速库和主流大模型，还深度开放底层能力，让AI框架和加速库可以更直接地调用和管理计算资源，使能开发者自定义高性能算子，让大模型具备差异化的竞争力。

　　面向Transformer网络模型的开发，华为升级了Ascend C编程语言，以更高效的编程方式，简化算子实现逻辑，将融合算子的开发周期从2人月缩短到2人周，使能AI模型与应用的快速开发。

　　携手客户和伙伴发布九大行业智能化解决方案

　　过去三年，华为成立行业军团，深入行业、深入场景，纵向缩短管理链条，更好地响应客户智能化需求；横向快速整合研发资源，全力支持千行万业的智能化转型。目前，华为目前通过行业军团化运作，广泛联合业内伙伴，已经面向城市、金融、交通、制造等20多个行业打造了200多个智能化解决方案，并在一系列的智能化项目中得到了应用。

　　华为基于最新发布的行业智能化参考架构，联合客户、伙伴，发布了金融、政务、制造、电力、铁路等九大行业智能化解决方案。未来，华为还将持续与伙伴一起，打造更多的行业方案，推动AI与行业场景深度融合。