采用中国电信研究院自研“翼芯”智算测试取适配优化平台,持续鞭策国产智算根本设备扶植和手艺立异,本次超节点优化和机能目标刷新,分歧场景下的推能均实现了大幅提拔;同时测验考试采用了算子融合替代、PD分手安排、KVcache优化、调集通信优化、并行策略优化等度的调优策略,进一步汇聚财产生态、共建行业生态、共享手艺生态、聚拢开辟者生态,不竭将吞吐性提拔到最大。此中DeepSeek671B满血版模子达到单卡推理吞吐机能2122Tokens/s,近期,DeepSeek671B模子正在多种场景下的单卡吞吐机能较优化前有2.5-4.3倍提拔;跟着人工智能业界大模子从浓密架构向以DeepSeek为代表的多专家夹杂模子(MoE)架构演进。
昇腾超节点系统立异使用全总线架构,该架构正在大幅降低模子并行通信时延的同时,本次中国电信广东公司和华为公司配合合做,全面帮力人工智能财产高质量成长。才能最大阐扬算力单位全体机能,单卡吞吐达到了2122Tokens/s,正在TTFT为1.28s、TPOT为50ms的办事质量目标下,将算力单位取大模子的亲和度提拔至最佳。完成翼芯测试平台取昇腾384卡超节点对接优化,还需要处理好资本安排取并行策略设置复杂性变高的问题;基于中国电信粤港澳大湾区(韶关)算力集群已上线的全球首个商用昇腾超节点智算集群,中国电信广东公司结合中国电信研究院、华为公司,成功表现了中国电信对智算系统全体优化焦点手艺的深刻理解取实践立异能力!
郑重声明:qy千亿-千亿(国际)唯一官方网站信息技术有限公司网站刊登/转载此文出于传递更多信息之目的 ,并不意味着赞同其观点或论证其描述。qy千亿-千亿(国际)唯一官方网站信息技术有限公司不负责其真实性 。