来源 :中金在线2021-12-10
2021年11月3日寒武纪发布重磅产品,第三代云端AI芯片思元370和基于该芯片的两款加速卡MLU370-S4、MLU370-X4,以及全新升级的Neuware软件栈等产品的发布,在性能层面直接与在销的T4和A10产品形成对飙关系。
基于台积电7nm制程工艺、整体集成了390亿个晶体管、最大算力达到256TOPS(INT8)的思元370相比英伟达A10和T4的性能对比方面显示了较强竞争力。凭借寒武纪最新智能芯片架构MLUarch03,相较于峰值算力的提升,思元370实测性能表现非常亮眼:同功率性能超过T4两倍还多,完成同样的任务,功耗可以是A10的一半。
此外,思元370是寒武纪首款采用chiplet(芯粒)技术的AI芯片,这点发人深省,芯片厂商必须面对的先进制程、低良品率造成的成本问题,使用chiplet的方式打造新一代芯片或许是未来的重要发展方向,可以提供很好的参考。
思元370还是国内第一款公开发布支持LPDDR5内存的云端AI芯片,内存宽带是上一代产品的三倍,其访存能效达GDDR6的1.5倍。目前思元370已经流片,加速卡等产品送测客户,阿里云、百度、招商银行、浪潮信息等客户都已经完成测试、导入,产品进入到早期销售阶段。
阿里云基础设施异构计算负责人张伟丰博士表示:“阿里云基础设施异构计算团队已经完成了思元370的测试及导入,结合阿里云震旦异构计算加速平台完成了ODLA的接口适配,总体性能表现超出预期。双方将在vODLA池化,HALO编译以及面向业务场景的性能调优等技术领域深度合作。”