事项:
北京时间12 月7 日,AMD 公布Instinct MI300A 和MI300X 高性能数据中心AI 芯片具体参数,其高性能计算芯片和I/O 芯片通过混合键合3D 堆叠,并与其余小芯片(如8 层堆栈的HBM3)使用2.5D 封装连接,实现创新的“3.5D”异构集成,在执行各类人工智能、高性能计算任务时,性能有望超越英伟达。
国信电子观点:后摩尔时代,芯片制造面临物理极限与经济效益边际提升双重挑战,先进封装在提高芯片集成度、电气连接以及性能优化的过程中扮演了更重要角色。AMD Instinct MI300 系列芯片采用SoIC 和CoWoS-S 技术实现创新性的“3.5D”封装,实现产品性能对英伟达在售H100 系列芯片的超越,印证先进封装在先进芯片制造领域的重要性。通富微电是AMD 最大的封装测试供应商,持续推进5nm、4nm、3nm、Chiplet、2.5D/3D 等技术研发和产能扩充,不断强化与客户的深度合作,有望在本轮AI 创新周期中持续受益。我们维持此前盈利预测,预计2023-2025 年公司营收为230.06、269.71、310.71 亿元,归母净利润为2.41、8.52、12.69 亿元,当前股价对应2023、2024 年146.9、41.5 倍PE 和2.54、2.50 倍PB,维持“买入”评级。
评论:
AMD 发布MI300 技术细节,预测全球AI 加速芯片市场将达4000 亿美元北京时间12 月7 日凌晨,AMD 在Advancing AI 大会上正式公布了Instinct MI300 系列加速芯片的详细规格与性能,以及众多的应用部署案例,将人工智能、高性能计算提升到了新的层次。AMD 早期的计算加速器底层技术都来自和游戏显卡相同的RDNA 架构,之后诞生了专门针对计算的CDNA 架构。第三代的InstinctMI300 系列基于CDNA3 架构,分为数据中心APU(MI300A)、专用GPU(MI300X)两条路线,重点提升了统一内存、AI 性能、节点网络等方面的表现,再加上“3.5D”先进封装、更高能效,以满足生成式AI 的强劲需求。AMD 预计2023 年全球数据中心AI 加速芯片市场规模将达到450 亿美元,至2027 年达4000 亿美元,CAGR 为超过70%,较AMD 之前预计的300 亿美元和1500 亿美元大幅上调。
结合SoIC 和CoWoS 推出“3.5D”封装,助力MI300 性能超越H100,AMD 采用台积电SoIC 和CoWoS-S 技术实现“3.5D”封装,大幅提升MI300 性能和功耗表现。MI300 系列加速芯片主要由台积电N5 制程制造负责计算的CCD(CPU die)、XCD(加速计算die)、台积电N6 制程制造负责输入输出和通信连接的IOD(I/O die)和HBM 颗粒等十多颗芯片异构集成制造。由台积电N7 制程制造的高速缓存3D V-Cache 使用混合键合(Hybrid bonding)方式3D 堆叠在CCD 上;XCD 和CCD 使用混合键合在3D 堆叠在IOD 上;IOD 与HBM 键合在硅中阶层(Silicon interposer)上实现2.5D 封装,最终形成AMD“3.5D”封装。“3.5D”封装通过3D 混合键合实现芯片集成度、功耗表现、互联效率提升,同时可以增加HBM 集成数量,从系统层面全面提升芯片性能和功耗表现。
Instinct MI300X 基于最新一代CDNA3 计算架构的纯GPU 架构。MI300X 集成了八个XCD,每一个XCD 拥有38 个CU 计算单元,总计304 个单元。每两个XCD 为一组混合键合在一个IOD 上,四个IOD 提供了多达七条的第四代Infinity Fabric 连接通道,总带宽最高896GB/s,还有多达256MB Infinity Cache 无限缓存。
八颗12Hi HBM3 通过CoWoS 封装集成在XCD 和IOD 外围,总容量达192GB,提供约5.3TB/s 的超高带宽,MI300X 总计晶体管数量多达1530 亿个。HPC 方面,MI300X FP64 双精度浮点矩阵、矢量性能分别高达163.4TFlops、81.7TFlops,FP32 单精度浮点性能则都是163.4TFlops,分别是H100 的2.4 倍。AI 方面,MI300X TF32 浮点性能为653.7TFlops,FP16 半精度浮点、BF16 浮点性能可达1307.4TFlops,FP8 浮点、INT8 整数性能可达2614.9TFlops,皆为H100 的1.3 倍。
MI300A 是全球首款面向AI、HPC 的APU 加速器,同时将Zen3 CPU、CDNA3 GPU 整合在了一颗芯片之内,使用Infinity Fabric 高速总线互联,从而大大简化了整体结构和编程应用。与MI300X 类似,MI300A 由四个IOD、八颗HBM3 内存通过“3.5D”封装集成,晶体管总量达到1460 亿个。和MI300X 区别主要为MI300A使用8 颗8Hi HBM3,单颗容量由24GB 降至16GB,总容量由192GB 降至128GB。MI300A 可实现CPU 和GPU之间统一内存、共享缓存、动态功耗均衡和简化编程,较需要通过PCB 外部连接CPU 和GPU 的Nvidia GraceHopper,MI300A 在架构上有革命性的提升。性能方面,MI300A FP64 矩阵/矢量、FP32 矢量表现都是H100的1.8 倍,TF32、FP16、BF16、FP8、INT8 则大体相当。
后摩尔时代先进封装重要性凸显,通富微电和AMD 深度合作有望率先受益“后摩尔时代”,大算力芯片的发展受制造成本和“存储墙”、“面积墙”、“功耗墙”和“功能墙”制约。
2015 年以后,集成电路制程的发展进入了瓶颈,7nm、5nm、3nm 制程的量产进度均落后于预期。随着台积电宣布2nm 制程工艺实现突破,集成电路制程工艺已接近物理尺寸的极限,集成电路行业进入了“后摩尔时代”。从成本端来看,IC Insights 统计,28nm 制程节点的芯片开发成本为5130 万美元,16nm 节点的开发成本为1 亿美元,7nm 节点的开发成本需要2.97 亿美元,5nm 节点开发成本上升至5.4 亿美元。从技术端来讲,大算力芯片面临“存储墙”、“面积墙”、“功耗墙”和“功能墙”制约。
芯粒异构集将成为后摩尔时代集成电路发展的关键路径和突破口。芯粒(Chiplet)是指预先制造好、具有特定功能、可组合集成的晶片(Die),应用系统级封装技术(SiP),通过有效的片间互联和封装架构,将不同功能、不同工艺节点的制造的芯片封装到一起,即成为一颗异构集成(Heterogeneous Integration)的芯片。通过芯片异构集成,将传感、存储、计算、通信等不同功能的元器件集成在一起,成为解决只靠先进制程迭代难以突破的平衡计算性能、功耗、成本的难点。
先进封装和异构集成市场进入快速发展期。根据Semiconductor Engineering 预测,全球半导体封装市场规模将由2020 年650.4 亿美元增长至2027 年1186 亿美元,复合增长率为6.6%。受益于数据中心、新能源汽车、5G、人工智能产业的发展,先进封装复合增长率超过传统封装,有望于2027 年市场规模超过传统封装,达到616 亿美元。Chiplet 异构集成的关键技术市场规模进入快速增长期,根据Yole 预计,至2027 年,全球超高密度扇出、HBM、硅中介层、EMIB/Co-EMIB 等为代表的高性能封装方案市场规模将由2021年的27.4 亿美元增长至78.7 亿美元,复合增长率为19%。
通富微电是一家国内领先、世界先进的集成电路封装测试服务提供商,专注于为全球客户提供从设计仿真到封装测试的一站式解决方案。根据2023 年中报,公司与AMD 形成了“合资+合作”的强强联合模式,建立了紧密的战略合作伙伴关系,公司是AMD 最大的封装测试供应商,占其订单总数的80%以上。从技术层面,公司持续推进5nm、4nm、3nm 新品研发,凭借FCBGA、Chiplet 等先进封装技术优势,不断强化与客户的深度合作,满足客户AI 算力等方面的需求;从产能方面,通富通科、南通通富三期工程、通富超威苏州、通富超威槟城新工厂等一批公司重大项目建设稳步推进,施工面积合计约27.3 万平米,积极为未来扩大生产做好充足准备。随着大客户资源整合渐入佳境,公司有望在本轮AI 创新周期中持续受益。
投资建议:全面布局先进封装的封测龙头,维持“买入”评级。
我们维持此前盈利预测,预计2023-2025 年公司营收为230.06、269.71、310.71 亿元,归母净利润为2.41、8.52、12.69 亿元,当前股价对应2023、2024 年146.9、41.5 倍PE 和2.54、2.50 倍PB,维持“买入”评级。
风险提示:需求不及预期;新品研发导入不及预期;国际关系风险等。