一、从DGX A100看:顶级AI服务器单机PCB≈1.5万是怎么来的?
1.1、五大硬件部分可归纳为三大价值量部分——GPU板组、CPU母板组、配件
电子产品一旦出现标杆性的产品,那么全市场的玩家在产品设计上就会向标杆看齐,因 为对于新发电子产品来说,研究标杆产品能够对远期空间展望找到锚点。AI 服务器我们 瞄准英伟达 DGX A100 和 DGX H100 两款具有标杆性产品力的产品进行分析,鉴于 H100 发 布时间较短、资料详尽度不够,我们首先从 DGX A100 出发来观测具有产品力的 AI 服务 器的基本架构。
英伟达 DGX A100 外形类似于常见的家用主机,通过对部件构成进行深度 分解,我们认为 DGX A100 大体上可以分为五个硬件板块: 1) 风扇模组,从前部(Front)入手,首先看到的是风扇模组板块,DGX A100 的风扇模 组由 8 个风扇组成,这一搭配与传统服务器 8U 规格的基本一致; 2) 硬盘,前部风扇模组板块的下方摆放了硬盘和前控制台板(控制与外接设备的信号 传输),DGX A100 配备了 8 个 3.84TB 的硬盘,合计内部存储 30TB; 3) GPU 板组(GPU Board Tray),后部(Rear)是整个 AI 服务器的关键组件组装区域, 最核心的板块就是 GPU 板组,这也是 AI 服务器区别与普通服务器的关键,从 DGX A100 的架构来看,GPU 板组主要包含 GPU 组件、模组板、NVSwitch 三块,这三块都 会涉及到不同类型的 PCB 产品;
(资料图片)
4) CPU 母板组(CPU Motherboard Tray),这一部分是所有服务器的核心部件(包括普 通服务器和 AI 服务器),其中包含 CPU 母板、系统内存、网卡、PCIE Switch 等部件, CPU 母板、系统内存、网卡是主要涉及到 PCB 用量的部分; 5) 电源模组,DGX A100 后部的下方还配有 6 组电源,电源内部会涉及到厚铜 PCB 板的 使用。 从功能性的角度,我们认为 AI 服务器的 PCB 价值量计算可以归纳为三个部分,其一是 AI 服务器最为核心的 GPU 板组,其二是所有服务器都必备的 CPU 母板组,最后是风扇、 硬盘、电源板块等配件组。本文将基于这三大部分逐一分解。
1.2、GPU板组:单机价值量1.2万,载板占比52%、PCB板占48%
GPU 板组的 PCB 主要是由 4 个部分组成,GPU 载板、NVSwitch、OAM、UBB。1) GPU 载板,英伟达 A100 的 GPU 和 DRAM 采用 2.5/3D 先进封装工艺,用于承载的板材 采用 70*70mm~100*100mm、14~16 层的 FCBGA 载板,数量上与 GPU 数量存在一一对应 关系,按照 DGX A100 搭载 8 颗 GPU 的数量来看,1 台 AI 服务器需要用到 8 颗 GPU 载 板;根据产业链调研,单颗价值量约为 100 美元,即 650 元人民币/颗,由此对应单 机 GPU 载板价值量为 5200 元。2) NVSwitch,基于 NVLink 标准用于 GPU 之间通信的基础模组,搭载 NVSwitch 的载体 是类似于载板的产品,加工性要求较简单、关键是承担多数据量高速传输的性能, 根据产业链调研单颗价值量约为 30 美元,即 195 元/颗,按 A100 搭载 6 颗计算可得单机价值量为 1170 元。
3) OAM,OCP Accelerator Module,中文简称 GPU 加速卡,是用于承载 GPU 芯片的板卡, 数量上看 OAM 与 GPU 存在一一对应的关系,以 DGX A100 搭载 8 个 GPU 的数量来看, 1 台 AI 服务器需要用到 8 块 OAM;面积上来看,借鉴 PCIE 版本 267.7mm*111.15mm 的尺寸规格(内部 PCB 规格与外壳规格基本一致),可测算出 OAM 的面积尺寸约为 0.03 平方米;PCB 板型上来看,由于 OAM 涉及到 GPU 高速多线路信号传递,根据产 业链调研,DGX A100 OAM 的 SXM 版本需要用到 20 层、Ultra Low Loss 等级 CCL 材 料、4 阶 HDI 工艺,对应产品单价为 12000 元/平方米,DGX A100 OAM 的 PCIE 版本1 相对规格较低,只需要用到 14 层、Ultra Low Loss 和高 Tg FR4 等级 CCL 材料混压、 1 阶 HDI 工艺,对应产品单价 7000 元/平方米。综合来看,如果按照 DGX A100 机型 配置,高端 AI 服务器的 OAM 单价价值量将达到 2880 元。
4) UBB,Unit Baseboard,中文简称 GPU 模组板,是用于搭载整个 GPU 平台的 PCB 板, 1 台 AI 服务器对应 1 块 UBB,根据 DGX A100 整机底面规格和产业链调研,我们预估 UBB 面积约为 0.30 平方米,需要用到 26 层通孔 PCB 板,CCL 材料运用 Ultra Low Loss,对应单价约为 10000 元/平方米,对应单机价值量为 3000 元。
综上合计,英伟达 DGX A100 GPU 板组主要由 GPU 载板、NVSwitch、GPU 加速卡、GPU 模 组板四部分组成,四部分合计单机 PCB 面积达到 0.624 平方米,对应 PCB 单机价值量为 12250 元,其中载板级别的产品单机价值量为 6370 元、占比 52%,PCB 级别的产品单机 价值量 5880 元、占比 48%。
1.3、CPU母板组:单机价值量2845元,载板占46%、主板占40%
CPU 母板组涉及到 CPU 载板、CPU 主板和配板,其中功能性配板包括系统内存卡、网卡、 拓展卡、存储操作系统驱动板。1) CPU 载板,根据产业链调研,CPU 载板与 GPU 载板规格相近,如果按单颗 CPU 载板价 值量 100 美元、DGX 搭载 2 颗 CPU,则单机价值量约为 1300 元。 2) CPU 主板,主要用于承载 CPU 芯片、PCIE Switch 芯片、TPM 模组及各种功能性配板 卡,该类 PCB 板的规格主要由 CPU 平台设计和总线标准,按照 DGX A100 的方案主要 采用 64 核 AMD Rome 的 CPU 芯片、总线标准仍然为 PCIE 4.0,因此 CPU 主板仍然采 用 10~12 层、Low Loss 等级 CCL 材料、通孔板的设计,根据产业链调研,单价约为 3000 元/平方米;按照 DGX A100 的尺寸规格设计,估测 CPU 主板面积为 0.38 平方米, 由此可计算 CPU 主板单机价值量为 1140 元。
3) 功能性配板,配板种类较多,根据产业链调研,配板一般采用的规格是 8~10 层板、 Mid Loss 等级 CCL,单价约为 1500 元/平方米,面积和数量参照 DGX A100 则为: CPU 内存卡,DGX A100 设计配置 32 块 CPU 内存卡、合计 2TB RAM,一般来说服 务器 CPU 内存卡行业有较为统一的标准尺寸,估测单块内存卡面积约为 0.004 平方米/片;网卡,DGX A100 网卡采用 Mellanox ConnectX 系列产品(有 X-7 和 X-6 的产品 选配),标配的网卡为 10 张(8 个单端口 200Gb/s 的 IB,2 个双端口 200Gb/s 以 太网),根据英伟达官网披露 Mellanox ConnectX-7 的尺寸 68.90mm*167.65mm, 计算可得单块网卡板面积约为 0.012 平方米/张;
拓展卡,Riser Card,服务器会因为板卡摆放设计而用一些拓展卡来拓展 PCIE 接口,DGX A100 中因为有一张横置 Storage networking 网卡,因此需要设置一 张拓展卡,根据产业链调研该拓展卡面积约为 0.01 平方米/张;存储操作系统驱动板,DGX A100 中会搭载 2 个 1.92TB M.2 NVMe 的系统驱动器, 但两个驱动器是搭载在一张 PCB 板的两面,因此系统驱动板只有 1 块,面积约 为 0.01 平方米/张。 上述四部分合计,功能性配板单机面积为 0.27 平方米,对应单机价值量约为 405 元。
综上合计,英伟达 DGX A100 CPU 母板组 PCB 用量面积合计为 0.662 平方米,单机价值量 约为 2845 元,其中载板级产品占比 46%,PCB 级的主板产品占比 40%,PCB 级的配板产品 占比 14%。
1.4、其他配件:单机价值量合计226元
除 GPU 板组和 CPU 模板组外,其他配件还包括电源、硬盘、前控制台板等,根据产业链 调研,这一类产品主要采用 6~10 层、FR4/Mid Loss 等级 CCL 的规格,单价约为 1000~1500 元/平方米不等,参照 DGX A100 规格对用量和面积进行计算则为: 1) 电源,从用量上看 DGX A100 搭配 6 个电源,参照台达电 2200W 服务器电源 DPS2200-AB-2 型号 73.5*265.0mm 的规格,我们估测单个电源用 PCB 板面积为 0.019 平 方米; 2) 硬盘,从用量上看 DGX A100 搭配 8 个硬盘,参照行业标准 3.5’’盘,我们估测单 块硬盘中 PCB 面积为 0.008 平方米; 3) 前控制台板,主要用于控制外接设备,是放在 8 个硬盘中间的 1 块 PCB 板,根据产 业链调研,我们估测该板面积约为 0.010 平方米。
综合来看,DGX A100 的配件用 PCB 板用量面积约为 0.188 平方米,单价价值量合计约为 226 元。综合 GPU 板组、CPU 模板组和配件,我们估测 DGX A100 整机 PCB 用量面积为 1.474 平方 米,单机价值量为 15321 元,其中 GPU 板组单机价值量达到 1.2 万元、占比达到 80%, CPU 母板组单机价值量为 2845 元、占比为 19%,其他配件单机价值量 226 元、占比为 1%; 从板级的分类来看,载板级别单机价值量为 7670 元、占比达到 50.1%,PCB 板级单机价 值量为 7651 元、占比为 49.9%。
二、普通vsA100vsH100,PCB价值量到底如何提升
在分解完DGX A100后,基于边际变化分析的角度,我们认为可以通过两方面的对比来把 握未来变化关键点,一方面对比 DGX A100 和普通服务器,以观测 AI 带来的价值增量; 另一方面对比DGX A100和DGX H100以观测未来 AI 技术继续迭代的情况下 PCB 的增量点。
2.1、普通vsA100:普通单机2425元,95%的价值增量贡献来自GPU板组
依据前述拆解方式,我们选取市面上较为先进的 2U 普通服务器华为 2288H V6(双路服 务器,PCIE 4.0)为普通服务器代表,通过拆解分析,我们估测普通服务器的 PCB 用量 面积为 0.630 平方米,并且根据产业链调研,普通服务器功能板块的 PCB 板型规格与 AI 服务器中 CPU 母板组和配件组相差不大,由此合计估测单机价值量为 2425 元。
对比普通服务器和以 DGX A100 为代表的 AI 服务器,AI 服务器所用 PCB 单机价值量相对 普通服务器提升 532%,增量贡献主要来自算力需求(贡献增量的 95%)和集中度提升 (贡献增量的 5%),其中载板级的单机价值量提升 490%、增量贡献主要来自算力需求 (贡献增量 100%),PCB 板级的单机价值量提升 580%、增量贡献 90%来自算力而 10%来自 集中度提升。
2.2、A100vsH100:H100单机1.95万元,83%的价值增量贡献来自GPU板组
再对比新款 DGX H100 和 DGX A100,我们发现新产品架构有一些变化,同样分三个部分 来看: 1) GPU 板组,性能提升之后相应 PCB 的规格也会有所提升,具体来看GPU 载板,芯片性能增加,封装架构也会升级(如搭配 HBM3),根据产业链调研, H100 单片载板价值量会提升 30%、约为 150 美元/片,在数量和面积变化不大的 情况下,估测单机价值量为 7800 元,单机价值量相对 A100 方案提升 50%; NVSwitch,集成度提高导致数量减少为 4 片,单价估测提升至 40 美元/片,因此对应单机价值量为 1040 元,单机价值量相对 A100 方案有所下降 11%;
GPU 加速卡(OAM),由于芯片性能有所提升,加速卡的工艺规格升级为 5 阶 HDI, 对应单价提升至 15000 元/平方米,在数量和面积没有变化的情况下,估测单机 价值量提升至 3600 元,相比 A100 提升 25%; GPU 模组板(UBB),集成度提高使得模组板的设计相对更紧凑,但层数和工艺变 化不大,对应单价提升至 11000 元/平方米,在数量和面积没有变化的情况下, 估测单机价值量提升至 3300 元,相比 A100 提升 10%。 由此,DGX H100 GPU板组PCB用量的面积为 0.612 平方米,单机价值量提升至 15700 元,相比 A100 版本提升 28%,主要提升点来自 GPU 载板、GPU 加速卡(OAM) 和模组板(UBB)。
2) CPU 母板组,CPU 母板有升级,网卡集成度显著提升,具体来看CPU 载板,CPU 芯片虽然有相应升级,但封装承载结构变化不大,根据产业链调 研预估 DGX H100 的 CPU 载板价值量保持为 1300 元;CPU 母板,DGX H100 采用 PCIE 5.0 总线标准,CPU 芯片平台升级,根据产业链 调研 PCIE 5.0 服务器主板的单价会提升至 5000 元/平方米,因此在面积不变的 情况下单机价值量提升至 1900 元,相比 A100 方案提升 67%; 其他配板,整体变化不大,值得一提的是网卡板的形态由 A100 的 Mellanox 成 熟设计插拔的方案变为 2 张集成 4 芯片的 ConnectX-7 的 PCB 板(对应 8 个端 口)、2 张单芯片双端口的 NVIDIA BlueField-3 DPU VPI 网卡板、1 张 RJ45 接 口板载网卡、1 张以太网可选网卡合计 6 张网卡板,相较 A100 方案网卡板数量 下降但集成度和性能有所提升; 综合计算,我们估测 DGX H100 CPU 板组 PCB 用量的面积为 0.628 平方米,单机价值 量提升至 3554 元,相比 A100 版本提升 25%,主要提升点来自 CPU 母板。
3) 配件,DGX H100 仍然保持电源 6 个、硬盘 8 个、前控制台板 1 块的配置,PCB 板规 格变化也不大,因此我们估测配件用量仍为 0.188 平方米,单机价值量为 226 元。我们估测 DGX H100 服务器的 PCB 用量面积为 1.428 平方米,单机价值量为 19520 元,其 中 GPU 板组单机价值量达到 1.57 万元、占比达到 81%,CPU 母板组单机价值量为 3554 元、 占比为 18%,其他配件单机价值量 226 元、占比为 1%;从板级的分类来看,载板级别单 机价值量为 10140 元、占比达到 51.9%,PCB 板级单机价值量为 9380 元、占比为 48.1%。
对比 DGX A100 和 DGX H100,平台升级将使得 PCB 单机价值量提升 27%,增量贡献 83%来 自 GPU 板组、17%来自 CPU 母板组,其中载板级的单机价值量提升 32%、增量贡献主要来 自 GPU 板组(贡献增量 100%),PCB 板级的单机价值量提升 23%、增量贡献 59%来自 GPU 板组而 41%来自 CPU 母板组。
2.3、价值增量来自GPU板组,后续升级载板增速高于PCB板级
综合前文拆解情况,我们认为 AI 服务器相对普通服务器的 PCB 单机价值量增幅为 532%, 其中载板级别增幅 490%、PCB 板级别增幅 580%,PCB 板级增幅较大的原因在于普通服务 器的 PCB 的价值量低于载板级产品;再者,AI 服务器升级过程中,载板级别增幅为 32%、 PCB 板级别产品增幅为 23%,可以想见 AI 服务器升级中与 GPU 相关度越高则增值幅度越 大。
2.4、AI服务器PCB存在三种供应关系,须分别把握产业链逻辑
AI 服务器涉及到的三个部分,供应关系的决定权会有一定的区别,具体来看: 1) GPU 板组,所涉及到的 4 个板块均由 GPU 设计厂商全权设计,对应的 PCB 板的供应关 系决定权也就由 GPU 设计厂决定;GPU 设计厂通常给品牌服务器厂商(国内产业链为 主)和云计算厂商(海外产业链为主)交付整个 GPU 板组,有些情况 GPU 设计厂会 给客户交付 GPU 加速卡(PCIE 版本),极少情况 GPU 设计厂会直接给客户交付芯片。 综合来看我们认为 PCB 在 GPU 板组供应链的决定权主要掌握在 GPU 设计厂手中。
2) CPU 板组,遵循既有的服务器厂商供应链关系,即 CPU 载板由 CPU 设计厂决定,CPU 模板和一些整套系统所需要用到的拓展卡板由终端客户决定,而其他带芯片的 PCB 板大部分的场景是客户向功能件厂商提出设计需求,然后由功能件厂商自行决定 PCB 的采购。 3) 配件,配件通常是客户直接购买模组厂成熟的产品,部分场景是客户会向配件模组 厂商提出一定的设计需求,但不影响模组厂商对 PCB 采购的决定权。 基于此,在考虑 PCB 厂商在 AI 服务器中的成长机会时,应当区分供应产品所处的产业链 关系,从而把握逻辑真相。
三、重点企业分析
根据前述,AI 服务器 PCB 价值量是普通服务器的价值量的 5~6 倍,随着 AI 大模型和应 用的落地,市场对 AI 服务器的需求日益增加,市场扩容在即。以 DGX A100 为例,15321 元单机价值量中 7670 元来自载板、7651 元来自 PCB 板,因此我们应当关注在载板和服 务器 PCB 上具有较好格局的厂商,
1) 沪电股份:公司 2022 年营收占比中,高速通信类占 66%,汽车占 23%,高速通信类 是保证公司成长的关键。公司高速通信产品主要用于交换机、服务器、运营商通信, 客户覆盖包括国内外主要的设备商和云计算厂商,是 A 股 PCB 中涉及海外高速运算 敞口最大的厂商,也是参与全球 AI 运算供应的关键厂商,未来有望随着 AI 市场扩 容而实现快速增长。公司汽车类产品主要供应全球龙头 TIER1 厂商,并且依据多年 的技术积累不断调整产品结构至覆盖多类域控制器用 HDI 产品,汽车智能化趋势将 为公司带来成长贡献。
2) 生益科技:从基本面的逻辑出发,公司作为全球第二大的覆铜板厂商,订单景气度 随着电子行业整体回暖而将会逐季改善,并且我们认为公司能够凭借其强大的竞争 力(产品系列全、产品品质优秀、客户和原材料管理能力强等)先于行业走出景气 低谷、实现单张毛利反转,基本面胜率有一定的保证。从竞争格局上来看,公司是 国内少有全系列覆盖高端产品的厂商,随着 AI 带动高端市场成长放量,公司有望加 速自身产品结构调整进程,打开盈利增长空间。公司 2022 年实现归母净利润 15.31 亿,我们预计 2023~2024 年归母净利润为 23.5 亿元和 34.3 亿元,对应 2022~2024 年 PE 为 30X/20X/13X。
3) 联瑞新材:根据 2022 年年报数据,公司产品结构中球硅占 53%、角硅占 35%、球铝 占 11%。高端服务器载板和 PCB 板中打开球硅在 PCB 产业链的应用,AI 服务器 GPU 所采用的 2.5/3D 封装外壳 EMC 需要用到 20um cut 及以上等级的球硅和 low-α球铝, 因此在当前 AI 等高速运算需求带来高端产品扩容的大背景下,公司有望依据现有已 经站好的竞争格局实现成长。公司 2022 年实现归母净利润 1.88 亿,我们预计 2023~2024 年归母净利润为 2.51 亿元和 3.52 亿元,对应 2022~2024 年 PE 为 55X/41X/29X,公司竞争力强且参与全球高端球硅供应。
4) 生益电子:公司是传统高速通信类覆铜板生产厂商,在服务器需要用到高多层板上 具有深厚的技术积累,公司服务器类客户覆盖了国内主流客户群和海外部分客户, 随着国内加大训练端算力需求、海外 AI 相关应用加速推出,公司服务器类 PCB 将迎 来增长。
5) 兴森科技:根据公司 2022 年年报数据,公司 PCB 产品占比 75%、半导体产品占比 21%,其中半导体产品主要来自封装基板和半导体测试板,公司是国内布局封装基板 第一梯队的厂商之一。公司目前配合下游终端厂商研发服务器用 FCBGA 高端载板, 是高端载板国产替代的先行者。
6) 深南电路:根据公司 2022 年年报数据,公司 PCB 产品占比 63%、封装基板占比 18%、 电子装联占比 12%,其中 PCB 产品有配套国内外品牌服务器厂商主板产品,封装基板 是国内封装基板规模最大的厂商、目前正在配套下游终端厂商研发高端 FCBGA 产品, AI 带动的载板和 PCB 板价值量增长将有助于公司成长。
(本文仅供参考,不代表我们的任何投资建议。如需使用相关信息,请参阅报告原文。)
关键词: