满足人工智能日益增长的电力需求需要持续创新硅基功率 MOSFET 技术。
能源使用一直是数据中心运营商的担忧,但随着人工智能的兴起,这一挑战变得更加严峻。维持人工智能工作负载爆炸性增长所需的电力量逐年攀升,使得实现尽可能高的能源效率变得至关重要。
英飞凌有一套从电网到核心提升整个能源系统性能的策略,但在这里,我们将重点关注人工智能如何影响数据中心架构,以及这些变化对服务器和机架技术意味着什么。具体来说,我们将讨论如何通过转向 48 伏架构来提高数据中心能源效率,以及高性能硅 MOSFET 如何被用于服务器、机架和相关设备,以支持这一架构演进。
数据中心和电力
目前,数据中心约占全球总电力使用的2%,到2030年可能上升至7%。为了更好地理解这一点,目前全球数据中心的总电力消耗量约占印度全国总电力消耗量的份额。
AI 需求快速增长正推动这些预测的实现。大多数 AI 工作负载在 GPU 上运行效果更佳,而运行 AI 工作负载的 GPU 消耗的功率也更多。两者共同产生的废热也远超以往,这需要更广泛的冷却系统,而这些系统又需要消耗更多的功率。
满足数据中心行业对电力的预测需求将需要全球范围内的巨额投资来建设许多新的发电厂。这也解释了为何必须尽可能提高数据中心的能源效率。
数据中心电源演进
为了使数据中心更加节能,行业已采取的最重要措施之一是从 12V 中间总线电压过渡到 48V 电源传输架构。
一个机架通常容纳四台或更多服务器。任何包含运行 CPU 的服务器的机架,目前可能使用 3 千瓦到 5 千瓦的功率,但一个充满运行高性能 GPU 和加速器、处理 AI 工作负载的服务器的机架,则可能使用 10 千瓦到 100 千瓦甚至更多的功率。
后果很容易预测。假设电压保持一致,电阻会随着电流的增加而增加(P=I2R),导致传输损耗增加。毫不奇怪,数据中心的电流预计将以很高的速度持续增加。
考虑到所有这些因素,为了最小化传输损耗并实现更高效的电力传输方式,必须转向更高电压。数据中心转向48伏架构是在几年前开始的。
随着数据中心交流电进入机架,它被转换为直流电并多次降压,越来越多地转换为 48 V,然后转换为 12 V 或 6 V,最终转换为满足不同服务器中安装的各种处理器(CPU、GPU、TPU)需求的精确电压。处理器需求通常约为 1 VDC.
优化这一过程中的每个阶段对于最小化能量损失和最大化效率至关重要。这就是高性能 MOSFET 至关重要的地方。
MOSFET 的作用
MOSFETs 对于高效电源转换至关重要,从引入 208-至 277-VAC 输入开始,在每个步骤中逐步降至 48 V、12 V、6 V 和 1 V 或更低,通过电源传输网络从机架到电路板再到集成电路。在这些路径上,MOSFETs 也用于交流至直流的转换。
MOSFET 对于电源传输系统和几个机架和服务器子系统至关重要。这些包括开关电源(SMPS)、电源供应单元(PSU)、中间总线转换器(IBCs)、负载点(POLs)和电池备份单元(BBUs)。
在电力设计中,使用超过标称电压的 MOSFET 是一个常规做法,因此采用 48V 中间总线决定了需要使用 25V 至 650V 的 MOSFET。
从电网进入数据中心的电力会通过一个开关电源(SMPS),通常是钛级开关电源(根据定义,效率大于 97%)。数据中心通常指定钛级电源技术,也就是说,目前市面上最高能效的版本。
电源适配器
机架中的平均电源架包含六个 PSU。MOSFET 用于 PSU 进行功率因数校正(PFC),在主侧和次侧的隔离式 DC/DC 电源转换器中,并且 MOSFET 可以在 DC 输出的 ORing 电路中替代二极管使用。
650-V MOSFETs 正用于 PFC 和隔离式 DC/DC 转换器阶段的主电路;这些可以是英飞凌 CoolMOS™超结 MOSFETs 等硅基 MOSFETs,也可以是 CoolSiC™等碳化硅 MOSFETs。LLC 是隔离式 DC/DC 转换器阶段最常用的拓扑结构。LLC 转换器(带全桥整流器)的次级同步整流 FETs 以及输出端的 ORing MOSFETs 通常使用 80-V MOSFETs。英飞凌 80-V OptiMOS™ 6 功率 MOSFET 技术通过提供低 RDS(on) 的 MOSFETs,显著提升了性能,从而实现了更高的系统效率。
除了最大功率效率,PSU 设计人员还在寻找尽可能紧凑的器件,以实现更高的功率密度,并支持热管理。
中间总线转换器
每个机架中的每台服务器都有大量的计算机托盘和交换机托盘。IBC 需要将 48V 电源转换为机架内各种子系统所需的多个电压等级。
为此,多个 MOSFET 被集成到电源分配板上的 48V 第一级转换器中,在那里必须高效地将电源降至中间电压,通常是 12V、9.6V、8V、6V 和 4.8V。
GPU 板上的第二级 POL 转换器需要更多的 MOSFET,通常是 25V 的 MOSFET,以高效地将电源降至 1V 或接近 1V 的电压,具体取决于所用特定处理器的需求。AI 加速器模块的功率已经超过 750W,电流高达 1000A(在 0.75V 核心电压下)。在一个主板上最多有八个这样的模块,功率额定值和热管理努力变得具有挑战性。
服务器机架有多种可能的配置方式,这将决定 IBC(集成基础架构模块)自身的配置。设计人员需要考虑散热管理选项(例如,风冷与水冷);平衡质量与可靠性要求,以实现目标故障间隔时间;随着 GPU 功耗的增加,预估功率密度需求;并考虑在总拥有成本(TCO)的前提下提高效率。
再次,一切都取决于具体的配置,但通常情况下,80-V MOSFETs 倾向于用于主/输入侧,而 15-V 至 60-V MOSFETs 则常用于次/输出侧。英飞凌的 OptiMOS™功率 MOSFETs 提供卓越的同类最佳性能,其特点包括超低 RDS(on) 和改进的品质因数,非常适合高开关频率应用。
BBUs 和热插拔
MOSFETs 同样在每台服务器机架的 BBU 中也是必需的。电池管理系统和内部 DC/DC 转换器通常都包含 80V 和 100V 的 MOSFETs。
还有一个子系统,其中 MOSFETs 起着关键作用。数据中心被设计为可以热插拔板,无论是更换故障板还是升级,通常倾向于更强大或具有新处理能力的类似板。MOSFETs 为热插拔提供保护;这些通常是 100V 的 MOSFETs。
封装
随着应用需求变得更加严苛,任何功率器件的性能都不能不考虑器件封装。这一点对于 AI 服务器和其他任何高要求应用同样适用。
MOSFET 的导通电阻(RDS(on))是硅电阻(Rsi)和封装电阻(Rpack)的总和。随着时间的推移,随着硅技术的改进,Rsi一直持续减小。
持续减小 Rsi的结果是,Rpack在 RDS(on)中的占比越来越大。未来,为了获得最佳性能,需要降低 Rpack,以提高整个功率器件的整体效率和热性能。
先进的封装技术也将降低寄生电感,这将有助于提升开关性能。这对于 AI 服务器等应用至关重要,因为这些应用中功率密度要求不断提高,开关频率也在增加。
改进的封装概念还使器件能够支持更高的电流额定值,这有助于应对系统功率额定值不断增长的挑战。
摘要
数据中心中的能源使用模式使能源效率成为一项迫切需求。在数据中心内管理电力几乎与数据处理本身一样是一项工程挑战。
能源效率必须从离散组件开始,并一直追求到系统级别。数据中心规模庞大,即使是在微瓦级别的任何能源减少,由于在整个设施中不断复制,也会变得相当可观。即使是 MOSFET 也至关重要。