制造比特:12月29日

Chiplet-based exascale计算机;百亿亿次系统的新“前沿”;Exascale一天。

受欢迎程度

Chiplet-based exascale计算机
在最近的IEEE国际电子器件会议(IEDM)上,CEA-Leti发表了一篇关于电子器件的论文3D芯片技术使百亿亿级计算系统成为可能。

美国和其他国家正在研究百亿亿次超级计算机。今天的超级计算机是以每秒浮点运算来衡量的。世界上最快的超级计算机可以达到几百千万亿次。到明年,世界上最快的系统将达到exaflop或exascale级别。

百亿亿次计算机每秒至少可计算10¹³,即10亿亿次浮点运算。这大约是当今超级计算机速度的两倍或更多。百亿亿级系统将使医学、物理学、科学发现、天气预测等领域的新突破成为可能。

基于经典计算方法,百亿亿次超级计算机不同于量子计算。在经典计算中,信息是以位的形式存储的,位可以是“0”或“1”。在量子计算中,信息存储在量子比特中,量子比特可以以“0”或“1”或两者的组合形式存在。

叠加态使量子计算机能够同时进行数百万次计算,从而使其性能优于传统系统。但是量子计算仍然处于初级阶段,还有很长的路要走。因此,目前,传统的超级计算机主导着高性能计算(HPC)领域。

同时,为了使百亿亿级系统成为可能,CEA的研究机构CEA- list和CEA- leti发表了一篇关于名为ex阳极的3D封装技术的论文。这种架构为百亿亿次计算铺平了道路。

ex阳极实际上是一个多芯片模块(MCM)架构,集成在一个系统中。MCM仍处于研发阶段,在同一基板上结合了两个fpga和一个独立的芯片式架构。fpga执行预处理功能,并作为共享双数据速率(DDR)内存体系结构的接口。

在基板的一个单独部分上,有六个左右的芯片或模具堆叠在有源干扰器上。芯片本身基于28nm FD-SOI技术。每个芯片组或芯片集成16个核心。使用20μm节距微凸点将每个单元堆叠并粘接在有源干扰器上。有源干扰器是基于65纳米CMOS技术。

“每个芯片都围绕着一个芯片上的网络构建,确保四个功能集群之间的通信通道。它的拓扑结构是一个2D网格,每个芯片上有4个路由器,连接到集群,并允许在每个地理方向上通信。”每个芯片都嵌入了两个专用加速器、一个卷积处理器和一个具有自身存储层次结构的流量生成器。Chiplets与邻居共享数据通过一个主动的插入使用短距离细节平行链接。中间插入器通过灵活的互连和FPGA接口起中心通信作用。”

ex阳极嵌入50000个3D互连线,具有20μm TSV间距和20μm微凸点。“我们进行了仿真,并使用嵌入式流量发生器在芯片之间产生大量流量:每个3D互连的传输速率高达1.2Gb/s。结合20μm间距,总体带宽密度达到375GB/s/mm²,”Dutoit说。“测量结果以及架构外推表明,在MCM中,将芯片与裸骰子结合在一起,可以为下一代可伸缩的高性能计算节点提供超广泛的工作负载。该技术可以在一个层面上将高效能加速器与有源干扰器上的通用cpu混合,然后在一个多芯片模块内将带有裸骰子的3D IC混合到第二个层面。

Dutoit说:“这些研发的成功为异构处理器开辟了一条道路,这将使百亿亿级超级计算机成为可能。”“我们证明了先进架构与3D集成技术的协同优化可以达到高性能计算所需的计算性能和带宽水平。”

百亿亿次系统中的新“前沿”
美国能源部正准备安装一个新的和快速Exascale超级计算机橡树岭国家实验室

这台被称为“前沿百亿亿次”的超级计算机预定于2021年安装,预计将以每秒1.5 exaflops的速度完成任务,也就是每秒执行1亿亿亿次浮点运算。Frontier的计算速度比当今的顶级超级计算机快50倍,被用于科学发现、能源保障、经济竞争力和国家安全等多个领域。它还将为从制造业到人类健康的各种应用提供深度学习、机器学习和数据分析的新能力。

Carlos Jones/ORNL拍摄。

边境项目已经筹备了一段时间。2019年,美国能源部宣布与克雷公司签订合同,在橡树岭建造Frontier超级计算机。Cray最近被惠普公司(Hewlett Packard Enterprise, HPE)收购。

该系统基于Cray的Shasta架构和Slingshot互联。它将采用AMD的EPYC CPU和Radeon Instinct GPU技术。

Frontier将驻留在橡树岭领导计算设施的Cray XK7泰坦超级计算机以前的数据中心。泰坦曾是世界上最强大的超级计算机之一,在服役7年后,它于去年退役。

为了容纳Frontier, Oak Ridge正在翻新这个2万平方英尺的房间。在房间里,地板由4500多块新瓷砖组成,每块重48磅,总重110吨。

这个房间还将包括为Frontier降温的系统。新的超级计算机的冷却水塔系统容量为13万加仑。这些塔还将由350马力的水泵组成,每台水泵每分钟可以将超过5000加仑的高温水通过Frontier系统。

“泰坦在山顶可能会消耗大约10兆瓦的力量。在山顶,边疆将消耗大约30兆瓦。如果您使用更多的电源,您必须摆脱额外的热量,因此我们正在增加40兆瓦的冷却能力,约11,000吨,为前沿 - 大量更大的管道分配到计算机上的酷水,“贾斯汀·惠特,OLCF的计划总监,位于Oak Ridge的科学用户设施的DOE办事处。“另外,超级计算机系统随着每个新一代变得更密集,更重,而前沿也不例外,所以我们升级了凸起的地板,所以它可以支持重量。”

Exascale天
不久前,计算机行业庆祝了百亿亿次计算机日。它庆祝了百亿亿次计算机的问世。

惠普计算机产品营销团队的负责人布兰登·德雷格在一篇博客中写道,介绍了更多关于百亿亿次计算的信息。



1评论

Dev Gupta博士 说:

LETI的Denis Dutoit做得很好。早在2011年,他就利用微凸点(tsv当时还不成熟)构建了第一个芯片上芯片(DRAM on CPU)处理器模块。更近期的堆栈,如Intel COFEFOS等,很像丹尼斯的原创作品。没有参加IEDM。LETI真的构建了您文章中描述的新模块吗?他们的新模块在20um俯仰和/或性能(计算吞吐量,带宽,每个运行周期的功耗i,e。指令和数据获取,处理)??

发表评论


(注意:此名称将被公开显示)