有的人吃饭,坐小孩儿那一桌。
徐诺吃饭,则是坐老人那一桌。
可见徐诺非同一般。
席间,郑教授跟徐诺聊了不少关于搭建超算的细节。
从申威科技那边的众核处理器,到整个超算的散热技术选择,两人都进行了深入的探讨。
特别是超算的散热,这是一个无法回避的问题。
尽管徐诺那个已经开始动工修建的南山智能别墅,旁边有南山湖,距离不远处还有渝州的两条大江,自然环境的要求算是非常满足了,但超算自身的散热体系,那也是必不可少的一环。
“小徐,这次搭建超算,你准备使用怎样的散热方式呢?”
“传统的风冷与水冷空调的散热方式对于超级计算的发展来讲,已经开始变得有些力不从心了,我想浸没式液冷应该是目前最好的一种选择。”
徐诺想了想,回答道。
液冷散热的方式,相比起传统的散热,确实是更具有优势一些。
比如说在节能性上更加极致。
因为冷媒与发热器件会直接接触,换热效率就更高,可以实现全面自然冷却,系统pue会<10。
并且功率密度大幅提升,单机的柜功率密度可达60kw以上。
在器件散热方面也更加均匀,如果采用全浸没方式的液冷,那么服务器内部温度场更加均匀,器件的可靠性就更有保障了。
其实液冷散热也不用担心泄漏风险,只要采用绝缘、环保的冷却液体,即使发生泄露对基础设施硬件和外界环境基本上没有任何的风险。
传统散热方式,噪声肯定是无法避免的,而使用液冷的话噪声将会变得更低,服务器全部元器件均可通过液冷方式散热,内部实现无风扇设计,满载运行的噪音可<4db。
因此,在近些年落成的超级计算机,大多数都会选择使用浸没式相变液冷技术。
“嗯,浸没式液冷确实是一种不错的选择,但那在成本上会比较高一些。”
郑教授点头道。
“这个没关系。”徐诺淡定的说道:“对于我们公司来讲,这些成本不算什么太大的问题,只是在浸没式相变液冷技术这一块儿,还得请教一下郑教授,您觉得我们是用单相浸没式液冷,还是两相浸没式液冷呢?”
“单相和两相浸没式液冷技术各有优劣,这得看你是选择稳定性,还是选择散热效率了”
单相浸没式液冷与两相浸没式液冷,在原理上还是有着不同之处的。
在单相浸没式液冷中。
使用电子氟化液保持液体状态,电子部件就直接浸没在电介质液体中,液体置于密封但易于触及的容器中,热量从电子部件传递到液体中。
通常使用循环泵将经过加热的电子氟化液流到热交换器,在热交换器中冷却并循环回到容器中。
冷却液在循环散热过程中始终维持液态,不发生相变。
而在低温冷却液带走热量后,温度升高,升高的冷却液流动到其它区域后重新冷却并完成了循环
单相液冷要求的冷却液的沸点较高,这样冷却液挥发流失控制就会相对简单一些,与计算机设备的元器件兼容性比较好,不需要频繁补充冷却液,这就是单相浸没式液冷的稳定性优势。
但相对于两相浸没式液冷的话,散热效率要低一些。
两相浸没式液冷就不一样了。
通过电子氟化液的沸腾及冷凝过程,会指数级地提高液体的传热效率,电子部件直接浸没在容器中的电介质液体中,该容器密封但易于操作。
在该容器内,热量从电子部件传递到液体中,并引起液体沸腾产生蒸汽。
蒸汽在容器内的热交换器上完成冷凝,将热量传递给在数据中心中循环流动的设施冷却水,冷却液在循环散热过程中就发生了相变。
而冷却液带走电子元件热量后发生相变气化,气态冷却液被其它设备冷凝重新变成液态。
但两相浸没式液冷也不是完美的,因为在这个相变的过程中,冷却液蒸发为气态过程中会发生逃逸,所以对容器的密封性有一定的要求。
但是又不能太密封了,要防止冷却系统中断出现事故,所以需要设置一定的安全设施,对于安全性的要求就相对单相浸没式液冷要高很多。
“那对于我来讲,还是散热相对比较稳定一些更合适。”
徐诺考虑了一下,觉得还是散热稳定性更适合自己的超算。
毕竟自己将要落成在智能别墅的超算,也不追求极致的算力,而且造价只是4个亿左右,世界超算排名连前二十都进不去,所以散热效率这一块儿就没必要那么极致的追求了。
只有世界上那些顶级的超算,在运行时才会产生难以想象的能耗,那么这个时候散热效率就显得非常重要了。
“追求稳定性的话,那就选择单相浸没式液冷吧。”
郑教授建议道:“那到时候,我们就为你的超算采用单相浸没式液冷技术,这样一来超算在运行时的散热稳定性就会有很高的保障,不过小徐,你确定不追求散热的高效率吗?”
“嗯嗯。”
徐诺点点头,已经决定采用单相浸没式液冷了。
有了每秒上千万亿次运算能力的超算,再给上一个稳定的散热方式,对于关雎来讲就是一个非常稳定的“家”了。
“那行,还有能耗这一块儿,超算的用电量我想你是有心理准备的吧?”
郑教授又问起了超算的用电的问题:“你打算怎么解决?”
毕竟是企业用的超算,跟国家超算中心还是不太一样的。
像国家超算中心,有的甚至可以直接使用核电站进行供电。
以神威·太湖之光为例。
它一秒钟的耗电量就是4度。
什么概念呢,神威·太湖之光开机运行一小时,耗电量就达到了1万度电,按照正常电价来算的话,那么一天下来的电费就得二三十万。
所以国家超算中心一般都是有专门的供电方式。
但企业的超算,那就得自己承担电费了。
哪怕是徐诺要搭建的这一台使用1000块左右的申威6010处理器,大约十几个运算机柜的超级计算机,那用电量也是相当恐怖的。
不过徐诺琢磨着。
关雎也算是一个成熟的ai了,也该学会自己赚电费了吧?