30
2025-10
數(shù)據(jù)中心告急,液冷轉(zhuǎn)型加速,產(chǎn)業(yè)鏈迎新機(jī)
打印
在我們每天享受著人工智能帶來的便利,刷著短視頻、用AI軟件畫畫的時候,可能很少有人會想到,支撐這一切的背后,是無數(shù)個被稱為“數(shù)據(jù)中心”的巨大機(jī)房在一天24小時不停地運(yùn)轉(zhuǎn)。
這些機(jī)房里密密麻麻地擺滿了服務(wù)器,也就是我們常說的高性能電腦。
然而,現(xiàn)在這些電腦們正面臨一個非常棘手的大問題——它們實(shí)在是太“熱”了。
隨著人工智能技術(shù)的發(fā)展,我們對計(jì)算能力的需求像坐了火箭一樣往上躥,服務(wù)器的功率也越來越大,發(fā)出的熱量也隨之成倍增加。
過去,一個機(jī)柜的功率可能就像家里一臺取暖器,用大風(fēng)扇吹吹風(fēng)就能解決散熱問題。
可現(xiàn)在,一個機(jī)柜的功率能頂?shù)蒙蠋资_空調(diào)同時制熱,傳統(tǒng)靠風(fēng)扇吹風(fēng)的“風(fēng)冷”散熱方式,就像想用一把蒲扇給煉鋼爐降溫一樣,已經(jīng)完全力不從心了。
這種情況帶來了一系列嚴(yán)重后果。
首先,那些價格昂貴的芯片,比如CPU和GPU,因?yàn)闇囟忍?,為了自我保護(hù),會自動降低運(yùn)行速度,這就好比一個運(yùn)動員因?yàn)樘鞖馓珶岫坏貌环怕_步,導(dǎo)致我們花大價錢買來的計(jì)算能力,有相當(dāng)一部分被白白浪費(fèi)掉了。
更讓人頭疼的是能源消耗問題。
據(jù)統(tǒng)計(jì),一個大型數(shù)據(jù)中心里,有將近一半的電費(fèi)都花在了給服務(wù)器降溫這件事上。
這是一個非常驚人的數(shù)字。
行業(yè)預(yù)測顯示,到了2024年,全國所有數(shù)據(jù)中心加起來的總耗電量,可能會超過4000億度電,這個電量相當(dāng)于三峽水電站全年發(fā)電量的四倍。
一邊是計(jì)算能力因?yàn)檫^熱而發(fā)揮不出來,另一邊是巨量的電力被用來散熱,這種局面形成了一堵無形的“能耗墻”,嚴(yán)重阻礙了我們數(shù)字經(jīng)濟(jì)的進(jìn)一步發(fā)展。
因此,如何更高效、更省電地給這些計(jì)算巨獸們“退燒”,已經(jīng)成了一個必須解決的難題。
正是在這樣的背景下,一種全新的散熱技術(shù)——“液冷”,開始從幕后走向臺前,并被寄予厚望。
簡單來說,液冷就是不再用空氣,而是用液體來帶走服務(wù)器產(chǎn)生的熱量。
這個道理其實(shí)我們生活中很常見,比如汽車的發(fā)動機(jī)就是靠水箱里的冷卻液來降溫的,因?yàn)樗膶?dǎo)熱能力比空氣強(qiáng)得多。
把這個原理應(yīng)用到數(shù)據(jù)中心,就帶來了革命性的變化。
液冷技術(shù)的好處非常明顯。
首先是節(jié)能效果立竿見影。
衡量數(shù)據(jù)中心能源效率有一個關(guān)鍵指標(biāo)叫PUE,這個數(shù)值越接近1,就說明電力被有效利用的程度越高,浪費(fèi)在散熱等方面的能源就越少。
傳統(tǒng)風(fēng)冷數(shù)據(jù)中心的PUE值通常在1.5左右,意味著給服務(wù)器用1度電,就需要額外花費(fèi)0.5度電來給它降溫。
而采用液冷技術(shù)后,這個PUE值可以輕松降到1.1以下,也就是說,散熱消耗的能源直接減少了超過百分之四十。
這節(jié)省下來的不僅僅是電費(fèi),更是寶貴的社會能源資源,完全符合國家提出的“雙碳”節(jié)能減排戰(zhàn)略方向。
其次,液冷能夠徹底釋放服務(wù)器的計(jì)算潛力。
通過液體循環(huán)散熱,可以讓芯片的工作溫度比風(fēng)冷環(huán)境下降低20攝氏度以上。
芯片始終保持在涼爽舒適的狀態(tài)下,就能火力全開,穩(wěn)定地以最高性能運(yùn)行,再也不會出現(xiàn)因?yàn)檫^熱而自動降速的情況。
據(jù)測算,僅此一項(xiàng),就能讓服務(wù)器的有效算力輸出提升大約百分之三十。
這相當(dāng)于在不增加硬件投入的情況下,憑空多出了更多的計(jì)算能力。
再者,液冷也讓數(shù)據(jù)中心的建設(shè)更加緊湊和高效。
由于液體的散熱效率遠(yuǎn)高于空氣,服務(wù)器機(jī)柜可以挨得更近,不再需要為空氣流通預(yù)留大量空間。
這樣一來,同樣大小的機(jī)房里可以容納更多的服務(wù)器,單位面積的計(jì)算能力大大增強(qiáng),單機(jī)柜的功率密度也能輕松突破100千瓦,為未來更高性能的AI計(jì)算集群部署好了基礎(chǔ)。
同時,被液體帶走的熱量其實(shí)是一種可以回收利用的資源。
這些帶有溫度的冷卻液可以被引導(dǎo)去為周邊的辦公樓、居民區(qū)提供暖氣,或者為溫水游泳池加熱,實(shí)現(xiàn)能源的梯級利用,真正做到綠色環(huán)保。
目前,主流的液冷技術(shù)主要有幾種不同的實(shí)現(xiàn)方式。
一種是“冷板式液冷”,這種方式比較溫和,它不對服務(wù)器做大的改動,而是在CPU、GPU這些發(fā)熱量最大的核心部件上,安裝一個內(nèi)部有冷卻液流動的金屬板,像貼退燒貼一樣,精準(zhǔn)地把熱量帶走。
它的優(yōu)點(diǎn)是改造起來比較方便,非常適合對現(xiàn)有的老舊風(fēng)冷數(shù)據(jù)中心進(jìn)行升級。
另一種是“浸沒式液冷”,這種方式就比較徹底了。
它是將整個服務(wù)器的主板完全浸泡在一種特制的、不導(dǎo)電的冷卻液里,讓電子元件在液體環(huán)境中工作。
這種方式的散熱效率是最高的,特別適合那些對性能要求極高的AI計(jì)算中心和超級計(jì)算機(jī)。
還有一種叫“噴淋式液冷”,它像一個精密的淋浴系統(tǒng),會根據(jù)服務(wù)器內(nèi)部各部件的溫度,對準(zhǔn)發(fā)熱點(diǎn)進(jìn)行冷卻液噴淋,也是一種高效的散熱方式,不過技術(shù)還在不斷發(fā)展和完善中。
面對液冷技術(shù)帶來的巨大機(jī)遇,我們國家的企業(yè)和政策也迅速行動起來。
工信部等部門已經(jīng)明確要求,新建的大型數(shù)據(jù)中心PUE值必須低于1.3,這實(shí)際上就為液冷技術(shù)的普及鋪平了道路。
國內(nèi)三大電信運(yùn)營商作為數(shù)據(jù)中心建設(shè)的主力軍,也制定了明確的時間表,計(jì)劃到2025年,其采購的服務(wù)器中采用液冷技術(shù)的比例要超過50%。
在應(yīng)用層面,無論是國際芯片巨頭英偉達(dá)最新的人工智能芯片,還是國內(nèi)華為、阿里、騰訊等公司新建的智能計(jì)算中心,都已經(jīng)全面轉(zhuǎn)向液冷方案。
在“東數(shù)西算”這樣的國家戰(zhàn)略工程中,新建的數(shù)據(jù)中心項(xiàng)目里,液冷技術(shù)的滲透率也已經(jīng)超過了四成。
從英維克、高瀾股份到曙光數(shù)創(chuàng)等一批國內(nèi)企業(yè),已經(jīng)在液冷技術(shù)的各個環(huán)節(jié)形成了完整的產(chǎn)業(yè)鏈,并且技術(shù)水平在全球范圍內(nèi)都處于領(lǐng)先地位。
當(dāng)然,任何新技術(shù)的推廣都會遇到一些初期的挑戰(zhàn),比如液冷系統(tǒng)的初始建設(shè)成本比風(fēng)冷要高一些,大概需要兩到三年的時間才能通過節(jié)省的電費(fèi)收回投資。
同時,機(jī)房的維護(hù)人員也需要學(xué)習(xí)新的技能,來管理和維護(hù)這些復(fù)雜的液體循環(huán)系統(tǒng)。
但從長遠(yuǎn)來看,這些都是發(fā)展過程中可以克服的問題。
可以預(yù)見的是,隨著人工智能時代的全面到來,數(shù)據(jù)中心的液冷化轉(zhuǎn)型已經(jīng)不是一道選擇題,而是一條必由之路。
它不僅關(guān)系到我們能否擁有足夠強(qiáng)大和經(jīng)濟(jì)的算力,更關(guān)系到整個數(shù)字社會的可持續(xù)發(fā)展。
這場圍繞著數(shù)據(jù)中心“退燒”的技術(shù)變革,正在為中國相關(guān)產(chǎn)業(yè)鏈帶來前所未有的發(fā)展新機(jī)遇。
(本文來源:機(jī)房360)






