大國(guó)重器|超算:我們干成了“世界第一”

《中國(guó)經(jīng)濟(jì)周刊》 記者 鄭雪 | 北京報(bào)道

科技興則民族興,科技強(qiáng)則國(guó)家強(qiáng)。

超級(jí)計(jì)算機(jī)的發(fā)展關(guān)乎國(guó)家的科技未來(lái),它是計(jì)算機(jī)領(lǐng)域“皇冠上的明珠”,是衡量一個(gè)國(guó)家科技水平的重要標(biāo)志。

作為大國(guó)重器,超級(jí)計(jì)算機(jī)多用于國(guó)家高科技領(lǐng)域和尖端技術(shù)研究,如航空航天、天體物理研究、氣象預(yù)報(bào)、潮汐預(yù)報(bào)等,其重要性不言而喻。

超級(jí)計(jì)算機(jī)的運(yùn)算速度有多快?以我國(guó)自主研制的首臺(tái)千萬(wàn)億次超級(jí)計(jì)算機(jī)“天河一號(hào)”為例,其峰值運(yùn)算速度為4700萬(wàn)億次/秒,60億人需要算一年的問(wèn)題,超級(jí)計(jì)算機(jī)一秒就可以算完。

回顧中國(guó)超級(jí)計(jì)算機(jī)的發(fā)展史,“玻璃房”是無(wú)法被遺忘的過(guò)去。20世紀(jì)80年代,世界超級(jí)計(jì)算機(jī)技術(shù)飛速發(fā)展。西方國(guó)家長(zhǎng)期對(duì)中國(guó)采取多邊出口管制政策。中國(guó)雖花了高價(jià)從美國(guó)購(gòu)買超級(jí)計(jì)算機(jī),但相關(guān)性能受到閹割,設(shè)備需要放置于獨(dú)立的機(jī)房,機(jī)房鑰匙和啟動(dòng)密碼由美方掌握,上機(jī)需要美方人員審核監(jiān)督。

關(guān)鍵核心技術(shù)很難買到,中國(guó)要有自己的超級(jí)計(jì)算機(jī)。

1978年5月,國(guó)防科委在北京召開巨型機(jī)方案論證和協(xié)作會(huì)議,確定該機(jī)代號(hào)為“785工程” ,我國(guó)正式啟動(dòng)超級(jí)計(jì)算機(jī)研制工作。

一窮二白是當(dāng)時(shí)再真實(shí)不過(guò)的寫照。技術(shù)落后、資料匱乏,但攔不住下定決心攻關(guān)的科研人員。“巨型計(jì)算機(jī)之父”慈云桂更是立下軍令狀:“就算是豁出這條老命,也要把中國(guó)的巨型機(jī)搞出來(lái)?!?/p>

1983年12月,我國(guó)第一臺(tái)億次超級(jí)計(jì)算機(jī)“銀河一號(hào)”研制成功,中國(guó)成為繼美國(guó)、日本之后,第三個(gè)能獨(dú)立設(shè)計(jì)和制造超級(jí)計(jì)算機(jī)的國(guó)家。

以“銀河一號(hào)”為起點(diǎn),多方支持之下,中國(guó)超級(jí)計(jì)算機(jī)一步一個(gè)腳印,踏上自主創(chuàng)新、不斷超越的征程。

銀河、天河、神威等系列超級(jí)計(jì)算機(jī)產(chǎn)品逐漸大放光彩,國(guó)產(chǎn)超級(jí)計(jì)算機(jī)的運(yùn)算速度也實(shí)現(xiàn)了從千萬(wàn)億次到億億次,再到百億億次的突破。

2010年,“天河一號(hào)”摘下全球超級(jí)計(jì)算機(jī)500強(qiáng)排行榜(以下簡(jiǎn)稱“TOP500”)的桂冠;2013年研制成功的“天河二號(hào)”標(biāo)志著我國(guó)在超級(jí)計(jì)算機(jī)領(lǐng)域已走在世界前列;采用全自主創(chuàng)新的天河新一代超級(jí)計(jì)算機(jī)運(yùn)算速度達(dá)到百億億次。2016年6月,我國(guó)第一臺(tái)全部采用國(guó)產(chǎn)處理器構(gòu)建的超級(jí)計(jì)算機(jī)“神威·太湖之光”,以超第二名近3倍的運(yùn)算速度位列TOP500排行榜第一。

“神威·太湖之光”也是世界上首臺(tái)峰值運(yùn)算性能超過(guò)每秒十億億次浮點(diǎn)運(yùn)算能力的超級(jí)計(jì)算機(jī),曾獲得高性能計(jì)算應(yīng)用最高獎(jiǎng)“戈登·貝爾獎(jiǎng)”。

超級(jí)計(jì)算機(jī)發(fā)展已40余年,在一代又一代科研工作者的努力之下,中國(guó)的超級(jí)計(jì)算機(jī)已經(jīng)實(shí)現(xiàn)了從追趕到并跑,再到部分領(lǐng)跑的跨越。

孟祥飛 (右二) 和團(tuán)隊(duì)一起討論技術(shù)方案

親歷者:孟祥飛 國(guó)家超級(jí)計(jì)算天津中心黨組書記

2009年,博士畢業(yè)的我加入正在籌建的首個(gè)國(guó)家超算中心——國(guó)家超級(jí)計(jì)算天津中心(以下簡(jiǎn)稱“天津超算中心”),參與研制、部署我國(guó)首個(gè)排名世界第一的超級(jí)計(jì)算機(jī)“天河一號(hào)”相關(guān)工作。這段經(jīng)歷讓我倍感驕傲和榮幸。

隨后,我又參與了超算的“二次創(chuàng)業(yè)”。十年磨一劍,國(guó)際真正認(rèn)可了我們?cè)诔?jí)計(jì)算領(lǐng)域取得的成績(jī)。

目前,我國(guó)超算已經(jīng)實(shí)現(xiàn)了從追趕到并跑,再到部分領(lǐng)跑的跨越,不僅在于技術(shù),更在于軟件和應(yīng)用的突破。相關(guān)成績(jī)離不開一代又一代科研工作者的努力,更離不開科研工作者志氣、骨氣、底氣的傳承。

2022年,孟祥飛在公開活動(dòng)中介紹中國(guó)超級(jí)計(jì)算機(jī)的發(fā)展歷程。

沒(méi)想到我們竟干成了“世界第一”

2006年,我在天津南開大學(xué)攻讀理論物理博士,相關(guān)課題研究需要強(qiáng)大算力支撐,但當(dāng)時(shí)國(guó)內(nèi)并不具備這樣的條件。后來(lái)在國(guó)家留學(xué)基金委的支持下,我前往美國(guó)學(xué)習(xí)深造。

美國(guó)創(chuàng)新能力的平臺(tái)和環(huán)境讓我感受頗多。到達(dá)美國(guó)學(xué)習(xí)的第二年,我所在的實(shí)驗(yàn)室在理論物理領(lǐng)域的國(guó)際年會(huì)上共發(fā)布4個(gè)研究成果,其中兩個(gè)半由我主要完成,當(dāng)時(shí)非常有成就感。但同時(shí)我也看到了另一個(gè)問(wèn)題:美國(guó)機(jī)構(gòu)的署名位列第一,我們所作的貢獻(xiàn)實(shí)在是給他人錦上添花。

學(xué)業(yè)結(jié)束之時(shí),美國(guó)導(dǎo)師希望我留美。迷茫之時(shí),一天散步的路上,我想起南開老校長(zhǎng)的“愛國(guó)三問(wèn)”,感覺到作為一個(gè)中國(guó)人,還沒(méi)對(duì)自己國(guó)家的創(chuàng)新發(fā)展作出貢獻(xiàn)。我決定回國(guó),不管干多干少,都是我們自己的。

2009年,我加入天津超算中心,參與“天河一號(hào)”的研制和中心建設(shè)工作。

當(dāng)時(shí)面臨的挑戰(zhàn)不小,我們并未選擇當(dāng)時(shí)主流的環(huán)形架構(gòu)體系路線,而是采用CPU和GPU相結(jié)合的異構(gòu)融合計(jì)算體系結(jié)構(gòu)來(lái)做超級(jí)計(jì)算機(jī),我們是這條路線的“第一人”。

其實(shí),相關(guān)研究工作從2007年便已開始,為了完成相關(guān)任務(wù),整個(gè)研發(fā)團(tuán)隊(duì)選擇“閉關(guān)”,通過(guò)關(guān)鍵底層技術(shù),如軟硬件設(shè)計(jì)、操作系統(tǒng)、編譯器、軟硬件的協(xié)同調(diào)度等,驗(yàn)證了我們的方向是正確的。

2009年夏天,我們啟動(dòng)基礎(chǔ)環(huán)境建設(shè)和整機(jī)系統(tǒng)安裝工作。我們需要完成上萬(wàn)根光纖、上噸重機(jī)柜的部署和安裝。在接近40℃的房間里,累了就睡在地上,醒了再接著干。設(shè)備安裝過(guò)程中,有些快要退休的老專家,也在一線跟我們拉光纖、搬機(jī)柜,讓當(dāng)時(shí)的我受到了教育。

就這樣,我們用了7個(gè)月左右的時(shí)間,完成了別人要一年半以上時(shí)間才能完成的部署任務(wù),中國(guó)首臺(tái)千萬(wàn)億次超級(jí)計(jì)算機(jī)“天河一號(hào)”誕生了。

2010年11月,全球超級(jí)計(jì)算機(jī)500強(qiáng)排行榜公布,“天河一號(hào)”勇奪第一。

消息傳來(lái)已是晚上,我正和幾個(gè)同事值班,聽到這個(gè)消息之后,非常激動(dòng)興奮,從來(lái)沒(méi)想到我們的團(tuán)隊(duì)竟然干成了世界第一的工程。我和同事一起振臂高呼之后,繞著我們“天河一號(hào)”跑了幾圈,對(duì)于平時(shí)淡定的我來(lái)說(shuō),已經(jīng)很是“超綱”了。

“二次創(chuàng)業(yè)”讓中國(guó)超算真正站穩(wěn)腳跟

但很快,“中看不中用”的質(zhì)疑接踵而來(lái)。國(guó)際專家質(zhì)疑我們?cè)炝藗€(gè)“跑車”,只是為了快而快;國(guó)內(nèi)也有人質(zhì)疑我們?cè)炝藗€(gè)大型“游戲機(jī)”。

原因是,超算技術(shù)雖然突破了,但當(dāng)時(shí)也面臨著挑戰(zhàn):一是當(dāng)時(shí)的超算應(yīng)用基礎(chǔ)不足,二是軟件層面、算法模型尚未有所變化。

對(duì)我們來(lái)說(shuō),真正難的還是要實(shí)現(xiàn)應(yīng)用創(chuàng)新的“二次突破”,即把超算真正轉(zhuǎn)化為創(chuàng)新力和生產(chǎn)力。

“二次突破”交到了我們年輕團(tuán)隊(duì)手中。作為應(yīng)用研發(fā)團(tuán)隊(duì)的負(fù)責(zé)人,面對(duì)質(zhì)疑情緒容易“上頭”的我立了軍令狀:干不好“天河一號(hào)”的應(yīng)用,我卷鋪蓋走人。

我們打造了售前、售后、研發(fā)的全方位團(tuán)隊(duì),帶著售前團(tuán)隊(duì)出去摸需求、做推廣,負(fù)責(zé)超算系統(tǒng)、能力、創(chuàng)新的推廣工作。我們坐著綠皮火車每年跑幾十個(gè)城市,開上百場(chǎng)報(bào)告會(huì)或者交流會(huì),讓大家了解超級(jí)計(jì)算機(jī)。

售后、研發(fā)團(tuán)隊(duì)主要開發(fā)超算的技術(shù)服務(wù)能力,摸清實(shí)踐和產(chǎn)業(yè)需求,用我們的超算平臺(tái)解決需求,或者根據(jù)需求重新研發(fā)運(yùn)行軟件或者模型,以解決科技創(chuàng)新和產(chǎn)業(yè)的問(wèn)題。

正是過(guò)去這些年,我們把超級(jí)計(jì)算機(jī)打造成了能夠算天、算地、算人的大國(guó)重器。

算天,應(yīng)用于諸如航空航天飛行模式、天氣預(yù)報(bào)預(yù)測(cè)等。算地,應(yīng)用于石油勘探、大壩抗震分析等。算人,可應(yīng)用于藥物研發(fā)、大規(guī)?;驍?shù)據(jù)的分析。

算力真正轉(zhuǎn)化成了創(chuàng)新力和生產(chǎn)力,實(shí)現(xiàn)了二次創(chuàng)新,各類生態(tài)自然而然涌現(xiàn)出來(lái)。圍繞超算發(fā)展,國(guó)內(nèi)芯片、操作系統(tǒng)、服務(wù)器等領(lǐng)域涌現(xiàn)了一大批信息技術(shù)企業(yè),為中國(guó)信創(chuàng)產(chǎn)業(yè)發(fā)展奠定了基礎(chǔ)。

“二次創(chuàng)業(yè)”讓中國(guó)超算真正站穩(wěn)了腳跟。從2010年以來(lái),十年磨一劍,國(guó)際范圍內(nèi)真正認(rèn)可了中國(guó)在超算領(lǐng)域取得的成績(jī)。

現(xiàn)在來(lái)看,中國(guó)超算的發(fā)展體現(xiàn)了三個(gè)“氣”:

志氣,“天河一號(hào)”搭載的異構(gòu)融合計(jì)算體系結(jié)構(gòu)成為世界第一并引領(lǐng)國(guó)際超算潮流,體現(xiàn)我們向前邁進(jìn)、勇爭(zhēng)領(lǐng)域前列的志氣。

骨氣,剛起步的時(shí)候我們一窮二白,前輩們接受這個(gè)任務(wù)并立下軍令狀,挑戰(zhàn)不可能。

底氣,全自主創(chuàng)新的天河新一代超級(jí)計(jì)算機(jī),讓我們?cè)诟叨雀?jìng)爭(zhēng)的超算領(lǐng)域更有底氣。

當(dāng)然,超級(jí)計(jì)算也面臨著新的挑戰(zhàn):摩爾定律面臨終結(jié)挑戰(zhàn),計(jì)算范式出現(xiàn)了變化;人工智能快速發(fā)展,需要大規(guī)模低精度混合計(jì)算支持,超算需要思考如何與智算融合;此外,量子計(jì)算興起,未來(lái)超算需與其協(xié)同發(fā)展。當(dāng)下,我們?cè)谠O(shè)計(jì)新一代超級(jí)計(jì)算機(jī)的時(shí)候,已經(jīng)提前考慮這些問(wèn)題了。

(本文刊發(fā)于《中國(guó)經(jīng)濟(jì)周刊》2024年第18期)


頂部