2013年11月19日星期二

廣州版

美國當地時間昨日,文件倉世界超級計算機500強公佈了最新的全球超算排行榜。部署在廣州超算中心的"天河二號"蟬聯桂冠,以比第二名美國的"泰坦"快近一倍的速度繼續領跑全球。預計今年底,"天河二號"將完成調試並試運行。那麼,超算的建設進度到底如何?這台"巨無霸"有何特點?南都記者日前探營仍在緊張施工的超算中心,為大家揭開"天河二號"的秘密。嶄新的房間,一排排黑色的機櫃,櫃內錯綜複雜的各色電線,工作人員們正緊張地調試著……這就是剛剛蟬聯世界最快計算機的"天河二號"的機房。從1993年起,世界超級計算機500強組織每年會發佈兩次全球超算500強排行榜,在超算領域,這也是最具國際影響力的排行榜。在本次500強榜單中,排行榜前五名沒有發生變化,瑞士的"代恩特峰"成為前十榜單中唯一的新面孔。"天河二號"的前代、部署于天津的"天河一號A"則離開了前十榜單,位列第12位。500強擁有數 美國仍占優本次的500強中,美國擁有265台繼續領跑全球,中國的63台和日本的28台分列二、三位,其後是歐洲的英國、法國和德國。同時,依靠"天河二號"的巨大運算能力,中國的超算總運算能力也超越了日本,成為全球第二。美國國家公共廣播電台10月28日發表的一篇文章分析,由於美國的自動減赤機制導致類似橡樹嶺國家實驗室這樣的科研機構獲得的財政撥款減少,新超級計算機的建設計劃也變得愈發遙遠。新榜單公佈後,唐加拉認為,以"天河二號"幾乎是泰坦兩倍的運算能力,在第一名的位置上再停留一年也並不讓人意外。廣州多所高校參與推廣"天河二號"部署後,廣州超算中心也將加入天津、長沙、深圳、濟南的行列,成為超算中心國家隊行列中的第五個成員。目前,超算中心的工作主要由國防科技大學的團隊負責。據介紹,超算中心將建立研究院和工程中心,分別從理論和應用方面推進超算的發展。在未來,廣東工業大學、中山大學、華南理工大學等學校都會圍繞超算進行專門人才的培養。目前中大已設立超算學院並招募了30名碩士研究生,招生簡章中專門強調,特別鼓勵物理、化學、生物、海洋、大氣科學、地球物理等與超算應用密切相關專業的考生報考。此外,中大還有計劃設立本科的超算專業。中國超算發軔于"文革"結束後科技發展對大規模計算的需求。從1983年我國第一台計算能力超過一億次每秒的"銀河-I"開始,國防科技大學始終是國內超算研製的領軍者。由國防科大和天津濱海新區聯合研製的"天河一號A"在2010年10月登上全球超算500強排行榜榜首,成為第一個來自中國的世界最強超算。但歐美國家和日本一直也在超算領域進行巨大的投入。"天河一號A"奪冠後,日本的"京"、美國的"紅杉"和"泰坦"先後登上世界第一的寶座。"天河二號"則是這一戰局中的新挑戰者。2011年11月25日,廣東省政府、廣州市政府、國防科技大學、中山大學在廣州簽約,就合作研製高效能計算機系統,共建廣州超級計算中心簽署戰略合作協議。正是這一協議促成了"天河二號"的問世。"天河二號"的研製堪稱神速,今年5月底,500強組織創始人之一、服務于田納西大學和橡樹嶺國家實驗室的傑克·唐加拉就在長沙對已經完工的"天河二號"進行過超過5小時的測試,當時的測試結果顯示"天河二號"的運算速度達到3.065億億次/秒,理論峰值則是5.49億億次/秒,均大幅超過了橡樹嶺國家實驗室的超級計算機"泰坦"。這一數據也使得"天河二號"在今年6月17日公佈的500強榜上登頂。它能有多快最大運算能力5 .49億億次/秒5.49億億次/秒,是一個大得已經讓我們難以想象它到底有多大的數字,即使是"13億人同時用計算器計算1000年"這樣的比喻,也顯得有點抽象。那麼,如此巨大的超算是怎麼建造的?這可不是"買回來一大堆CPU拼在一起"那麼簡單。就算家用機里僅有幾個核心的多核C PU,也要面對幾個核心之間如何分配任務的問題,何況"天河二號"這個有著超過300萬個核心的龐然巨物。盧澤新說,"天河二號"在多方面都取得了創新突破。"天河二號"採用了異構多態體系結構,所謂"異構",就是說每個計算節點里都包含了C PU和計算加速器,用來提升計算效率。但是"天河二號"的異構技術中使用了來自同一廠商的CPU和加速器,兩者在硬件層面來看雖是異構,但卻採用了統一的、已經為廣大用戶所熟悉和掌握的x86編程模型和應用開發及優化工具,就像跨國公司位於兩個不同國家的部門,員工們卻講著同樣的語言,大家不存在溝通的障礙,合作起來的效率也就更高,而且他們的語言同時也是全球通用的語言,服務于外部客戶時同樣也不需要額外配置翻譯。這種異構方式有別于過去的C PU +G PU模式,也被稱為"微異構"。另一方面,要支持1.6萬個這樣的計算節點同時工作,就需要支持十億億次級系統的自主定制高速互連網絡,讓數據在節點間快速傳送。在這一點上,"天河二號"也實現了突破。此外,新型層次式加速存儲架構、新型並行編程模型與框架、支持十億億次級系統的容錯設計與故障管理和高密度高精度結構工藝也都是"天河二號"的技術亮點。值得一提的還有,"天河二號"使用了4096塊國防科大自主設計的C PU"FT -1500"。盧澤新介紹,單論運算能力,FT -1500已經和國際水平相當,但由於相關的產業生態鏈還不是很完善,相關的操作系統和應用軟件尚不完備。他也希望隨著廣州超算中心的投入使用,開拓國產CPU的應用範圍。按照現有計劃,現有的5.49億億次/秒運算能力並非"天河二號"的終點。到2015年底,"天河二號"的運算能力將翻倍,達到約11億億次/秒。超算中心也為這次擴充準備好了機房。"技術在進步,芯片也會越來越好。"盧澤新說,"所以第二個5.49億億次/秒會比第一個占地面積小,同時功耗也會更低。"它能存多少存儲空間1500萬G B 相當19個國家圖書館 盧澤新介紹,深入瞭解之後,研發團隊發現廣州方面不但對高性能計算有著巨大的需求,同時也需要高流量的數據流以及海量的存儲空間,於是"天河二號"進行了一些特別的改動。在常存倉的內存和普通硬盤之外,"天河二號"增加了固態硬盤(SSD )。如果把計算機比做一間書房,那麼內存好比書桌,書放在書桌上,伸手可及,隨時可以閱讀,但只能放有限的幾本書;普通硬盤好比書架,要讀書架里的書就得走過去找,需要花更多時間,但書架的存儲量會比較大。固態硬盤的速度和容量介於內存和普通硬盤之間,但成本較高。雖然目前越來越多的家用電腦已經開始配備固態硬盤,但"天河二號"這種體量的超級計算機使用固態硬盤,並不多見。據美國媒體報道,下個月即將部署的美國新超級計算機"催化劑(C ata-lyst)"也將運用這一技術,但規模比"天河二號"要小很多。裝備上固態硬盤後,層次更豐富的存儲系統使得"天河二號"的讀寫速度各自達到了80G /秒,比前代的"天河一號A"快了一倍。另外,為了存儲服務于智慧城市後的需要存儲的海量數據,"天河二號"還額外配置了大量硬盤,總存儲空間有15P B(約1500萬G B ),今年8月,國家圖書館的總數據量為0 .8P B,照此計算,"天河二號"的存儲空間相當于近19個國家圖書館。它有什麼用從預報天氣到核電站 從學校到生物島都能用據瞭解,超算中心項目總投資逾23億。在超級計算機的建設中,民�常見的疑問是"弄這麼大的計算機有什麼用"。在作風務實的廣州,這樣的問題可能更加尖銳和直接。傑克·唐加拉曾撰文指出,超級計算機最重要的作用就是模擬計算。超級計算機越快,我們就能進行越精密和準確的計算。也意味著科學家能得到更精確的研究結果,也意味著工程師能設計出更好的產品,大到飛機和輪船,小到藥品和服裝面料。對此,廣州超算中心已經提前做了準備。今年5月30日,運算能力峰值達340萬億次/秒的超算中心先導系統已經在中山大學投入開通。這個"迷你版"超級計算機採用了"天河一號A"的技術架構,用戶可以先在這裡"練手",等到"天河二號"正式開通,只用進行少量的適配工作,就可以把程序直接移植至"天河二號"。據來自超算中心的數據,目前已有來自約60家單位的113個科研團隊在先導系統開發程序,涵蓋了氣象、工業仿真、動漫、生物、智慧城市、網絡安全、城市規劃和電子商務等領域。目前,先導系統利用率超過了85%。最早進入超算中心先導系統的單位之一、廣東省區域數值天氣預報重點實驗室副主任陳子通向南都記者透露,他們已經在數值預報精細化方面做了很多工作。目前,廣東的天氣數值預報使用的分辨率是18公里,步長是200秒,也就是說每324平方公里的面積,每200秒進行一次計算。在超算中心先導系統上,分辨率和步長分別提升到了3公里和60秒,計算的密度是原先的36倍,頻率超過原來的3倍,總的運算量一下子就增加了超過1 0 0倍———這還沒有把網格劃細之後帶來的複雜地形、建築物等影響考慮在內。陳子通還表示,隨著"天河二號"的正式投入運營,氣象部門也將利用超級計算機,研發出更加精細的數值預報模型。那麼,運算能力是不是真的需要11億億次/秒這麼多?盧澤新坦承"這還不好說"。超級計算機的建設有一定前瞻性,11億億次/秒有可能不能完全利用,也有可能供不應求。南都記者查閱公開報道發現,"天河一號A"被部署到天津超算中心僅三年,平均利用率已經可以穩定在70%左右。"天河二號"還承載著核電站模擬、石油勘探、海洋開發、大飛機研製等國家級科研項目,利用率能否趕上"大哥",值得期待。剛剛出台的《中央關於全面深化改革若干重大問題的決定》中,關於深化科技體制改革的部分提到,國家重大科研基礎設施依照規定應該開放的一律對社會開放。實際上,在決定公開前,廣州超算中心就已經準備這麼做。"我們的用戶主要是三大類。"盧澤新說。"第一類是政府。政府採用購買服務的方式,進行智慧城市等專屬性應用。第二類是扶持性的公益應用。科研單位、學校、中小企業都可以以優惠的價格使用超算。第三類是開放性的商業應用,面向全社會開放。與超算中心近在咫尺的生物島,就有很好的應用潛力。"經歷了35年改革開放,廣州正在面臨從傳統的勞動力密集型產業向創新產業轉型的關鍵時期,超算中心的建設正是轉型的一個具體行動。廣州超算中心希望和廣州本土的大企業攜手,共同打造一些公共服務平台,實現對資源的集約化利用,通過這樣的平台輻射中小型和創業型公司以及科研團隊。盧澤新補充說,能耗相較前代,"天河二號"的能耗有了顯著下降——— 它的運算能力是"天河一號A"的11.6倍,但耗電量僅為後者的4倍。"低能耗意味著價格更低,歡迎大家前來使用。"解密巨無霸"豪宅":五層大樓加地下室水電網絡都有備份談及廣州超算中心這個"一號工程"的建設進度,盧澤新用了"有點驚人"來形容。超過3.2萬平方米的五層大樓加上1萬平方米的地下面積,在廣州市重點辦的全力衝刺下,只用了不到一年就告完成。而"天河二號"的這個"新家"可不僅僅是大而已。超算不能承受斷電斷水斷網等意外,後勤保障必須有"B計劃"。以電力為例,供電部門為超算中心準備了兩路專線,可承擔6萬千瓦的功率,光變壓器就有26個。另外還特別配建了一個靜態投資1.9億元的分佈式能源站。這個能源站配置了由4台4300千瓦的燃氣內燃發電機組組成的燃氣冷熱電三聯供系統,即使出現意外,兩路專線同時停電,燃氣發電機也可以維持超算中心的重要負荷持續運轉。另外,發電機產生的余熱還可以被再次利用,用于超算中心的冷卻系統。與之類似,超算中心在供水和網絡上都至少準備了兩路專線。超算中心同時也考慮了"省錢"。盧澤新介紹,"天河二號"的冷卻系統也創新性地使用了水冷。夜間的電費較低,冷卻系統可以在夜間多制冰,等到白天再用來冷卻機房,通過這個時間差,冷卻系統的電費就降低了。"天河二號"問世錄●2011年11月25日,廣東省政府、廣州市政府、國防科技大學、中山大學在廣州簽署戰略合作協議,促成了"天河二號"的問世。●2013年5月底,"天河二號"接受測試。●2013年9月底,"天河二號"運到廣州。●預計2013年年底前,"天河二號"完成調試並試運行。採寫:南都記者 劉竹溪儲存

沒有留言:

發佈留言