現在,作研究的人須要什麼?
試管?文獻?電腦?若是再來一朵 「雲」會怎樣?
別誤會,並非讓科研人員上天作科研,而是——給他們一朵「中國科技雲」。
<strong>大數據時代呼喚科技雲</strong>
以「數據密集型」和「大數據」驅動的科學研究範式帶來了科研方法論的變革,正成爲科學發現的新引擎。
數據與計算平臺已經成爲當代科學研究重要的信息基礎設施,而且將融匯貫穿於整個科學研究活動的全過程。<strong>近年來,幾乎在任何一項的重大科學發現和重大科技計劃中,數據與計算平臺都在扮演着無可替代的角色</strong>
<strong>2013 年諾貝爾化學獎</strong>
2013 年諾貝爾化學獎授予了三位美國科學家,獲獎理由是"爲複雜化學系統創立了多尺度模型",對於化學家而言,多尺度計算化學模型的創建使計算機變得像試管同樣重要。從應用的角度而言,大規模的計算資源和大量的"黑箱"計算程序的出現使得愈來愈多的研究能夠應用理論和計算的方法研究天然科學問題。
<strong>2017 年諾貝爾物理學獎</strong>
2017 年諾貝爾物理學獎授予了「首次探測到引力波」的三位美國科學家,在引力波的這一發現過程當中,激光干涉儀前四個月的觀測數據量達 500TB,總共消耗了 17 億 CPU 核小時的計算資源對數據進行處理。
<strong>2019 年第一張黑洞照片</strong>
2019 年 4 月,200 多名科研人員經過 8 個分佈於全球的事件視界望遠鏡觀測點「捕獲」了黑洞的視覺證據。此項研究歷時 10 餘年,加州理工學院使用 Blue Waters 超級計算機超過 1000 個 CPU 覈對 3.5PB 的原始數據進行近 900 個黑洞合併的模擬,總共花費了 2 萬小時的計算時間。
<strong>然而,如今許多研究人員所面臨的最大問題,不是缺乏數據,而是面對太多的數據無從下手。</strong>
人類社會從宏觀到微觀、從天然到社會的觀察、計算、傳播等活動,正在加速產生出海量且多樣的數據,數據呈現爆炸性增加:好比各類網絡社交信息數據,經過望遠鏡得到的天文學圖片數據、各類各樣的基因序列數據、經過大型對撞機、光源等大型物理裝置產生的實驗數據等。這些數據類型複雜、數據量大、產生速度快、蘊含較大價值,同時已經超出了普通人的理解和認知能力。
要從這些大數據中獲得科學發現,須要適應大數據管理與處理的理論、技術和方法的產生,涉及對數據的整合、海量數據的處理、算法的優化、研究結論呈現等多個方面。
在這種大的背景下,數據資源成爲了世界各國爭奪的新戰略資源,計算則成爲了衡量一個國家綜合國力和國際競爭力的重要標誌。數據與計算在科技領域的總體能力和應用,將集中體現一個國家的科技綜合實力。<strong>世界各國正加快建設以數據與計算爲主要特徵的信息化基礎設施,這必將深入影響世界科技格局。</strong>
幸運的是,咱們有了中國科技雲。
<strong>科學家本身的雲</strong>
阿里雲、騰訊雲、百度雲……在雲計算廠商遍地開花的時代, 不管是阿里雲仍是百度雲,都主要服務於商業活動。做爲一項專業性極強的研究活動,科研工做也須要一朵本身的「雲」。
中國科技雲是<strong>網絡、數據與計算融合的新型國家信息化基礎設施,爲全國科技工做者提供科技資源及服務的發現、訪問、使用、交易與交付一體化雲服務,全面支撐多學科交叉的開放科學研究。</strong>
通俗地講,中國科技雲就是把科學家要在各個網站上尋找的數據和計算工具整合在一個網站上,分門別類地提供給科學家,供科學家按需使用;同時,科學家也能夠把本身的服務上傳到中國科技雲,供他人使用。<strong>簡而言之,這是「科學家本身的雲」。</strong>
咱們來看看這朵科技雲有什麼獨到之處?
<strong>「專有」:</strong>中國科技雲以科研活動爲中心,以科研人員的使用習慣爲根本導向,在科學數據的存儲、傳輸、計算、分析、應用等各環節提供高效一體化的雲計算解決方案,不管是科研大數據快速共享發佈、科研專用的雲計算/超算服務仍是可視化雲服務,都爲科學家基於大數據與大計算與科學研究提供了有力的支撐。能夠說,這是爲科學家量身打造的專有科技雲。
<strong>「開放」:</strong>這裏是海量資源匯聚的一站式服務平臺。中國科技雲持續開放,匯聚國內外優秀信息化基礎設施和服務,目前已實現 350P 的計算資源,150P 的存儲資源,以及 PB 級的科學數據資源的匯聚與服務。集成綜合平臺 52 個,各種科研軟件 409 款,可提供網絡服務、計算服務、存儲服務、數據信息等 9 大類典型的雲服務。門戶系統實現了資源服務的註冊管理與動態發佈,爲用戶提供在線申請、即開即用、按需擴展的柔性雲服務。
<strong>「全球合做」:</strong>我國科學家基於中國科技雲前期工做基礎,開創性提出創建全球開放科技雲的倡議,獲得了多區域的科學雲平臺的普遍支持。目前,中國科技雲正在積極推動與歐洲網絡基礎設施、歐洲科研網等表明着歐開放科學雲核心基礎設施的機構,及美國全球科研交換中心的深化合做,啓動多邊先導計劃,共同開展技術、運行及政策研究,積極推動全球開放科學雲的建設。中國科技雲正在逐步成爲全球科技合做的重要紐帶和媒介。
<strong>誰在用這朵雲?</strong>
中國科技雲用戶羣體可覆蓋前沿與交通、能源、海洋、生命與健康等多個學科領域,科技工做者、服務提供者、資源提供者均可以在這朵雲上找到本身的位置。
<strong>中國科技雲已經服務於「地球大數據科學工程」「空間科學」等先導專項,以及「中國天眼」FAST 望遠鏡、高海拔宇宙線觀測站(LHAASO)等重大科技基礎設施</strong>,支持了一系列超級計算、科學技術和人工智能和跨洲際的科學數據傳輸工做,正逐步成爲支撐科技創新發展的戰略性設施。
正如中國科學院院士於貴瑞介紹中國科技雲在生態系統觀測中的應用時所說:「之前咱們每作一個項目,都本身設計一個數據庫,項目結題後,這個數據庫也就廢棄了,資源浪費比較嚴重;如今把數據庫嫁接在中國科技雲上,就可以不斷完善,逐漸造成一個龐大的系統。」他期待,將來可以在中國科技雲上,構建面向生態科學研究的「生態科學雲」,實現生態科學研究各要素的有機融合,充分利用大數據、智能計算和可視化分析等新手段,加速科學發現的進程。
<strong>怎麼加入(使用)科技雲?</strong>
目前, 「中國科技雲 2020 應用推動計劃」也啓動了,該計劃將經過公開徵集與擇優遴選等方式,爲有重大產出的科研項目免費提供計算資源等,提供的資源包括<strong>840 萬 CPU 計算機時、160 萬 GPU 計算機時、1000 臺雲服務器和 10PB 的雲備份,總價值 2800 萬元。</strong>
首批入選的科研項目包括 FAST 仙女座大型漩渦星系中的脈衝星搜尋、人工智能深度挖掘宏基因組功能信息、高精度環境大氣感知與智慧雲預測系統、聚變等離子體物理與工程數據庫、國家冰川凍土沙漠科學數據中心、國家基礎學科公共科學數據中心等。
<strong>將來,「六點」值得期待</strong>
爲了給科學家提供更好的服務,中國科技雲也在不斷地更新升級中,2019 年 12 月 26 日,中國科技雲迎來了上線後的第一次升級,中國科技雲 2.0 正式發佈。中國科技雲項目負責人黎建輝研究員說:「將來一年裏,咱們會面向科研需求,爭取至少每月提供一款,爲科研、科學家定製的新服務。」
將來,中國科技雲將經過技術創新和軟硬件設備持續升級,實現<strong>讓網絡再快一點、讓數據再多一點、計算力再強一點、存儲再大一點、應用面再廣一點,可以爲更多領域的科研人員提供再好一點的服務,</strong>真正成爲支撐科技創新、驅動科學發展的加速器和倍增器。
撰文:張文韜
審覈:中國科學院計算機網絡信息中心算法