面向大數據的生物信息云
云計算是一種通過Internet以服務的方式提供動態可伸縮的虛擬化的資源的計算模式?,F今,隨著高通量測序技術的迅猛發展,生物信息學進入到大數據時代,所引發的多組學海量生物數據的存儲和分析等問題亟待需要利用云的方式來解決。
近期,中國科學院北京基因組研究所基因組科學與信息重點實驗室的“百人計劃”章張研究員,與沙特阿卜杜拉國王科技大學(King Abdullah University of Science and Technology)、北京理工大學、IBM中國系統與科技中心開展合作研究,在Biology Direct雜志上發表了題為Bioinformatics clouds for big data manipulation的學術論文。文中分析了現有生物信息學領域的云計算服務(簡稱:生物信息云),根據其服務特點提出分類方法:數據即服務(DaaS,Data as a Service)、軟件即服務(SaaS,Software as a Service)、平臺即服務(PaaS,Platform as a Service)以及基礎設施即服務(IaaS,Infrastructure as a Service)。
生物信息云從四個方面提供了海量生物數據的儲存、獲取、分析等相關需求的服務。同時,文中對云計算在生物信息學的應用進行了展望和討論,提出并分析了以下幾個亟需解決問題,即生物信息云應實現數據和軟件的云儲存,結合的高速傳輸、P2P、數據壓縮等大數據的傳輸,開發基于云的輕量型編程環境,以及建立開放的生物信息學云平臺。