“掌控數據生命 簡約開放存儲”主題沙龍召開
磁盤備份設備如今成為主流的數據保護存儲方式,而能夠削減備份集中冗余數據的重復數據刪除技術也成為了標配。但單獨一臺形式的磁盤備份存儲產品容易成為“孤島”,無法避免單點故障,并且在性能和容量擴展上存在明顯的限制。針對這一行業內的共同話題,8月9日下午,比特CIO俱樂部主辦了“掌控數據生命 簡約開放存儲”主題系列沙龍活動。

參會嘉賓合影
出席本次沙龍的嘉賓有:國務院發展研究中心研究員陳寶國、工信部信息化研究中心主任劉權、中石化教授級高工吳正宏、國家圖書館中央控制室主任于洪波、民政部信息化中心副主任胡曉明、國家統計局數據管理處處長梁達敏、民生證券技術總監顏陽、華融資產管理公司CIO陳國斌、海航集團信息管理部總經理孟霆、搜房網無線事業部總經理劉之,以及ESG總經理兼高級分析師王叢、惠普公司存儲產品技術顧問張楠、HP存儲備份產品經理張梅生。
大數據:“三者”的統一
來自工信部信息化研究中心的劉權主任在會上做了“大數據時代下企業存儲模式”為主題的演講。他表示,雖然大數據直接代表的是數據集合這一靜態對象,但是大數據,并不僅僅是大規模數據集合本身,而應當是數據對象、技術與應用三者的統一。從對象角度看,大數據是大小超出典型數據庫軟件采集、儲存、管理和分析等能力的數據集合。從技術角度看,大數據技術是從各種各樣類型的大數據中,快速獲得有價值信息的技術及其集成。從應用角度看,大數據是對特定的大數據集合,集成應用大數據技術,獲得有價值信息的行為。

工信部信息化研究中心主任劉權
在劉權看來,大數據的關鍵技術既包括數據分析技術等核心技術,也包括數據管理、數據處理、數據呈現等重要技術。大數據技術是一系列技術的集合。實際上,任何單一的軟件產品都無法完全解決大數據問題,需要一整套全面的解決方案,也就是對若干信息技術與產品的集成。面向大數據應用或說面向大數據信息系統建設的集成技術,是大數據的關鍵技術之一,也是決定大數據應用水平的重要技術。
能源行業:綠色存儲前景廣闊
比特CIO俱樂部的老朋友,來自中石化的教授級高工吳正宏老師,在以“石油石化行業信息化與綠色存儲”為主題的演講中指出,石油石化行業信息化的特點是產業鏈長,關聯專業多,企業規模大,生產經營單位分布廣,生產、經營、管理體系復雜信息化體系復雜,建設應用難度較大。

中石化教授級高工吳正宏
吳正宏在演講中介紹到,石油石化行業對存儲也是[FS:PAGE]高要求,主要包括以下幾點:勘探與生產技術數據:數百TB的地震數據,20多萬口油、氣、水井的井筒數據,近20萬口井的測井數據,2萬多個文件的成果數據;油氣水井生產數據:20多萬口油氣水井的近10億條數據;煉油與化工運行:1000多套煉化生產裝置,40多萬個自控系統數據采集點;管道生產:4萬多公里油氣長輸管道,5萬多個SCADA數據采集點;銷售ERP:每年萬噸的成品油銷售業務,年處理近4千萬張單據。吳正宏相信,隨著信息化的深入和兩化的深度融合, 綠色存儲在石油石化行業應用的前景將越來越廣闊。
大數據時代的信息保護
大數據的時代數據量大、數據種類多樣、要求實時性強。工信部發布的物聯網“十二五”規劃中,把信息處理技術作為4項關鍵技術創新工程之一。其中包括:海量數據存儲,數據挖掘,圖像視頻智能分析。

HP存儲技術顧問張楠
HP存儲技術顧問張楠在會上談道:“數據的指數級增構成了最大的 基礎設施挑戰。最大的數據增幅出現在非結構化文件數據領域,占到所存儲信息的85%,并且達到了45-55%的增長速度。另外,備份及恢復數據主要面臨的4方面的挑戰:1.不能滿足備份窗口的要求,數據量已經不是當初的數據量,但備份窗口還是那個長度;2.災難恢復工作復雜,備份的數據異地保存,運輸成本及管理成本;3.分支機構以及遠程辦公室的數據保護是個難題;越來越多的分支機構,越來越多的數據,使得對這些數據的保護成本極大的增加,同時還存在極大的不可靠性;4.恢復時間是一個更大的問題;備份的目的是為了恢復,恢復的時間直接導致你的生產效率。”
新一代重復數據刪除技術
ESG-Sino總經理兼高級分析師王叢認為,數據中心的演進面臨5大挑戰:數據增長、系統性能、可擴展性、網絡資源和生命周期保護。而傳統重復刪除災備效率問題是部署和管理負載性、不同技術不兼容、數據恢復效率低下以及網絡帶寬利用率低管理復雜利用率低下。

HP存儲技術顧問張楠
HP存儲技術顧問張楠在會上談道:“數據的指數級增構成了最大的 基礎設施挑戰。最大的數據增幅出現在非結構化文件數據領域,占到所存儲信息的85%,并且達到了45-55%的增長速度。另外,備份及恢復數據主要面臨的4方面的挑戰:1.不能滿足備份窗口的要求,數據量已經不是當初的數據量,但備份窗口還是那個長度;2.災難恢復工作復雜,備份的數據異地保存,運輸成本及管理成本;3.分支機構以及遠程辦公室的數據保護是個難題;越來越多的分支機構,越來越多的數據,使得對這些數據的[FS:PAGE]保護成本極大的增加,同時還存在極大的不可靠性;4.恢復時間是一個更大的問題;備份的目的是為了恢復,恢復的時間直接導致你的生產效率。”
新一代重復數據刪除技術
ESG-Sino總經理兼高級分析師王叢認為,數據中心的演進面臨5大挑戰:數據增長、系統性能、可擴展性、網絡資源和生命周期保護。而傳統重復刪除災備效率問題是部署和管理負載性、不同技術不兼容、數據恢復效率低下以及網絡帶寬利用率低管理復雜利用率低下。

ESG-Sino總經理兼高級分析師王叢
傳統的重復數據刪技術的效率并不夠高,因為它必須視應用程序、工作負載、網絡協議和數據類別而采用多項產品和流程。數據往往在其生命周期中多次被復制、然后又再被重復刪除。那么,新一代的數據到底如何重復刪除?王叢給出了自己答案:“聯線與后期處理,聯線需要更少的 I/O,并且可以立即進行復制,數據重組有利于數據恢復,但會影響性能。而后期處理則需要更多的I/O,需要磁盤的磁頭停放區(暫存區),去重和復制過程重疊,最新的數據以本機格式得到完整保存。下一代重復刪除技術應具備橫向擴展,重刪系統性能和高可擴展性,可攜帶重刪引擎,全域名重復刪除,靈活部署選擇以及統一、透明、自動化管理的特點。”
沙龍最后,來自政府行業、金融行業的CIO與惠普方面的技術專家就“如何保證在應用去重技術后的數據安全性”、“如何部署重復數據刪除設備,使之能夠滿足多地備份需求”等相互關心的話題進行了圓桌對話。針對金融行業大數據應用現狀,比特網記者張詫在會后對 民生證券技術總監顏陽進行了專訪。

專訪現場