邁向信息化政府——大數據時代的政務管理
2013年7月25日,郭永宏先生受邀為湖北省十堰市委中心組學習授課,下文由當日演講實錄整理而成。
一、當今世界已進入大數據時代
現在世界已經進入了大數據時代。什么是大數據呢?大數據是指對海量數據進行智慧分析并且預測結果的行為和思維方式。以2012年的互聯網為例,每天有2940億封電子郵件發出,如果采用20多年前寄信的方式,需要美國郵政局處理兩年;每天有200萬篇博客發表、2。5億張照片上傳到Facebook;每天有86。4萬小時的視頻上傳到Youtube,如果連續播放需要770年,這一天產生的信息量,可以裝滿1。86億張DVD光盤。
《大數據時代》的作者舍恩伯格說,數據量在過去25年當中急劇增長,所以就形成了現在的數據雪崩。1987年,模擬數據量是26億,數字數據量是2000萬。2007年,模擬數據量是186億,數字數據量是2760億。今天,模擬數據量占比已經不到2%,模擬數據很難被再處理、再應用,而數字數據可以不斷地被重復應用,數字數據的大量產生讓計算機處理成為可能。
什么時候開始爆發大數據呢?我們什么時候進入大數據時代呢?《大數據時代》這本書是去年12月份出版的,作者認為,世界進入“拍字節(PB,Petabyte)是大數據爆發的臨界點”。計算機上最小的數據單位是一個字節,一個英文字母或者一個阿拉伯數字就是一個字節,一個漢字相當于兩個字節。最早我們知道的是KB,就是千字節,MB是百萬字節,GB是億字節。世界進入大數據時代,后面還有EB、ZB等等,KB<MB<GB<TB<PB<EB<ZB<YB<BB<NB<DB。
中國國家圖書館藏書是2631萬冊,這相當于41TB,美國國家圖書館是1.5億冊,相當于235TB,一個PB相當于4.36個美國國家圖書館的數據量。現在新提出來一個概念,叫數據宇宙。據有關方面預測,從現在到2020年,數字宇宙將每兩年翻一倍,到2020年,全球的數據量會達到40ZB,人均數據預計將達5,247GB。現在,大部分數據沒有得到充分保護。2012年只有35%的數據被以某種形式進行保護。到2020年時,近40%的信息將會被云計算“觸及”。也就是說,數據在產生、傳播和處理應用的過程中,肯定在某一個環節被以云計算方式來展現。
大數據有四個特征即“4V”。一是Volume,數據量巨大。2007年的數據量是1987年的100多倍,這么大的數據量對過去傳統的存儲技術產生了挑戰,如果按照大數據時代的要求,現在的存儲方式肯定是不能適應的,而且成本巨大。將來唯有儲存到某個云計算中心或者云存儲中心,才是最便宜最方便的。二是Variety,數據的類型多。各種各樣類型的數據都被展現出來,有數字、圖像、聲音、文本等各種各樣的形式。三是Velocity,速度處理的要求高。業內的“一秒定律”認為,各種處理必須在1秒鐘內完成高速實時處理。四是Value,價值大、密度低。對于大量的數據我們可能不能在很短的時間內分析出來,可是里面又藏著巨大的價值,所以需要“沙里淘金”。
大數據是從哪來的呢?現在分為3類:有人和人之間,比如兩人之間的溝通;人和機器之間,比如我們操作電腦發郵件等等;還有就是機器和機器之間,比如物聯網。數據大部分都是來源于傳統的互聯網、桌面電腦、移動互聯網以及物聯網,還有云計算產生的數據。尤其是移動互聯網增長迅速,根據思科的統計,全球移動互聯網流量增長的復合增長率是年均66%,2012年底,移動互聯網的流量已經占互聯網總流量的13%,這些都是源于智能手機、平板電腦的大量增長。2011年,智能手機出貨量超過PC,2013年一季度中國智能手機用戶已經達到4.2億。初期,手機只有電話功能,那是大哥大時代;到GSM數字手機出現短信功能,后來手機開通GPRS功能就可以上網,進入2G時代;現在是3G時代,速率達到2-7M;4G將是70-170M的速率。不同時代的區別,主要體現在數據傳輸速率上。
大數據的要義是什么呢?《大數據時代》作者舍恩伯格講,大數據跟我們傳統的思維方式不一樣,我們過去追求的是因果關系,追求的是“WHY——為什么”,大數據時代最大的轉變,是放棄對因果關系的渴求,而關注相關關系。也就是說只需要知道“是什么”,而不需要知道“為什么”。比如,美國是颶風經常發生的地方,大數據顯示,發生颶風后人們會傾向于買兩種東西:手電筒和小餅干。手電筒萬一停電了用得著,為什么還要買小餅干,有些人百思而不得其解。但商家只需要知道買手電必買小餅干,或者發生颶風后必買小餅干,所以一旦發生颶風,他們就把手電筒和小餅干擺在最顯眼的地方出售,而不用問為什么,其實知道為什么也沒有多大用處。我國講究“因緣”關系,比如儒釋道都講求“因緣”、“因果”,而大數據時代對其做了一個改變,因為要追尋原因太復雜了。
二、大數據的應用價值無限
2011年5月,麥肯錫全球研究院發布了《大數據:創新、競爭和生產力的下一個新領域》報告,認為:大數據將在政府公共服務、醫療服務、零售制造等各個方面得到廣泛應用,而且會產生巨大的社會價值和產業空間。文中從契合度和應用可能性兩個角度分析并得出結論:政府機構與大數據有非常高的契合度,而且擁有非常大的應用可能性。美國總統奧巴馬說大數據是“未來的新石油”,他要求打破政府各部門、政府與民眾之間的“信息孤島”,實現數據共享,構建跨系統、跨平臺、跨數據結構的政府綜合信息處理平臺;實現政府內部縱向、橫向的流暢協同;縮短處理響應時間,提高工作效率,并使得政府信息的經濟價值得到最大化。現在,人們普遍的觀點是:數據是能挖掘潛在價值的軟資產,比固定資產更有價值。2012年,達沃斯論壇發布的報告《大數據 大影響》宣稱,數據已經成為一種新的經濟資產類別,就像貨幣或黃金一樣,叫數據資產,賽過黃金。
大數據的應用是非常多的。在市場推廣方面,可以做精準營銷。比如,美國的第二大百貨公司Target意圖搶占先機、占領孕婦市場,于是他們開始追蹤、搜集孕婦在懷孕期間一般會購買的產品數據,發現她們第二個妊娠期開始后買的東西有很多共同點,所以就設立了21個指標,根據這些用戶購買的產品情況來判斷用戶是否懷孕,然后進行精準營銷。
在票房預算、催生新行業這方面,大數據也有很大的應用價值。比如,去年《1942》剛上映的時候,許多人很看好,預測票房收入可能會超過7億。但是新影數訊公司通過大量的數據分析以后得出結論:票房不會超過4億。結果,最后電影票房是3。6億。現在,《泰囧》、《致青春》、《中國合伙人》這些電影劇本是怎么產生的,怎么會這么受歡迎呢?實際上,現在影視業在選劇本的時候就已經運用了數據分析。網上哪本小說點擊量大、閱讀量大,就從這里面選劇本改編。所以,《中國合伙人》、《泰囧》這些電影就會有很好的票房,而不是像以前那樣導演或制片想到什么就拍成電影。
在銀行金融領域,可以用大數據來檢測欺詐。比如,先設定模型:信用卡在短期內,離上一個消費地很遙遠的地方產生多次消費,就會被判斷為欺詐或者是盜竊,會通過拒絕使用來有效保護信用卡所有者的利益。
統計局過去運用的是抽樣調查,因為海量數據的使用成本太高。現在,Google公司每天大約有200億個網頁搜索,而且他們經過分析以后能精準地推送廣告,這打敗了過去傳統的廣告方式,一年可以為它帶來2300萬美元的收入。還有亞馬遜公司,通過大數據的分析,挖掘每個用戶的興趣偏好。比如,你想買《大數據時代》這本書,很可能會在網上淘這本書,亞馬遜公司看到之后,就會給你推薦有關互聯網的其他書籍。過去亞馬遜是做書評系統的,后來推薦系統比書評系統要受歡迎得多,而且有價值得多,所以公司的銷量也在大幅度增長。
瑞士一家電信運營商使用大數據進行客戶保有。該公司通過對電話往來情況分析發現,通話用戶和上網社交一樣,也有一個社區領袖。用戶領袖使用哪個公司的號,會導致他的追隨者、大眾跟著用這個公司的號。找出這些人之后,該公司就只對這個人有優惠,其他人沒有。因為其他人沒有影響力,所以不給優惠。這樣有利于節省營銷成本,提高效率。對運營商來說是實現客戶保有,對政府、銀行也有類似這樣的情況。網上的“社區領袖”、運營商的“消費領袖”、生活中的“輿論領袖”,對于防范各種事故和加強社會管理是非常有好處的。
在社會維穩方面,美國中情局建有自己的“私有云”,并且使用一系列云計算軟件,發現相關規律,幫助他們大海撈針,找到恐怖分子。為什么美國在9·11后基本沒有恐怖暴力事件?因為它的預防系統特別強。比如,棱鏡計劃。棱鏡計劃從2007年開始實施,主要通過互聯網公司和電話公司的光纜、網絡和設備的后門,攫取信息,找出可疑分子和恐怖分子。實際上,我們看到的“棱鏡計劃”只是一部分,它一共有四個項目,“主干道”和“碼頭”對“元數據”進行存儲和分析。“主干道”是對通話記錄,“碼頭”是對上網記錄。“棱鏡”和“核子”秘密監視項目則負責截取內容。“棱鏡”是對通話及短信內容進行監視,“核子”項目就是對上什么網站瀏覽什么內容進行監視。斯諾登負責的是“棱鏡”,就是通信通話這一部分,主要使用的是大數據的挖掘手段。有些好像不相干的、不屬于機密的信息,在他們眼里就成為有用的信息了。“手機使用時間和地點”、“信用卡購物記錄”等等,都是有用的。有人問:什么是大數據時代?和小數據時代的區別呢?在“小數據時代”,銀行卡信息、通話、信息內容等是個人的隱私;在“大數據時代”,除了這些之外,還有些不相干的數據都有可能泄露你的隱私。如劍橋大學最近有一個研究,通過分析你的社交圈,和什么人往來,就可以判斷你小時候父母有沒有離過婚。在小數據時代,個人的社交圈不是秘密。大數據時代,這可能就是泄露秘密隱私的重要方面。所以,如何保護好個人的隱私越來越復雜化,越來越重要。
運用大數據技術,我們還可以知道很多東西。比如說,不同年齡段人群分布在市區、縣城、鄉鎮、農村的大致比例?不同人群在網上關注什么?節假日期間不同人群最喜歡去哪里?他們的流動路線是什么?怎樣用最快的速度讓信息抵達需要它們的人群?比如說,5·12地震時,湖北很多地區的人不知道哪里發生地震。那時最早聽說地震是在十堰,一會又說是宜昌和荊門,移動的手機報快訊說是在四川汶川。那個時候我們的信息從哪獲取呢?不可能是報紙,因為第二天才能出來;也不可能是廣播,人不可能隨身帶著收音機;電視也不行,上班期間不可能看電視。所以,手機報、手機快訊傳遞的信息最快。
黨的十八大報告首次提出“四化同步”戰略,將信息化提升到國家戰略高度。最近,國務院常務會議要求把信息化從支撐地位轉變成直接拉動經濟社會發展的重要力量,明確要求促進信息消費。面對移動互聯網浪潮和大數據時代,如果地方政府、各部門采取“鴕鳥政策 ”,假裝不知道,不聞不問,或口頭應付、浮于表面,這樣既不符合中央要求,也不符合時代的要求,只能讓我們在時代發展中步步落伍。現在已經有了“數據宇宙”這個概念。如果各級政府、各部門不了解虛擬世界,不會運用移動互聯網信息技術,不懂得大數據概念,那么,我們在虛擬領域就是失控的。如果在這個領域失控,就沒有資格、沒有能力去管理這一領域的人群和事件。
三、大數據助力 向“信息化政府”邁進
哈佛大學商學院達文波特說:大數據及其分析,將會在未來10年改變幾乎每一個行業的業務功能。任何一個組織,如果早一點著手大數據的工作,就可以獲得明顯的競爭優勢。在大數據時代,創新政務管理的要義就是從“政府信息化”向“信息化政府”邁進,前者偏重于利用信息化手段提升效率,而后者更偏重大數據的思維,用信息化手段和方式解決處理問題,而且管理的范圍從平面的實體世界拓展到了立體的虛擬世界、“數據宇宙”。
怎樣利用大數據創新政務管理呢?一是要建設好信息化設施基礎。沒有信息化基礎,就談不上信息化,更談不上大數據。只有具備了這些基礎,才能具有收集能力。而且傳統的計算存儲方式根本不能適應大數據的發展要求,必須采用云計算的技術,要大膽地把“守著小家過日子”的概念拋棄,把我們的存儲器、服務器存儲到有保障的云存儲中心去。二是要收集和存儲數據。從現在開始盡可能地多收集各類數據,因為你現在不知道這些數據將來有什么用。如何收集好信息?統計局、信息中心等部門都需要考慮,包括傳統的方式究竟還合不合適?還有哪些重要的資源沒有得到?三是要分析。分析和挖掘數據是最重要的,因為只有分析,才能產生價值,所以我們要培養大數據分析的人才隊伍,要加強與通信產業和軟件廠商的合作。四是要加強運用。建議從現在開始把信息化、大數據培訓列為日常培訓項目之一,在政務人員中培養使用大數據的習慣,政府部門應該率先應用,形成示范作用。
現在各個國家都在做相關工作。比如,美國2011年2月發布《聯邦云計算戰略》白皮書,規定所有聯邦政府新建項目中云計算優先,并規定每個聯邦機構至少拿出3項現有的應用向云計算遷移;英國2011年11月宣布將啟動政府云服務,2015年至少有50%的政府公共部門的信息技術資源通過政府云來購買;韓國2009年12月推出《云計算全面振興計劃》。
具體對政府而言,首先要收集,政府部門需在建設集中信息渠道的基礎上,廣泛收集信息。第二要分析相關性,通過研究歷史數據的相互關聯找對關系,建立相關性模型。第三要進行大量預測、使用、防范和應用。大數據時代,政務信息化是大數據應用的基礎手段,我們一定要轉變思維模式,建立大數據的思維模式。什么是大數據的思維模式?《大數據時代》作者舍恩伯格說:以后這些數據部的分析人員、統計局、信息中心人員看到的是一個個數據,而不是一個個人。這就是要拋棄個體,看整體、看群體、看關聯、看特征。
此外,數據信息應優先放置在更放心、更安全的網絡上。大數據時代的監控手段,包括:嗅探監聽,對過境的海底光纜在接收端進行直接竊聽等;路由劫持,目前全球路由器13個頂級域名服務器中的9個都在美國,他們監控了全球70%的數據;網絡入侵,通過破解密碼來篡改口令,這就好比配了別人家的鑰匙直接進去拿東西;直接接管,直接要求美國電信公司威瑞森上交用戶的通話記錄。比如,2011年2月,伊朗宣布卸載核電站的核燃料。因為它的離心機被遠程軟件病毒“震網”攻破損毀,這個軟件設計要求必須高度熟悉工業生產過程中核武器的生產過程,任何一個黑客個體根本做不了。2007年,“震網”病毒被悄悄傳播到伊朗的互聯網上,這個病毒可以自我復制,它的特點是開始影響非常小,越往后損害越大。2008年,伊朗的核電站部分離心機出現故障,工程師還以為是部件出了問題。2009、2010年大規模的故障中,病毒篡改侵入監視系統,工程師從屏幕看上去一切正常,實際上機器已經超高速運轉,結果伊朗8000臺離心機中有1000多臺被報廢。這兩年再也聽不到伊朗的核聲音了,正是因為這樣一個“震網”病毒。
大數據時代最大的隱憂是隱私和安全方面,湖北移動也出現過類似的案例。今年一季度,一個不法代理用一些虛假身份證虛假入網,套取酬金、電子消費券。過去的財務制度是今天報賬、第二天審核,而電子券是24小時、不受時間限制的。這個不法分子就用這種漏洞套取了90多萬元,去中百超市等處消費。因為要到晚上10點才會斷網,他有5個小時去消費、購買東西,公司第二天核帳的時候才發現。這樣的財物損失就是因為財務人員沒有適應移動互聯網的要求,沒有看到流程的漏洞而造成的損失。移動公司的這個案例還有可能重演,包括政府的審核制度,現在審核不能像以前那樣6點下班了,移動互聯網還沒有下班。
值得一提的是,我省的十堰是全國首個實現“刷手機乘公交”的地市,市民乘車出行不用投幣、不用刷卡,一部手機全搞定。目前,十堰月均刷手機乘公交的市民達到2.7萬人,32萬次,截至目前累計刷乘次數突破千萬。還有十戶聯防,家里的青壯年外出打工都走了,留下的都是老弱病殘,如何幫助村民實現自助自救?比如,十堰竹坪鄉店坪村有位70多歲的老漢獨自在家摔倒后無法行動,他想起兒子出門前告訴他有事就用手機撥打995,撥通后不一會隔壁鄰居就趕過來并送他就醫,老漢又感動又驚喜。如果等他兒子趕回來救他,恐怕就晚了。2013年上半年,十堰的“十戶聯防”用戶增幅全省第一,現已突破14萬。建議不斷加強信息化技術的運用,助力各級政府從“政府信息化” 不斷向“信息化政府”邁進。
相關文章
大數據等構成的人體信息物聯網將改變未來醫療模式
一條項鏈可以實時監測人體心肺功能、一個戒指可以監測呼吸脈搏等指標、一副眼鏡可以監測精神疾病患者狀況……記者20日從成都舉行的2021第二屆四川康復治療及產業論壇上獲悉,由大數據、云計算、有限傳輸與無線傳輸相結合構成的人體信息物...
依托大數據物聯網 開展防汛工作
記者從白云區綜合行政執法局獲悉,為確保轄區安全度汛,該局充分利用大數據、物聯網技術,開展職責范圍內防汛搶險的應急綜合調度、指揮、協調工作,以有效應對汛期突發事件、緊急或特殊情況。該局以白云區“數字城管”系統平臺為基礎,依托...
治理PM2.5推行智能型環保 云計算大數據首當其沖
兩會期間,全國人大代表、廣東省家電商會會長、TCL集團董事長李東生接受采訪時一句:“北京昨天的霧霾還很重,今天天氣很好,北京的天氣比較講政治。”的玩笑逗樂了在場所有記者。
大數據和分析解決方案如何在數字時代徹底改變業務?
如今的技術在不斷地發展。無論是自動駕駛汽車、機器人還是重型自動機械,技術只會隨著時間的推移而變得更好。然而,很多技術在很大程度上依賴于數據、各種規模和類型企業的信息,以及解釋這些數據和信息的高級分析技術。由于大數據在推動組織數...
信息化建設融入西部開發
西部大開發10周年之際,又值第十四屆西洽會,西部地區的經濟、民生和社會信息化發展成為社會各界關注點。日前召開的國務院常務會議強調,今后10年,必須以增強西部地區自我發展能力為主線,以保障和改善民生為核心,以科技進步和人才開發為...