大數據:天使,還是魔鬼?
[ 導讀 ] 提起大數據,很多人都感覺略知一二;但大數據到底是什么,又很少有人能解釋清楚。
提起大數據,很多人都感覺略知一二;但大數據到底是什么,又很少有人能解釋清楚。今年兩會期間,包括小米科技創始人雷軍、聯想集團董事長楊元慶、科大訊飛董事長劉慶峰在內的多位代表、委員都提出了與大數據相關的建議和提案,他們一方面希望從國家層面推動大數據的發展,另一方面也對它在信息安全方面可能存在的隱患提出了警示。
大數據記錄了所有一切
一份調查顯示,2013年我國產生的數據總量超過0.8ZB,相當于2009年全球的數據總量;而到2020年,一個普通中國家庭每年產生的數據量,將相當于半個國家圖書館的信息儲量。
中國電子學會秘書長徐曉蘭委員指出,海量的信息儲存和挖掘,既是大數據的價值所在,也是它有別于傳統互聯網、可能對信息安全帶來的新隱患。
“大數據時代,記錄了很多以往根本不可能或者不需要記錄的數據,比如微博、朋友圈的內容,上網產生的cookie,家庭水電氣使用的情況、汽車和大型設備上安裝的傳感器拿到的數據等。”社交數據分析公司獨到科技的CEO張文浩說,“如果這些信息都是‘孤島’,影響可能不大。但一旦相互關聯,影響力會大得驚人。”
中科院信息工程所所長田靜委員也表示,以往碎片化的數據只是盲人摸象,但現在這些碎片全都被存貯起來,通過相關性分析拼湊,“就知道象到底長什么樣了”。
技術上的差距,也造成了大數據暫時的“不安全”。
“沒有自己的分析能力,我們怎么能搞清楚哪些數據是需要保護的?”
對于田靜的這個“問題”,國家信息化專家咨詢委員會副主任、中國工程院院士鄔賀銓提供的一組數據給出了答案——數據中,大約有一半是應該保護的,但我們現在真正保護的“只有一半的一半”,很多數據在有意或無意當中被獲取,“如果這些數據整合起來,被某些別有用心的人利用,會對安全造成很大的影響”。
徐曉蘭介紹,目前我國很多機構和企業使用大數據分析軟件都是國外廠商生產的,特別是近幾年視頻等多媒體數據爆炸性增長,“這些數據都是異構化的,這部分軟件是我們的短板”。
著名軍事專家尹卓委員則指出,現在互聯網所使用的服務器大都放在美國,“自己沒有服務器怎么可能安全”?
另一方面,在田靜看來,缺乏大數據環境下的安全理念也是重要原因之一。“過去認為無害的信息,在數據爆炸的今天,已經完全不一樣了。觀念不改,是沒有秘密可保的。”
張文浩也認為,國人缺乏這方面的意識。“在美國,很多人都會要求不公開自己的隱私,或者主動把自己的數據提供給某些特定的機構使用;但在國內幾乎沒有聽到過,大家也不知道什么類型的數據可能會有多大的風險。”
大數據或許也很“危險”
張文浩認為,很多人對于大數據的理解都只注意到數據的體量和統計,“其實,通過深度分析,從紛繁的數據中抽象出規則和原理,并實現對未來的前瞻性預測,才是大數據真正的價值和魅力所在”。
因為大數據,奧巴馬在2012年成為過去70年來,第一位在失業率高達7.4%的情況下成功連任的美國總統;因為大數據,Target超市“預測”了18歲少女的懷孕……
任何一項新技術的背后,都可能懸掛著一把達摩克利斯之劍。大數據也是如此,在人們驚嘆于它的“神力”之時,“威脅”也正悄悄逼近。
“前兩年,國外一家情報搜集機構利用國內某機構人員公開發表的數據和資訊,進行深度挖掘分析,生成了有價值的情報。”徐曉蘭告訴記者,后來經過詳細調查,確認情報確實不是該人員提供,而生成情報的那些數據本身也是可公開的。“這在以往幾乎是不可能的,也給我們敲響了警鐘。”
尹卓以戰時的交通流量信息舉例說,如果不注重數據的安全使用,將可能對國家安全帶來隱患。“科索沃戰爭中,南聯盟的油料庫雖然隱蔽得很好,但美國軍方通過對衛星圖中的交通流量進行分析,劃定了大量油罐車經常出沒的區域,在進行精確搜尋,從而一舉炸毀。”
如果您認為這些“危險因素”離自己很遠,那就大錯特錯。
“現在很多智能手機的應用都要求訪問通訊錄,”鄔賀銓說,很多人覺得自己沒有什么秘密,就同意了。“但實際上,這不僅會透露自己的大量信息,也會把很多人置于隱私暴露的危險之下 。”
張文浩也指出,現在很多年輕人都有用手機發微博或者“簽到”的習慣,“這樣其實會泄漏自己的很多信息。比如你白天經常簽到的位置就很有可能是你的單位,傍晚以后簽的多半是自己家”。
大數據正經歷成長的煩惱
“要想征服數據,只有更好地利用它們。”張文浩說,數據是一種資源和財富,積累越多,產生的效力也會越大。
這個觀點得到了鄔賀銓的認同。他認為,越想規避大數據帶來的安全風險,越需要搜集儲存海量的數據,并進行深入的挖掘分析。“有統計顯示,國內數據搜集量不及日本的60%和北美的7%,大量數據留這樣白白流逝。”
“企業掌握的數據畢竟有限,而且是局部的。”百度公司董事長李彥宏委員提出了數據開放的概念,國家應該把那些不涉及安全的數據公開,讓有能力的機構進行更好的分析利用。
國家基礎地理信息中心原總工程師李莉委員指出,有的公共部門掌握了大量公共信息,這些數據是國家基礎信息的重要組成部分。鄔賀銓強調,這些數據“不愿與其他部門共享,導致了信息不完整或重復投資”。
共享數據在技術上是否存在很大的難度?在徐曉蘭看來,現在需要大力發展的數據挖掘、分析方面的技術,但對于數據共享本身而言,技術不是最大的障礙,關鍵還是利益協調。她說幾年前,國土部和銀監會準備摸底國家土地信息,“一開始很多人提出各種各樣的困難,幾乎認為是不可能完成的任務。但后來引入問責等行政手段,得到地方配合,進行得就很順利”。
張文浩認為,建立一個公開、透明、規范的數據市場,將會大大增強數據的利用率。但在這個過程中,需要仔細考量什么樣的數據可以進入市場。
這就涉及到立法的問題。“界定‘隱私’和為數據進行安全分級,是制定法律法規時要優先考慮的方面。”他指出,“個性化服務和隱私之間是一個博弈。名字、電話、住址……不能什么都說是隱私,因此需要為數據安全分級。簡單地說,通過數據分析的經驗,我們會知道哪類信息具有更強的指向性和排他性。這類信息的安全級別就應該更高。”
大數據記錄了所有一切
一份調查顯示,2013年我國產生的數據總量超過0.8ZB,相當于2009年全球的數據總量;而到2020年,一個普通中國家庭每年產生的數據量,將相當于半個國家圖書館的信息儲量。
中國電子學會秘書長徐曉蘭委員指出,海量的信息儲存和挖掘,既是大數據的價值所在,也是它有別于傳統互聯網、可能對信息安全帶來的新隱患。
“大數據時代,記錄了很多以往根本不可能或者不需要記錄的數據,比如微博、朋友圈的內容,上網產生的cookie,家庭水電氣使用的情況、汽車和大型設備上安裝的傳感器拿到的數據等。”社交數據分析公司獨到科技的CEO張文浩說,“如果這些信息都是‘孤島’,影響可能不大。但一旦相互關聯,影響力會大得驚人。”
中科院信息工程所所長田靜委員也表示,以往碎片化的數據只是盲人摸象,但現在這些碎片全都被存貯起來,通過相關性分析拼湊,“就知道象到底長什么樣了”。
技術上的差距,也造成了大數據暫時的“不安全”。
“沒有自己的分析能力,我們怎么能搞清楚哪些數據是需要保護的?”
對于田靜的這個“問題”,國家信息化專家咨詢委員會副主任、中國工程院院士鄔賀銓提供的一組數據給出了答案——數據中,大約有一半是應該保護的,但我們現在真正保護的“只有一半的一半”,很多數據在有意或無意當中被獲取,“如果這些數據整合起來,被某些別有用心的人利用,會對安全造成很大的影響”。
徐曉蘭介紹,目前我國很多機構和企業使用大數據分析軟件都是國外廠商生產的,特別是近幾年視頻等多媒體數據爆炸性增長,“這些數據都是異構化的,這部分軟件是我們的短板”。
著名軍事專家尹卓委員則指出,現在互聯網所使用的服務器大都放在美國,“自己沒有服務器怎么可能安全”?
另一方面,在田靜看來,缺乏大數據環境下的安全理念也是重要原因之一。“過去認為無害的信息,在數據爆炸的今天,已經完全不一樣了。觀念不改,是沒有秘密可保的。”
張文浩也認為,國人缺乏這方面的意識。“在美國,很多人都會要求不公開自己的隱私,或者主動把自己的數據提供給某些特定的機構使用;但在國內幾乎沒有聽到過,大家也不知道什么類型的數據可能會有多大的風險。”
大數據或許也很“危險”
張文浩認為,很多人對于大數據的理解都只注意到數據的體量和統計,“其實,通過深度分析,從紛繁的數據中抽象出規則和原理,并實現對未來的前瞻性預測,才是大數據真正的價值和魅力所在”。
因為大數據,奧巴馬在2012年成為過去70年來,第一位在失業率高達7.4%的情況下成功連任的美國總統;因為大數據,Target超市“預測”了18歲少女的懷孕……
任何一項新技術的背后,都可能懸掛著一把達摩克利斯之劍。大數據也是如此,在人們驚嘆于它的“神力”之時,“威脅”也正悄悄逼近。
“前兩年,國外一家情報搜集機構利用國內某機構人員公開發表的數據和資訊,進行深度挖掘分析,生成了有價值的情報。”徐曉蘭告訴記者,后來經過詳細調查,確認情報確實不是該人員提供,而生成情報的那些數據本身也是可公開的。“這在以往幾乎是不可能的,也給我們敲響了警鐘。”
尹卓以戰時的交通流量信息舉例說,如果不注重數據的安全使用,將可能對國家安全帶來隱患。“科索沃戰爭中,南聯盟的油料庫雖然隱蔽得很好,但美國軍方通過對衛星圖中的交通流量進行分析,劃定了大量油罐車經常出沒的區域,在進行精確搜尋,從而一舉炸毀。”
如果您認為這些“危險因素”離自己很遠,那就大錯特錯。
“現在很多智能手機的應用都要求訪問通訊錄,”鄔賀銓說,很多人覺得自己沒有什么秘密,就同意了。“但實際上,這不僅會透露自己的大量信息,也會把很多人置于隱私暴露的危險之下 。”
張文浩也指出,現在很多年輕人都有用手機發微博或者“簽到”的習慣,“這樣其實會泄漏自己的很多信息。比如你白天經常簽到的位置就很有可能是你的單位,傍晚以后簽的多半是自己家”。
大數據正經歷成長的煩惱
“要想征服數據,只有更好地利用它們。”張文浩說,數據是一種資源和財富,積累越多,產生的效力也會越大。
這個觀點得到了鄔賀銓的認同。他認為,越想規避大數據帶來的安全風險,越需要搜集儲存海量的數據,并進行深入的挖掘分析。“有統計顯示,國內數據搜集量不及日本的60%和北美的7%,大量數據留這樣白白流逝。”
“企業掌握的數據畢竟有限,而且是局部的。”百度公司董事長李彥宏委員提出了數據開放的概念,國家應該把那些不涉及安全的數據公開,讓有能力的機構進行更好的分析利用。
國家基礎地理信息中心原總工程師李莉委員指出,有的公共部門掌握了大量公共信息,這些數據是國家基礎信息的重要組成部分。鄔賀銓強調,這些數據“不愿與其他部門共享,導致了信息不完整或重復投資”。
共享數據在技術上是否存在很大的難度?在徐曉蘭看來,現在需要大力發展的數據挖掘、分析方面的技術,但對于數據共享本身而言,技術不是最大的障礙,關鍵還是利益協調。她說幾年前,國土部和銀監會準備摸底國家土地信息,“一開始很多人提出各種各樣的困難,幾乎認為是不可能完成的任務。但后來引入問責等行政手段,得到地方配合,進行得就很順利”。
張文浩認為,建立一個公開、透明、規范的數據市場,將會大大增強數據的利用率。但在這個過程中,需要仔細考量什么樣的數據可以進入市場。
這就涉及到立法的問題。“界定‘隱私’和為數據進行安全分級,是制定法律法規時要優先考慮的方面。”他指出,“個性化服務和隱私之間是一個博弈。名字、電話、住址……不能什么都說是隱私,因此需要為數據安全分級。簡單地說,通過數據分析的經驗,我們會知道哪類信息具有更強的指向性和排他性。這類信息的安全級別就應該更高。”
標簽:
【聲明】物流產品網轉載本文目的在于傳遞信息,并不代表贊同其觀點或對真實性負責,物流產品網倡導尊重與保護知識產權。如發現文章存在版權問題,煩請聯系小編電話:010-82387008,我們將及時進行處理。
相關文章
大數據等構成的人體信息物聯網將改變未來醫療模式
一條項鏈可以實時監測人體心肺功能、一個戒指可以監測呼吸脈搏等指標、一副眼鏡可以監測精神疾病患者狀況……記者20日從成都舉行的2021第二屆四川康復治療及產業論壇上獲悉,由大數據、云計算、有限傳輸與無線傳輸相結合構成的人體信息物...
03月24日 14:41科技日報
依托大數據物聯網 開展防汛工作
記者從白云區綜合行政執法局獲悉,為確保轄區安全度汛,該局充分利用大數據、物聯網技術,開展職責范圍內防汛搶險的應急綜合調度、指揮、協調工作,以有效應對汛期突發事件、緊急或特殊情況。該局以白云區“數字城管”系統平臺為基礎,依托...
06月09日 10:04貴陽日報
治理PM2.5推行智能型環保 云計算大數據首當其沖
兩會期間,全國人大代表、廣東省家電商會會長、TCL集團董事長李東生接受采訪時一句:“北京昨天的霧霾還很重,今天天氣很好,北京的天氣比較講政治。”的玩笑逗樂了在場所有記者。
03月10日 20:36賽迪網
大數據和分析解決方案如何在數字時代徹底改變業務?
如今的技術在不斷地發展。無論是自動駕駛汽車、機器人還是重型自動機械,技術只會隨著時間的推移而變得更好。然而,很多技術在很大程度上依賴于數據、各種規模和類型企業的信息,以及解釋這些數據和信息的高級分析技術。由于大數據在推動組織數...
03月05日 10:54企業網D1Net
互聯網趨勢下,物流倉儲如何“玩”好大數據
前段時間電商物流界兩位大佬的“數據之爭”在網上鬧得沸沸揚揚,其他因素先不說,單說引起此次紛爭的“大數據”,已經是互聯網時代一個不得不思考的問題。早已有人斷言:得數據者得天下。巨沃成立至今一直專注于倉儲物流供應鏈的管理與訴求...
05月08日 14:03 巨沃科技