涂子沛:通过数据解决社会问题是未来发展方向--华夏物联网

亚洲男人的天堂在线播放,久久99精品久久久久久清纯,日本乱人伦片中文三区,亚洲精品中文字幕乱码三区,777亚洲熟妇自拍无码区

涂子沛:通過數據解決社會問題是未來發展方向

業界動態
鳳凰衛視
2014-02-10
[ 導讀 ] 涂子沛老師分析說,從數據當中去發現規律,用數據來解決社會問題,這種想法其實有更久的淵源。1830年我們的法國哲學家孔德他就提出社會物理學的概念,他們當時也從數據當中得到一些重要的發現,他們在研究自殺率,他們發現倫敦的自殺率無論是在一個經濟簫條的時候還是經

        鳳凰衛視2月7日《世紀大講堂》,以下為文字實錄:

        田桐:如果有一天你看到一輛無人駕駛的車輛行駛在公路上,或者有一天看到一臺打印機能夠完完全全打印出你想所要的所有東西的話,那么你不必訝異,因為您已經進入到了大數據的時代。正如哈佛大學社會學的教授加里·金所指出的,這是一場革命,龐大的數據資源已經使得各個領域開始進入到了信息化的時代。無論是商界、學術界還是政府,所有領域都將進入到這個進程。那么究竟什么是大數據,大數據時代對我們的生活帶來哪些變革和挑戰呢?我們今天請到的嘉賓是《大數據》一書的作者,著名的信息管理專家涂子沛先生和我們闡述《大數據生活方式與社會治理》,有請。

        解說:涂子沛,知名信息管理專家,中國旅美科學技術協會副主席,兼任華南理工大學公共政策研究院副教授。廣東省政府大數據顧問,2012年其著作《大數據》在中國引起了對大數據戰略的討論,被《亞洲周刊》等媒體評為“2012年度中國十大好書”。2013年10月因為在大數據領域的研究和貢獻,獲第四屆中國軟科學前沿探索獎。

        田桐:涂老師您好,非常感謝您的遠道而來。

        涂子沛:您好田桐,您好,大家好。

        田桐:那么其實大數據這樣一個詞,我們進入到我們的視線當中是從2012年開始的,究竟大數據是一個什么樣的概念?它起源于什么時候?

        涂子沛:大數據的本質是數據價值的提升

        涂子沛:對,我們大家現在都在談大數據,2012年被稱為大數據元年,我們說怎么來理解這個大數據這個概念呢?核心要理解什么叫大,田桐你怎么理解什么是大呢?

        田桐:所謂這個大數據我不知道是它的容量大還是說它現在所需要,或者今后承載的東西會越來越大?就是這個大是一個質的數字還是說一個量的數字?

       涂子沛:沒錯。

        田桐:我不太了解這個。

        涂子沛:你說到的,我們說最重要的就是容量在變大,但是容量在變大呢是一個現象,我們說大,還是可以說大房子還有大人物大趨勢,這個大的意思是表示重要性、價值。那我們說本質是什么,大數據的本質是數據的價值在增加,除了容量在變大。

        田桐:我們看到您的這本書,也是非常火的一本書《大數據》,在它的這個封面的副標題上也寫這正在到來的數據革命。您認為這個革命是什么樣的革命?會不會是第四次的浪潮?

        涂子沛:我們經常說第四次的浪潮是針對說我們有前三次技術的浪潮對吧,18世紀的蒸汽機的浪潮,19世紀內燃機的浪潮到20世紀計算機的浪潮,這股浪潮呢說把我們帶進了信息社會、信息時代。我們現在大數據時代來到了,我們說是一個新的浪潮,但是呢我們能不能說這是人類歷史上的第四次浪潮?這個結論我們暫時還不能下,我們要拉長歷史的鏡頭,還有待觀望,但是大部分學者都認為,我們已經不僅僅處在一個信息時代了。很多人說在我們在一個新的時代,那這個新的時代叫什么名字呢?有的人說叫新信息時代,有人說叫后信息時代,那我有個觀點,我認為我們在進入一個智能時代,不是一個簡單的信息時代。

        田桐:那么所謂的大數據時代,眼看著就要到來了,可能已經到來了,它對于我們來說難道僅僅只是數字上的改變嗎?它會對我們的生活起到什么樣的變化?

        涂子沛:對,數據會影響我們的生活,最大的影響是什么呢?是我們會越來越依賴機器,越來越依賴網絡,機器跟網絡呢會獲得智能,獲得智慧,我們會進入一個人機共生的狀態。但機器呢又是由數據驅動的,我們的生活會被數據阻擋,被數據驅動。有一句話說軟件在定義這個世界,數據在驅動這個世界。

        田桐:那您覺得這是一個好的事情還是一個壞的事情,生活的所有重點全部都由數據來趨導?

        涂子沛:我認為這不是一個糟糕的事情,畢竟我們在邁進一個智能化的時代,這個智能化的時代,我們享受到很多的便利,就像主持人剛剛說的,無論駕駛汽車、三G打印,這都是在數據背后在驅動。我們生活身邊就已經有很多了,你像阿里巴巴,這是我們中國的大數據公司,它在短時間內能夠發放貸款,原來我們發放一筆貸款那經常要幾個星期甚至一個月的時間去審核,但是它依靠它的大數據,在幾分鐘之內就能做出我貸不貸款這個決定效率是大大提高了。

        田桐:那么現在在國際上都哪些國家是在大數據引領前方的?

        涂子沛:我想科技的引領者那肯定首推應該是美國了對吧,歐洲跟美國它們在這方面都做的不錯。

        田桐:他們比我們領先在哪些方面?

        涂子沛:首先我想的話,就數據而言,我們現在說大數據時代數據是金礦,首先你得有這個礦,他們進入信息時代,進入信息社會比我們早,他們數據的積累比我們多,這是第一。第二,所有的基本上新的理念、技術浪潮的數據挖掘,機器學習這些新的理念還是在西方國家首先提出來。大部分高級的、高端的數據的分析工具,自主知識產權也在美國也在歐洲,那么還在說他們為了推動這個時代,歐洲很多國家包括美國,全世界有四十多個國家都在開放數據。我們數據現在是最重要的資源,他們把那些最重要的資源當中核心的部分、基礎的部分、公共的部分拿出來開放,免費給全世界使用,這推動了科技創新跟社會創新。

        田桐:那現在中國發展到一個什么樣的地步了?我們接下來往哪方面發展?

        涂子沛:我想的話,我們中國在大數據浪潮這個浪潮,我們是挑戰跟機遇并存,這個浪潮是我們離世界的距離最近的一次,我們相對以前的浪潮,我們剛剛談了三次技術浪潮,那時候我們跟世界的差距很大,但是現在我們跟世界的差距已經越來越小了,已經越來越小了。我們雖然還不是一些新的思想、新的技術產生的地方,但是新的思想、新的理念在全球自由的流動,我們可以吸收得很好,我們可以傳播得很好。我們可以學習的很好,所以這是我們的機遇。

        田桐:非常感謝您,更多的內容馬上由您給我們帶來今天的演講,有請。

        解說:大數據無疑是當下最為火熱的IT詞匯,圍繞大數據價值的利用,逐漸成為各行業人士爭相追捧的焦點。到底什么是大數據?它是如何發展而來?什么是數據挖掘?世紀大講堂大數據生活方式與社會治理正在播出。

        涂子沛:大家好,我們今天在這里是學術前沿、思想交流,我們說我們談到大數據的時候,現在是一個很熱的話題,怎么來認識大數據的現象?萬事萬物都有一個起點,我們的起點是什么?我們的起點是數據。什么是數據?我們要了解什么是大數據,首先要明白什么是數據,數據不是簡單的數字,數據是有根據的數字,數據是對客觀世界的一個測量,一個記錄,這才是數據。

        當我們一想到數據,我們會想到什么?我們會想到計算,我們想到事實,數據是最尖銳的事實,最精確的事實。為什么要用數據說話?翻譯過來就是要用事實來說話。我們還想到邏輯,想到精確,我們主持人剛剛也談到加里·金教授,哈佛大學的加里·金教授,他提出一句話,大數據是什么?大數據是一場量化的革命。我們說數據它就是一個量化的一個工具,而量化所有的科學都是為了量化。量化是科學的本質,如果沒有量化的話那就沒有科學,所以我們說數據是科學的語言,是科學的載體。

        我們說在進入信息時代之后,數據的內涵是在擴大的,發生了一個變化,什么變化?我們計算機產生了,數據庫出現了,我們把所有的東西放到數據庫里,結果呢數據的內涵就擴大了,音頻也放在里面,視頻也放在里面,圖形也放在里面。到信息時代的時候呢,數據已經開始指代信息了,它不是傳統的有根據的數字了,就它內涵擴大了,成為信息的代名詞了。

        還有一個更重要的變化,那就是體量在擴大,容量在擴大,那怎么擴大法呢?我們可以舉一個例子,我們說過去五十年,《紐約時報》所有的容量是三十億單詞,但現在我們僅僅一天微博上就是八十億單詞。相當于一天的這個數據量,就相當于過去一百多年的報紙的數據容量,所以上世紀八十年代的時候,很多學者就開始注意到這個問題了,他們就開始來定義大數據。到底多大才算大呢?當時賓夕法尼亞大學的一個教授定義了一個叫兩百太(赫茲)是吧,兩百太的數據,他說叫做大數據。那兩百太到底是多大呢?一千吉(赫茲)呢就是一個太,一部電影大概是一個吉,那兩百太呢就相當于二十萬部電影。當時的定義就是這樣,二十萬部電影的容量就是大數據了,就是大數據。那我們人類現在這個信息總量呢,我們說在這里啊,澤,我們現在大概是一個澤左右。我們有了這個概念之后,我們就來談大數據是怎么形成的,成因是什么,為什么我們何以走到今天對吧?

        我們走到今天不僅僅是一個數據的積累,從進入信息時代之后,我們1946年發明第一臺計算機進入信息時代,到現在60多年了,我們其實克服了很多困難,有很多的技術進步,才把我們推動到了今天。我們說第一個是什么,第一個就是1965年提出來的這個摩爾定律,1988年臺灣來的普適計算。1989年提出來的數據挖掘,我們說還有2004年出現的這個社交媒體,就這些現象集體地推動,才出現了這個大數據。我們來看看它具體怎么推動的。

        1965年的時候呢,英特爾的這個聯合創始人摩爾他就發現一個規律,他說一個集成電路,一個芯片上,同一個面積上的晶體管,一到兩年這個數量就要增加一倍,現在我們一個微處理器,上面的晶體管大概是幾十億個,就晶體管越做越小,越做越小,當然材料就越來越少,價格越來越低。同一個面積上不停地增加,它的性能就越來越好,導致了一個什么呢,就是這個計算機的性價比不斷提高,價錢不斷降低,性能反而不斷提高。我們比如說硬盤,1955年的時候,IBM推出第一款硬盤的時候,那時候一兆就六千美元,我們說一首歌就幾個兆了,那時候保存一首歌要幾萬美元對吧?我們說到1993年的時候,每兆降低到一美元,到了2010年的時候呢,降到每兆不到一美分了。你說半個世紀的存儲器的價格是下降了幾百萬倍,我們說人類歷史上沒有一種產品在半個世紀,它的價格能下降幾百萬倍。大家爭論比較多的是說什么?摩爾定律還會不會繼續有效?英特爾現在已經發明了三D晶體管對吧?他們已經用事實證明了,他們說摩爾定律到2020年之前,還會繼續有效,就是(價格)還會繼續下降。

        摩爾定律為我們解決一個很重要的問題,它為大數據時代的到來鋪平了道路,物理道路,就是再多的數據,再多的信息我可以非常低廉的成本來進行保存。那我們講第二個因素,普適計算,在1988年的時候,美國的一個科學家叫馬克·維瑟提出來的,他說什么呢?1988年互聯網剛剛產生,他說人類的計算浪潮可以分為三股,第一股叫做主機時代,主機時代的時候,計算機奇大無比,很多人共用一個計算機。一臺計算機就占了半個房間。好到了上個世紀七十年代末的時候,計算機變得很小了,出現了個人電腦,人手一機,但馬克·維瑟說這不是時代的終結,時代的終結是計算機會變得很小很小,它會融入到這個物理環境當中去,那你發現都發現不了。我們今天是不是到了這個時代?我們說我們的手機已經是臺計算機了,我們如影隨行是吧?我們還有RFID這種視頻標簽對吧已經很小很小,小的像豆子一樣。它是可以接收出去,可以發送出去。現在已經很多的應用,我們可以把這種RFID的標簽放到垃圾筒里,垃圾筒滿了的時候就發出信號對吧,美國的廢城他們就實施了一個這樣的項目。

        涂子沛:社交媒體使大數據時代“一錘定音”

        這個收垃圾的人員工作量直線下降,原來幾十個人收垃圾,垃圾處理隊伍現在變成幾個人,無論是摩爾定律還是普適計算,解決的問題都是剛剛主持人說的大容量的問題。大價值的問題一直到1989年我們提出數據挖掘之后才得到解決,1989年的時候,世界計算機協會召開了第一次數據挖掘的年會,標志著數據挖掘開始興起。我們說數據挖掘是用自動的算法在大量的數據當中得到一些隱藏的關系、模式,總結出新的知識。我們說數據挖掘也是大數據時代大眾所津津樂道的話題,其中最經典的例子莫過于某個超市的啤酒和尿布的故事。某個超市在數據當中發現啤酒和尿布它們的銷量呈現正相關的關系。為什么是這樣呢?經過調查他們發現,母親在生了孩子之后買尿布的經常是年輕的父親,他們在買尿布的時候呢,喜歡買點啤酒犒勞自己,那這個就是一個知識。超市利用這個知識把啤酒和尿布捆綁在一起,推動了兩個商品的銷量,成為了它的競爭性優勢。

        我們中國也不乏這樣的例子,最近華東師范大學有一個報道,我們有一個女生收到了來自校方的一封信,信里面問她你是不是有經濟困難?原來是校方的這個數據挖掘系統發現她餐費一直很少,這個女生很感動,但事后發現這是一個美麗的錯誤,她其實是在減肥。我們教育領域還有一些其他的故事,我們再說美國的威斯康辛州,他們有個學區,他們發現小學生一二年級的小學生經常請假,而且每年請假的這個比率趨向一個恒定,他們就做數據分析。他們發現請假最大的原因就是生病,生病最大的原因是哮喘病。有了這個發現之后,他們在開學新生入學的時候,就組織家長進行哮喘病的防治講座,這個很見效。接下來一兩年呢,這個學生請假的比率呢就明顯下降。

        我們說在數據當中挖掘出新的知識,數據挖掘給了我們人類使用數據的一個能力,我們說到2004年的時候,我們信息技術上的又一個革命性的現象出現了,社交媒體出現了。我們說社交媒體對人類社會的影響也是革命性的,我們舉個例子,2011年的時候,弗吉尼亞發生了地震,但是我們紐約州的居民距離弗吉尼亞吉百利,他們首先在微博上看到弗吉尼亞地震了,弗吉尼亞地震了,幾秒鐘之后這個震感才傳到紐約州。那我們知道現在信息傳播的速度比地震波還要快。那這個社交媒體對我們的這個大數據時代有什么意義呢?這個意義是決定性的,為什么這么說?我們這個社交媒體產生之前,我們是軟件在收集數據,是感應器在收集數據,但社交媒體產生之后,是全世界的網民都開始貢獻數據,而且這部分數據很特別,叫做非結構化數據。我們以前軟件收集的數據是有嚴整結構的。我們今天你發微博,他上開心網,他發的微博有可能有一個視頻,你發的可能沒有視頻,有一個圖像,說明它結構是亂的。這部分非結構化的數據,也給我們數據分析、數據挖掘帶來最大的挑戰,這部分非結構化的數據,同時也叫行為數據。當全世界的網民開始貢獻數據的時候,這數據真正開始爆炸了,現在社交網絡僅僅產生八年多,但非結構化數據已經占人類數據總量的75%。大家可以想像,所以說社交媒體產生之后,大數據時代就一錘定音了。

        解說:伴隨著大數據時代的到來,數據計算的內涵都發生了改變。人類將會迎來一個數據爆炸的時代,那么大數據到底是如何改變我們的生活方式?又怎樣能夠實現社會治理?世紀大講堂,《大數據生活方式與社會治理》正在播出。

        涂子沛:好我們講到這里,我們再來看看這個大數據的概念,我們現在應該有了一個更深刻的理解,我們說這里有三個等式,大數據等于傳統的小數據,加上現在的大信息,視頻信息、聲頻信息、圖象信息。那么第二等式是大數據等于非結構化的數據,加上結構化的數據,一個百分之二十五,一個百分之七十五。好,第三個也是最重要的,我們說大數據等于大容量加上大價值,容量是現象,價值才是本質。好,我們有了這種理解之后,我們就知道在這個時代,我們必須轉變我們的思維方式,怎么轉變呢?我們說原來我們對數據的期待和要求是用數據說話,因為數據代表最精確的事實,最銳利的事實,用數據說話的意思就是用事實說話,但是說在大數據時代這遠遠不夠。我們現在要做的是要在數據當中尋找新的啟迪,挖掘新的知識,總結新的規律,這是大數據時代的思維方式。

        好,我們對大數據有了更深刻的認識之后,我們隨后要問,大數據對我們的生活究竟有什么樣的影響?它把我們帶到哪里去?我的一個判斷是,我們的社會會興起一個全計算型的社會。首先我們要知道我們剛才講了數據的內涵發生了改變,因為數據的內涵發生了改變,計算的內涵也發生了改變。我們說計算已經不是我們傳統的加減乘除了,我們剛才說數據不僅僅是傳統的、有根據的數字,現在文字也是數據、視頻也是數據。舉個例子說,你想找到鳳凰衛視《世紀大講堂》的視頻,你可能上百度輸入關鍵字《世紀大講堂》進行搜索,你輸入的是文字,得出的是視頻。這個也是計算,也就是說搜索就是計算。

        我們整個社會、整個世界的計算呢可以分為三種,第一種是物理計算,第二種是有生命現象的計算,第三個呢就是社會計算。好,我們先說第一種物理計算,談到物理計算呢,我們就不得不提到另外一個概念物聯網,我們未來是所有的電器、機器都會裝上感應器。連上網絡,就會讓我們的數據呢會有一個更大的爆炸。我們剛剛談到,當我們的人開始貢獻數據的時候,數據爆炸了,當全世界的機器、電器開始貢獻數據的時候,將會迎來一個更大的數據爆炸。好我們未來的物聯網世界是什么樣子,我們來看看這幅圖,大家看到飛機,一架飛機上有很多重要的機器,我們說未來的物聯網、感應器要裝到這些重要的每一個部位的機器上,一架飛機上會有很多的感應器,每一個螺旋槳上都有感應器。然后同一個航空公司的飛機組成一個網絡,不同的航空公司,世界上全部的航空公司組成一個集群,全世界的飛機之間、機器之間可以互相通信。

        我們再看下面這幅圖,被稱為這是汽車商的一個工廠,位于紐約州的一個工廠,電池廠,被稱為工廠2。0,它的工廠里一萬六千平方米,但是裝了一萬個感應器。這些感應器在對工廠的各個條件進行監測。比如說溫度,比如說壓力,比如說濕度,比如說在生產的過程中,各種的配料,它的一個口號是什么,是讓產品產生記憶。就是一個產品送出去,出了工廠之后,如果它有問題了用戶反饋有問題了,我們立刻會查找它當時生長時候的條件,追溯它的數據,去確定它的問題。我們講了物理計算,我們也提到了生命計算,我們最后要提社會計算。社會計算是大數據時代最大的亮點,因為社會計算,我們的社會治理模式將會發生改變,大家會覺得很奇怪,為什么社會能夠計算?我們說社會計算也有很長的、很久遠的淵源,我們先從近的說起,我們社交媒體產生之后,我們很多社會科學的研究者發現,通過社交媒體上的數據,我們能夠做出很多推斷,你能發現一個人的喜好、偏好、觀點、意見,那傳統的方式我們要發現一個人的意見的時候,要去做問卷調查。例如說美國的總統選舉,原來的傳統的預測方式誰能當選?我得一個一個去問,選取有代表性的選民進行詢問,完成這個調查,但我們能看到,我們上一屆選舉這種局面已經完全改變了。奧巴馬的當選,投票完了之后就有社會科學的研究者分析了微博上的數據、社交網絡上的數據,就宣布奧巴馬即將當選,最后奧巴馬果然勝出。

        他們認為基于這種社交媒體的計算,他們稱之為社會計算,另外有科學家相信,我們現在數據越來越多,各種數據現象都被記錄了。所以呢未來一切社會現象、社會過程、社會問題都可以計算。還有科學家打出比喻說,我們現在的數據就像一個新的顯微鏡,我們14世紀的時候發現顯微鏡,這個顯微鏡我們把它對準了物理世界,這個顯微鏡的產生使人類的知識開始爆炸。現在我們大數據這個顯微鏡對準的是人的行為、社會現象,這將引起社會科學知識關于人本身的知識的一個大的爆炸。我們說從數據當中去發現規律,用數據來解決社會問題,這種想法其實有更久的淵源。1830年我們的法國哲學家孔德他就提出社會物理學的概念,他們當時也從數據當中得到一些重要的發現,他們在研究自殺率,他們發現倫敦的自殺率無論是在一個經濟簫條的時候還是經濟繁榮的時候,自殺率幾乎是恒定的。就像有一塊鐵磁石一樣,吸引著去自殺。所以他們就提出社會物理學,他們認為社會就像天體一樣,存在規律,怎么去發現這種規律呢,就要用數據去發現。但是受限于當時的條件,數據有限,到了我們這個時代,大數據的時代,所以有更多的學者相信,社會計算一定會興起,用計算、用數據來解決社會問題,是未來的發展方向。

        我們再舉一個例子,今年4月份的時候,美國有一個很小的報紙邁阿密有一個《太陽哨兵報》,獲得了普利策新聞獎,它的發行量只有二十萬份,那為什么呢?這個又跟大數據有關。當地發生了一起惡性的交通事故,警察開快車把人撞死了。好,《太陽哨兵報》有一個記者,他就懷疑警察這個群體長期開快車,屢屢發生這些事故,他提出這個懷疑和觀點之后,他必須進行證實。你要證實警察開快車,這非常難以取證,唯一的辦法跟蹤警察,但是這個難度很大。好,他最終想出了一個辦法,他利用美國的信息公開法,向交通部門申請公開了獲得了警車當地所有的警車過交通收費站的記錄。那它選取兩個交通收費站計算之間的距離,然后還有時間的記錄,距離除以時間就是他們的車速。他獲得了一百萬條記錄,他進行計算之后,就發現在八個月的時間當中,有五千一百輛警車的平均速度超過一百五十公里每小時。可想而知,他這個發現宣布之后,引起了當地警務部門的大地震。有人被開除了,有人要寫檢討,有人被剝奪了開警車的權利,甚至引起了全美的大討論,解決了一個巨大的問題,這是公民利用數據對公權力進行制約。

        我們可以想像如果沒有數據,如果沒有大數據,這種問題基本上得不到解決,好,我們今天講了這么多,我們最后總結一下,有三個要點。第一,我們說大數據不是一個孤立的現象大數據是諸多的信息技術浪潮,信息技術革新,在一起交互作用產生的。我們說我們人類的數據,還要上升。第二大數據對我們的影響是,我們將邁進一個智能型的社會,在這個智能型社會當中,我們人,我們的生活會越來越依賴數據、依賴計算機、依賴網絡,進入一個人機共生的狀態。最后我們會進入一個全計算型的社會,最大的亮點是社會計算,整個社會計算的興起,將改變我們社會治理的模式,好了,我的演講就到這里,謝謝大家。

        解說:大數據時代將給企業帶來無限商機,但又如何與個人息息相關?美國棱鏡門事件敲響警鐘,大數據時代該如何保護個人隱私?大數據的革命又何時能夠在中國成功落地?

        田桐:感謝您剛才的精采演講,我們現場的觀眾朋友們呢,有一些問題想和您進行交流的。

       涂子沛:好的。

        田桐:來,有問題的。來,中間這位男士吧。

        觀眾:涂老師好,主持人好,其實很容易理解大數據時代對于企業的價值,那對于我們個人來說,會帶來哪些有幫助的事情呢?我們應該如何去建立自己的這個數據庫呢?謝謝。

        涂子沛:對個人來說,那當然有很多相關的地方,我想說的第一個相關的地方,就是說數據是知識的載體,你要從數據當中發現新的知識,你要重視數據。我們說你去做研究也好,恐怕做現場調查還不如系統的收集數據,獲得數據,系統的數據也許比親身去調查也許還有作用,這是第一。第二呢,數據是隱私的載體,你的個人數據是你的個人隱私,我們說還有這個時代,數據還是個人權利的載體,PM2。5是多少,你是有權利知道的對吧,你的自來水里面各種微生物的含量是多少,各種類金屬的元素的含量是多少,這些都是數據。它是成為一個權利的載體,個人跟個人的生活是息息相關的。

        觀眾:涂老師好,主持人好,就是我們毋庸置疑,大數據時代對我們社會生活,商業或者學術方面都有很多的便利,但是美國棱鏡門事件也將我們帶入了對大數據時代的一種恐慌。就是我們在這個數據時代,怎樣保障您剛才提到的隱私呢?謝謝。

        涂子沛:隱私和商業的利益是我們需要一個平衡,在新的大數據時代,但這種平衡在每個社會呢都在形成當中,美國社會也做得不是很好。我們中國社會在這一方面會更糟糕一點,商家為了利益不斷侵犯,用數據來侵犯大眾的隱私,這就需要整個社會形成一個新的意識,不斷地公眾不斷的去跟商家博弈,整個社會形成新的法律,那商家不能夠隨便挖掘這個用戶的數據,挖不挖應該是由這個用戶來說了算,他要對這個數據有主導權,這需要有新的法律,來對這個進行規范,需要立法。

        觀眾:涂老師您好,我是做輿情分析的,我想問一個跟自己工作有關的一個問題,就是因為我們經常要在一個突發事件之后,來預測這個民意的傾向,預測民意的走勢,我就想問一下就是我們收集多少數據,您覺得才足以對一個民意做一個相對準確的預測。然后我們大概要分析到什么層次,才能做這樣一個預測?還有一個問題就是我看您在書上寫這個數據,就是政府對數據的公開是非常重要的,前一段時間,就是國家統計局建立了一個網上的一個數據中心,可以就是免費地去下載一些關于國計民生的,還有經濟方面的這種重要的數據。我想問一下您對它這個做法您是怎么看的?然后它現在公布的數據您覺得是否就是您覺得它質量如何、數量如何,我們可以怎樣利用這些數據?謝謝。

        涂子沛:我想我的建議是需要多元的數據,多個源頭的數據,來印證一些民意,而不是單元的。比如說分層次的多元的,不僅僅,比如說你做得最多恐怕是微博的數據對吧,那我們說微博的數據還不夠對吧,如果僅僅用微博,大部分用戶是年輕的用戶對吧,你還得用其他的數據比如說問卷調查、街頭訪談,多元的數據來互相印證一個觀點,這是第一個。第二個國家統計局在做的這個事情,無疑是符合世界潮流的一個事情,把數據公開開了,開放出來,讓大家來使用,我覺得國家統計局還可以做更多的事情,而不僅僅是公開,把原始數據公開出來,舉行一些競賽在高效,調動大家來使用這些數據。

        觀眾:涂老師好,主持人好,我是一名互聯網行業的從業者,那么作為互聯網行業的話呢,肯定是對信息革命的這個接受程度、開放程度最高的,那么我們也希望您能給大家預測一下,大數據,或者本身這個大數據的革命,在國內能夠落地或者能夠很好的一個爆發之后,這個需要多長一個時間?也給我們從業者一個鼓勵吧,這是第一個問題。第二個問題的話是一個個人行為,就是我們現在可能由于這個數據挖掘等一些水平還不是特別的發達,我們比方在一些電子商務網站網購之后,那可能我本身是一次性購買的行為,但商家不斷地給我推送一些他所謂的猜你喜歡的,還是說類似的商品你可能會購買,但是對我已經產生一個困擾,我怎么樣能夠對我進行一個很好的保護,希望得到您的回答,謝謝。

        涂子沛:大數據5年之內會在中國遍地開花

        涂子沛:好,我們先從回答第二個問題起,剛剛說的,就是說在這個時代呢,其實你在獲得一些便利,你把自己的數據推出去之后,你的行為被它記錄了,它根據你記錄的數據來猜你喜歡什么,不斷向你推送什么,有些東西確實是你喜歡的。你是得到了便利,但是呢一定程度上又對你形成了騷擾,所以我們說最終這個權利應該把它給到用戶當中去。就用戶我來決定我開不開放這些數據,你能不能使用這些數據對我進行挖掘,如果我有選擇權,我愿意享受這種便利,那你就能挖掘我的數據,我接受你的推送。那這有很多種方式對吧,可以在事前控制也可以在事后控制,事前給你一個選項,事后還可以給你一個選項,你愿不愿意繼續接到我們對你的推送,如果取消你不再接到對吧,所以還是基于商家有一種自覺,對這個用戶的一種尊重。但是商家的這種自覺跟尊重,我們說不會從天而降對吧,是要大家去說不,當整個社會都說不的時候,當立法者意識到這個問題的時候,新的法律出來的時候,這個問題才能得到最根本的解決。好,那你前面那個問題,我想大數據的落地,其實在中國已經有很多項目在落地了。我相信在五年之內吧,我們能看到越來越多的項目,在遍地開花。

        觀眾:涂老師您好,就是我們曾經探討過一個有趣的問題,就是我們死了以后,我們QQ怎么辦?就是說呢,在這個大數據時代,它的數據的量是非常規模龐大的,那么會不會相應的產生一些數據垃圾?那么這個會對我們實際生活有沒有影響?那么這個數據垃圾我們又該怎么面對?怎么辦?謝謝。

        涂子沛:好,這個問題兩個問題,其實第一個問題數據遺產的問題,這都是新的倫理的問題,第二個是數據垃圾的問題。那對數據遺產呢,現在有很多種處理方式,西方國家也在立法,誰能繼承你的這個遺產。為什么我們說這個時代是一個革命?因為有很多新的問題在出現,相信這個問題在中國,我們整個社會是遲早要面臨的。我們說我們現在的網上聊天用戶大多是年輕的一代,但是二十年之后呢,我們是不是應該有這種前瞻性,現在就對這些問題進行思考呢?這顯然還沒有提上我們國家立法者的議程。

        田桐:那么就您看來怎么解決這個問題?

        涂子沛:立法,誰能繼承?肯定是有第一繼承人,有第二繼承人,有遺囑對吧,整個社會要形成一個觀念,你的數據是你遺產的一部分,現在已經出現了這些事情了,就是美國就出現這種事情了,有人自殺了對吧,他自殺之后,警方為了了解他自殺的原因對吧,就想去登錄他的各個帳號,那警方有沒有權利這樣做呢?那社交網絡給不給他這樣干呢?他身邊的親人也都想了解,那他的隱私權在哪里?整個社會我們能看到很多問題。就個人方面,你首先把數據當做你的遺產,然后國家層面、社會層面要制定合適的法律來規范這個問題。

        田桐:那么像剛才她說的第二個問題,這些龐大的數據的垃圾,我們應該怎么去處理?

        涂子沛:這對商業公司是一個挑戰,比如說網絡聊天工具,我們毫無疑問,它在積累大量的數據垃圾,它可能在公司內部會有一個政策,是多少年對什么樣的數據要做出什么樣的清理。我們還能看到數據的累積當中它是有一些規律的。我們說有價值的數據,它上升的趨勢是比垃圾上升的趨勢是要緩慢的,就垃圾數據的這個上升趨勢更快。有價值的數據呢上升得更慢,那對這個比如說網絡聊天工具,它就要做一些考慮對吧?一種是刪除,最簡單的方式,還有一種是轉移,它轉移到更低成本的這個存儲器上去。

        田桐:感謝您剛才的精彩解答。2013年5月,阿里巴巴董事局主席馬云在其卸任演講的時候說,在我們還沒有了解PC的時候,移動互聯網來了,在我們還沒有了解移動互聯網的時候,大數據來了,大數據帶給我們的絕不僅僅是一個商業模式或者技術,而是我們開啟全新世界的方法論。

【聲明】物流產品網轉載本文目的在于傳遞信息,并不代表贊同其觀點或對真實性負責,物流產品網倡導尊重與保護知識產權。如發現文章存在版權問題,煩請聯系小編電話:010-82387008,我們將及時進行處理。

相關文章

數據標注工:訓練AI,被AI替代

增長和淘汰同時進行。

07月19日 13:58甲子光年

大數據、5G 和手術機器人正在改變醫療保健

技術進步帶來的每個部門工作效率的巨大提高也使醫療保健部門受益。人工智能、機器學習、大數據服務和機器人幫助手術的引入已被證明提高了衛生部門人員的工作能力。大數據分析解決方案有助于減少維護記錄和向患者及其熟人傳遞信息等瑣碎任務的工...

07月09日 15:43千家網

物聯網和大數據將會如何影響著醫療行業

  無處不在的高速網絡連接,以及內置智能傳感器的設備體積越來越小且越來越便宜雙重因素的推動下,極大地推動了IoT健康服務的普及應用。除了諸如Fitbits之類的“健康”設備可幫助提供有關我們健康的大量數據指標外,近年來,經過批...

03月18日 11:41千家網

物聯網數據:如何使其價值最大化

  隨著物聯網部署的快速增長,各組織正在捕獲比以往更多的數據。但是,圍繞數據的使用仍然存在許多問題需要厘清。數據的價值是什么?如何使它們可用,并有效地使所有利益相關方受益?如果可能的話,如何將其貨幣化?這是一個高度熱門的領域。...

09月28日 15:43電子發燒友

報告顯示:數據中心交換機供不應求

Dell'OroGroup最近的一份報告顯示,2021年第二季度全球數據中心交換機市場收入同比增長7%,連續第二個季度實現收入增長。該分析公司最新的以太網交換機——數據中心季度報告提供了市場的詳細視圖,包括用于服務器訪...

09月22日 16:03千家綜合布線網