大数据像中医,有疗效,别神化--华夏物联网

亚洲男人的天堂在线播放,久久99精品久久久久久清纯,日本乱人伦片中文三区,亚洲精品中文字幕乱码三区,777亚洲熟妇自拍无码区

大數據像中醫,有療效,別神化

專家觀點
復旦大學
2013-07-09
[ 導讀 ] “大數據”這個新詞,近兩年曝光率頗高。字面意思好像誰都看得懂,卻又似懂非懂。
       “大數據”這個新詞,近兩年曝光率頗高。字面意思好像誰都看得懂,卻又似懂非懂。
       谷歌預測流感趨勢,微軟預言奧斯卡獎,多次成功后,大數據被傳得神乎其神。到底怎么解釋?在社會生活中有哪些應用?我國核心技術研發現狀如何?大數據和保護隱私間怎樣平衡?記者專訪國家特聘專家王曉陽教授。
       王曉陽1992年在美國南加州大學獲得計算機科學博士學位后,留美從事20多年科研工作,曾任美國國家自然科學基金項目主管及佛蒙特大學計算機系Dorothean講席教授,一直在和“數據”打交道,兩年前受聘成為復旦大學計算機科學技術學院院長。
       “大數據的魅力是全面,而非精準”
       記者:能否通俗解釋大數據的概念?
       王曉陽:何為大數據,學界沒有統一定論。按照我的理解,我想了一個比喻。
       以前采集數據像西醫看病,驗血、測心率、查病毒,具體而直接。而大數據的采集方式不同,有點像中醫問診,望聞問切,看面色、舌苔、脈象,全方位觀察病人。大數據涉及更龐雜的數據,不見得精準、專業,但是有用。它的魅力是全面,而非精準。
       傳統的民意調查像西醫,先設計問卷,確定樣本,再抽樣獲得信息。大數據的做法有點像中醫法則,以微博數據為例,成千上萬博主都在表達某些感覺或想法,用微博數據來調查民意就如同整體搭搭脈,雖有些模糊,但能很好把握社會熱點和輿論傾向等。
       精準數據其實是我們向往的,但它有個成本問題,不太可能全面覆蓋。大數據的特征包括數量大、信息雜、傳輸快。在許多情況下,“大”和“雜”提供好的覆蓋性,“快”則使大數據更具適時性。
       大數據固然重要,但過于依賴大數據,肯定也不行,對事物的詳細了解還是需要精準數據。中醫看整體而粗獷,西醫管局部而細致,“中西醫結合”更有效。
       記者:在社會生活應用中,大數據能發揮什么作用?
       王曉陽:許多應用都涉及一個關鍵詞:二次利用。數據采集之初,原為某些特定需求,但二次利用后,又產生新的奇妙結果。
   &nb[FS:PAGE]sp;   搜索引擎起初只是給用戶提供便利,查詢知識。經過巧妙再利用,便能預測流感趨勢,比政府部門的數據更快。
       城市里有很多攝像頭,初衷是為防盜和監控路況。大量視頻數據經過分析,能全面掌握城市脈搏,幫管理者做決策。
       微博一開始只為表達自我,和輿情無關。但后來發現,還能了解輿情。
       交通數據也會透露其他信息——演唱會舉辦期間,可以從場地附近的交通擁堵程度,判斷明星受歡迎程度;微軟中國研究院曾為北京上千輛出租車裝GPS設備,記錄數月行動軌跡。分析這些交通數據,結合人們的交通出行習慣,能發現各城市區域的屬性,是商業區、住宅區還是娛樂區。
       “收斂浮躁,核心技術是長遠之道”
       記者:海量數據與信息爆炸早就存在,大數據的概念為何近兩年才出現?
       王曉陽:海量數據和信息爆炸都與因特網相伴而生。起初我們的網速很快,但沒多少數據在上面跑。
       現在大不一樣,尤其是近十年,制造數據的人和設備大增。電腦的功能越來越強大,價格也日益親民。智能手機、平板電腦等移動終端很容易獲取。
       傳感器、攝像頭、計算機、POS機、天上的衛星、地下的感應線圈,都在采集數據,導致數據量大爆炸,遠超出原來的規模。
       軟件開源運動(開放源代碼)興起后,軟件也越來越便宜,容易得到。
       技術進步還催生了“云計算”,就是把很多便宜的電腦串在一起,大大提高計算能力;和網絡結合后,無需擁有這些機器,也能采集、處理數據。
       社會上各種脈搏跳動近幾年越來越多——發微博,手機簽到,網上搜索,哪怕是網購一件小商品,也能反映某種需求或流行……這些都是催生大數據的因素。
       記者:我國大數據應用領域很熱鬧,技術研發的現狀如何?
       王曉陽:大數據最炫的地方在應用,核心技術往往被忽視。
       采集、存儲和分析等核心技術,主要掌握在美國人手里。國內投資很少,大家都看重結果,所以應用領域很熱鬧[FS:PAGE],還在國際上發表了不少應用方面的學術論文。
       大數據剛起步,我們完全有機會和美國站上同一起跑線,現在卻只能跟在人家后面跑。等別人研發出新一代技術,我們馬上一窩蜂地拿來用。
       浮躁是原因之一,整個科技創新環境都比較浮躁。從國家層面講,應當重視扶植大數據的核心技術研發。
       我們要收斂浮躁,保持冷靜,認識到核心技術才是長遠之道。不要神化大數據,以為掌握了許多數據,再買來機器,就萬事大吉。這是很不負責任的想法。
       “數據龐雜冰冷,需人的智慧激活”
       記者:谷歌預測流感;微軟預言奧斯卡,都靠大數據,怎么做到的?
       王曉陽:谷歌5年前推出“流感趨勢”服務,通過分析關鍵詞,準確預測美國各地流感爆發情況。
       這是大數據應用的典型案例。谷歌綜合分析大量實時數據和歷史數據,了解不同歷史階段流感爆發情況,以及對應時期的關鍵詞、頻率,判斷哪些因素的相關性大,反復試錯、調整,直到建立可靠模型。
       微軟猜準多項奧斯卡獎,也是相同套路——分析大量歷史數據,找準多個相關因素,不斷調試,建模型。說來簡單,實際操作很復雜。
       記者:最近中國股市行情慘淡,能借大數據之力預測漲跌嗎?
       王曉陽:按我的理解,股市可預測,但有效期很短,超出幾秒甚至幾毫秒,就不準了。天氣預報也類似,報7天后的,基本沒譜;報明天的,命中率相當好;如果報幾分鐘后的,更準。
       華爾街有些公司,專在毫秒間買進賣出。時間短,對機器運行速度要求很高。公司就設在交易所旁邊,以保證數據線盡可能短。
       但對絕大多數股民來說,股市不能預測,因為等你買到手時,早過預測有效期了。
       記者:大數據時代,機器的性能越來越強,人的作用還剩多少?
       王曉陽:業內有觀點認為人不重要,交給機器處理就行。我不贊同。數據龐雜而冰冷,需要人的智慧去激活。
       美國人NateSilver擅長預測,有[FS:PAGE]“大數據時代的巫師”之稱。去年美國總統大選,他預言奧巴馬有90.9%的機會獲勝,對全美50個州投票結果的預測全對。2008年總統大選,他也猜對了。
       Silver不是靠蒙,而是收集眾多民調數據,綜合分析多方面因素。為什么準?因為他有獨特洞察力,在紛繁復雜的數據里,能找準關鍵變量,建立靠譜模型。這是機器不能代替的。
       大數據對人提出了更高要求。以前做抽樣調查,預設問卷,再有針對性地分析結果,套路清楚、易學。現在數據鋪天蓋地,選哪些來支持預測和判斷,如何建模型,都比原來難。
       我想強調“概率”。Silver預測再準,也從不講絕對,而是用百分比說話。有不確定性,所以更需要依靠人的判斷。假如今天降水概率70%,你出門帶不帶傘?
       “要徹底保護隱私,數據就沒用了”
       記者:社交媒體在大數據時代扮演什么角色?是否不可替代?
       王曉陽:微信、微博、論壇等社交媒體,是給社會搭脈的重要途徑。因為在這些地方,人們能充分表達情感。“我在哪,買了一杯咖啡,好不好喝,天氣如何,心情怎樣……”與態度、情緒有關的數據,只有這里能采集到。
       媒體在街頭做民意調查,問路人“你幸福嗎”,獲得的數據可能不準,倒不如去微博里尋找人們自發表達的內容。
       記者:大數據正被越來越多商家利用,對消費者是好是壞?
       王曉陽:如果大數據被商家正確使用,消費者確有需求,當然覺得方便;反之就成了騷擾。一些購物網站常根據消費行為推薦商品。比如有人買了一本孕期保健書,網站幾個月后便頻頻推薦尿布和奶粉。其實她是替朋友買的,與個人需求無關。
       這不是大數據本身的問題,而是對數據的分析出了錯,脈搏沒搭清楚,就會帶來負面影響。這也反映了人的智慧在分析數據時所起的重要作用。
       記者:大數據時代對個人隱私的侵犯似乎防不勝防,如何規避數據開放帶來的風險?
       王曉陽:保護隱私確實是大數據面臨的難題。有人曾想證明一個命題:能否既保護隱私,又保證數據有用?結果發現做不到,要徹底保護[FS:PAGE]隱私,數據大多就沒用了,兩者之間沒有平衡點。如果完全關閉手機位置信息,確實保住了隱私,但導航等軟件就不能用了。
       保護隱私不是不能做,而是要在采集數據的環節及采集到數據后同時做。采集數據時應透明,要讓用戶知道什么數據在被采集,并征得用戶同意。其實最嚴重的問題出在采集數據之后,誰可以用這些數據?如何用?現狀是,采集者掌握眾多隱私數據后,隨意販賣,給許多人帶來困擾,甚至對大數據產生恐慌。
       我國這方面法律不健全,必須加快立法。采集到隱私數據后,誰能用,能怎么用,如何告知消費者,違規了怎么處罰……都需法律規范。
標簽:
【聲明】物流產品網轉載本文目的在于傳遞信息,并不代表贊同其觀點或對真實性負責,物流產品網倡導尊重與保護知識產權。如發現文章存在版權問題,煩請聯系小編電話:010-82387008,我們將及時進行處理。

相關文章

大數據等構成的人體信息物聯網將改變未來醫療模式

一條項鏈可以實時監測人體心肺功能、一個戒指可以監測呼吸脈搏等指標、一副眼鏡可以監測精神疾病患者狀況……記者20日從成都舉行的2021第二屆四川康復治療及產業論壇上獲悉,由大數據、云計算、有限傳輸與無線傳輸相結合構成的人體信息物...

03月24日 14:41科技日報

依托大數據物聯網 開展防汛工作

  記者從白云區綜合行政執法局獲悉,為確保轄區安全度汛,該局充分利用大數據、物聯網技術,開展職責范圍內防汛搶險的應急綜合調度、指揮、協調工作,以有效應對汛期突發事件、緊急或特殊情況。該局以白云區“數字城管”系統平臺為基礎,依托...

06月09日 10:04貴陽日報

治理PM2.5推行智能型環保 云計算大數據首當其沖

兩會期間,全國人大代表、廣東省家電商會會長、TCL集團董事長李東生接受采訪時一句:“北京昨天的霧霾還很重,今天天氣很好,北京的天氣比較講政治。”的玩笑逗樂了在場所有記者。

03月10日 20:36賽迪網

大數據和分析解決方案如何在數字時代徹底改變業務?

如今的技術在不斷地發展。無論是自動駕駛汽車、機器人還是重型自動機械,技術只會隨著時間的推移而變得更好。然而,很多技術在很大程度上依賴于數據、各種規模和類型企業的信息,以及解釋這些數據和信息的高級分析技術。由于大數據在推動組織數...

03月05日 10:54企業網D1Net

互聯網趨勢下,物流倉儲如何“玩”好大數據

  前段時間電商物流界兩位大佬的“數據之爭”在網上鬧得沸沸揚揚,其他因素先不說,單說引起此次紛爭的“大數據”,已經是互聯網時代一個不得不思考的問題。早已有人斷言:得數據者得天下。巨沃成立至今一直專注于倉儲物流供應鏈的管理與訴求...

05月08日 14:03 巨沃科技