大數據思維含總體樣本取代隨機樣等三個方面
數據新聞如今已經風靡世界,成了新聞業界創新的法寶。數據新聞利用數據挖掘可以延伸新聞中單一事件、現時信息的意義,拓展新聞的時空范圍,深化對新聞事實的認知,發現常規新聞中不能體現的邏輯,從而豐富了單篇新聞報道的內涵,新聞樣態也從封閉式告知話語轉換為開放式工具,用戶可以使用這些工具獲取多元的信息。
但是,數據新聞到底是什么?它與數字新聞、大數據運用有何關聯?“大數據新聞”為何不是一類新聞?程序員、統計師能取代記者嗎?在對數據新聞的認知中,還有相當多的認知誤區;數據新聞也有被濫用之嫌,其實它不是萬能的;數據新聞也有其困境,它的內容和形態有著局限性。因此,本文將結合案例廓清相關概念,并分析大數據思維在新聞中的應用及其局限性。
數字圖表不等于數據新聞
近兩年大數據成為時髦,不少媒體就以簡單的數字統計,來充當“數據新聞”。但是,只列有數字,那還不是數據新聞。關于數字、數據、大數據,數字化與數據化,數字新聞與數據新聞等概念,目前還存在一些混淆的情況。
“數據”不等于數字,也不一定是數字,它是對事件的一種描述,數據可以記錄、分析和重組事件。“大數據”不只表示數據量大一些,它是指無法在一定時間內用常規軟件工具對其內容進行抓取、管理和處理的數據集合。它的特點是:數據量大,數據類型多樣,處理速度快,價值密度低。
“數據化”簡單地說,是把現象轉變為可制表分析的量化形式。“數字化”是指把模擬數據轉換成0和1表示的二進制碼,從而使電腦可以處理那些數據。①“數字新聞”是指對文本、圖片、視頻等進行數字化,從而通過互聯網技術能傳輸的新聞報道。“數據新聞”是指用數據驅動的新聞,是內容量化了的報道,是用數據作為表述形式的新聞。數據新聞很少是以大數據驅動的。“大數據新聞”其實并不能成為一類新聞,而是以大數據的思維和工具做成的新聞,是將大數據思維內化到生產實踐及樣態創新之中。是基于互聯網及其衍伸技術平臺實現的以大量數據搜集與分析為主要工具而生產出來的新聞,主要是數據新聞,通常是以圖表等形式,通過對一系列的簡要事實的相關性的表達,揭示出事實背后的意義。因此,目前一些媒體以數字、圖表羅列的新聞,并不是數據新聞。
為什么專業新聞工作者是必要的
隨著自媒體的出現,專業記者將不再需要的議論甚囂塵上。如今數據新聞又催生了一些新的報道者,比如“程序員記者”,即計算機程序員因為其技術的使用,成為了報道者,比如美國芝加哥論壇報之“犯罪新聞”(Crime in Chicagoland)網頁的程序員;“統計師記者”,即懂得統計的工作人員當上了信息報道者,比如博客“FiveThirtyEight” 博主內特·斯弗(Nate Silver)。②那么專業記者還有存在的必要嗎?當然還是需要的,只是對專業新聞工作者的要求變得更高,他們不僅要理解統計、設計,而且要有新聞專業的敏銳性。
數據本身并不具備多大的新聞價值,有時數據帶有欺騙性,需要記者從紛繁復雜的數據、報道中尋找靈感,去發現其中的意義,發掘新聞的深層或新鮮的價值。舉例來說,股票行情天天向所有人公開,密密麻麻的名稱中,某一只股票的價格,在什么情況下會有比較大的新聞價值呢?彭博新聞社就從中找到了獨特的新聞價值。彭博的記者通過對過去10年在上海證券交易所交易的股票進行分析,發現貴州茅臺酒業股票自2002年11月至2012年10月,10年間上漲達3451%,如今高達410億美元,成為世界第二大造酒公司。這算是一個很好的發現,具備了新聞價值的“新鮮性”。其中還有什么意義呢?這些數字是中國經濟發展速度的證據之一,它也表明中國的經濟發展帶來的社會變遷:中國經濟10年來的發展,已經造就了一個富裕階層,他們對奢侈品類的需求,刺激了相關消費,因此出現了茅臺酒及其股票的大幅增長。因此新聞又有了“重要性”價值。重要性還可以再擴大嗎?是的,時值中國十八大期間,通過數據挖掘報道的中國經濟發展及其影響,“重要性”價值就更大了。其實我們也可以把上述新聞看作是一個獨到的對中國十八大的解讀,因為要報道十八大,所以才有了記者的各種想象和挖掘。一位單純的程序員、統計師,是很難發掘出這樣的新聞價值的。
與傳統的新聞形態相比,數據新聞為單一事實或信息提供更多的表述可能、更深的邏輯關系、更大的想象空間。用數據新聞的引領者彭博新聞社的負責人的話來說,是一種“簡單而優雅的呈現觀點以及點燃想象力的”的方式。③如何才能點燃用戶的想象力?需要專業工作者具備更全面的知識和能力。
運用大數據思維的新聞更科學更有效嗎
傳統的新聞是從哪兒來的?也就是新聞判斷是如何形成的?是依靠新聞記者的新聞直覺、新聞敏感——有一種叫news sense(新聞敏感)的意識,它是有賴記者的知識、水平、經驗、視野而形成的一種意識,雖然是來自客觀世界,但是也不排除“先驗性”。在西方的新聞教材里,就有新聞鼻(news nose)、新聞眼(news eyes)之說,有些記者的五官更靈敏,從一些小細節能“嗅”到多少英里之外的新聞。
大數據思維主要包括三個方面,即:總體樣本取代隨機樣本;對不精確的容忍度增加;相關關系取代因果關系。④那么大數據思維下的新聞判斷,是如何形成的呢?這里僅以其第一方面——樣本的總體性思維來說。
傳統的新聞是在記者的新聞敏感的基礎上判斷、采集發布的。記者認為這件事、那件事很有新聞價值,對社會的多數人會有吸引力和影響力。一般記者只會以個別人物或事件作為采訪對象,并通常認為這些事對多數人有意義。這是用的“隨機樣本”的方式,進行的新聞工作,其中包含了偶遇式新聞采訪(如“街采”)、先驗式的新聞敏感。而大數據思維則有能力獲取“總體樣本”,通過分析所有用戶的需求和興趣,從而得出新聞價值的判斷。
比如2014年春節前后,中央電視臺《新聞聯播》編輯部的“‘據’說春運”、“‘據’說春節”欄目,即是以百度的搜索大數據為基礎做的系列報道,它呈現的不只是炫目的可視化數據信息,不只是新聞形態的一種改變,而且還從大數據中找到做新聞的點,展開關于春運、春節的故事。內容的選擇不再只是從傳者視角單方面揣測新聞敏感,而且融入了用戶的需求,基本上是點餐式的服務。設想一下,這樣的新聞不僅與信息接受者之間形成了內在的互動關系,而且帶活了內容,真正是貼近了受眾,而且也對一些傳統媒體的年長化、老齡化的受眾形勢,有積極的干預效果,能夠吸引更廣大各年齡層面的受眾。
大數據思維帶來了新聞內容的創新,是一種融合媒體的形態驅動的新聞報道的創新。融合媒體的概念,在上世紀80年代是關于技術形態方面的,90年代進入了產業化層面,如今進入用戶層面的遷移或者遷徙,是更新的融合。用戶層面的遷徙,最終會引發內容的融合。通過大數據找到了特別貼近用戶的報道話題,這些話題實際上是網民們感興趣的。網民集中于45歲以下、甚至更多為18歲到35歲之間的人群,他們不是傳統意義上的報紙讀者、電視觀眾。他們帶動傳統媒體的話題年輕化了,實際上是網民參與了新聞報道,必然逼迫內容要進行改革,所以大數據思維帶來了從形態到內容上的新聞創新。
大數據在新聞中的應用及其困境
大數據時代,數據新聞不只給新聞工作者提出了更高要求,也給政府、社會、媒體機構帶來了挑戰。一些媒體已經在不斷開發新的工具,來滿足數據新聞的需求,比如英國衛報、美國紐約時報不僅在擴展自己的數據庫,而且在技術上也提供了許多可能性,尤其是開源的方式,給用戶提供了工具、也讓用戶帶來了豐富的數據。華爾街日報開發的“中國經濟追蹤器”,就是一個中英雙語的數據新聞工具,它為中國的讀者和記者提供了便利,特別“為那些與中國經濟數據斗爭多年焦頭爛額的外媒記者指了一條明路。”⑤路透社香港分社曾推出“關系中國”(Connected China)平臺,他們從中國政府官方網站和出版物、中國及世界媒體報道、外國政府分析報告、學術論文等多渠道匯聚到上萬個權利實體(機構和個人)、3萬余條關系、150萬文檔(相當于20本非虛構類圖書)的數據量,將海量數據劃分為“職業比較——行政級別升降”等幾大主題,開發基于HTML五代技術制成的數據、圖片、文檔和視頻無縫鏈接的平臺。
傳媒機構可以從以下渠道獲取數據:與政府、企業、科研機構等部門實行數據共享,并通過新聞監督職能不斷推進“數據公開”運動;網絡數據(特別是社交媒體數據)的篩選與使用,這類社交媒體信息過濾工具能夠幫助記者在突發性災難中通過現場勘探施救人員和志愿者的社交賬號,篩選并核實新聞事實;傳感器數據的捕捉及挖掘。傳感器裝置逐漸普及到人們日常生活中,形成的數據網絡,美國NPR記者就開始由此探索記者自己編織數據庫的潛能;將媒體既有的資料數據化;學術數據再利用;自行展開調查搜集數據。
值得一提的是,大數據的應用不是萬能的。首先大數據是掌握在少數權威機構、信息服務商的手里,對于大多數媒體機構來說,是很難獲得的;第二是新聞記者個體,不僅難以獲得數據,而且如果沒有集團式的操作團隊,也難以充分分析、呈現大數據;第三是大數據思維本身的特質,在某些方面與新聞的特質是相悖的。大數據本身就是不精確的,這與新聞的精確性要求相悖;大數據是整體樣本的,這又與新聞的追求個性化、獨到相悖。當然,媒體機構與新聞工作者也可以化不利為有利,比如從不精確的總體樣本中發現趨勢和規律,從中找到自己的個性化的新聞點,并且通過精確的信息衍生出自己的故事。
相關文章
大數據等構成的人體信息物聯網將改變未來醫療模式
一條項鏈可以實時監測人體心肺功能、一個戒指可以監測呼吸脈搏等指標、一副眼鏡可以監測精神疾病患者狀況……記者20日從成都舉行的2021第二屆四川康復治療及產業論壇上獲悉,由大數據、云計算、有限傳輸與無線傳輸相結合構成的人體信息物...
依托大數據物聯網 開展防汛工作
記者從白云區綜合行政執法局獲悉,為確保轄區安全度汛,該局充分利用大數據、物聯網技術,開展職責范圍內防汛搶險的應急綜合調度、指揮、協調工作,以有效應對汛期突發事件、緊急或特殊情況。該局以白云區“數字城管”系統平臺為基礎,依托...
治理PM2.5推行智能型環保 云計算大數據首當其沖
兩會期間,全國人大代表、廣東省家電商會會長、TCL集團董事長李東生接受采訪時一句:“北京昨天的霧霾還很重,今天天氣很好,北京的天氣比較講政治。”的玩笑逗樂了在場所有記者。
大數據和分析解決方案如何在數字時代徹底改變業務?
如今的技術在不斷地發展。無論是自動駕駛汽車、機器人還是重型自動機械,技術只會隨著時間的推移而變得更好。然而,很多技術在很大程度上依賴于數據、各種規模和類型企業的信息,以及解釋這些數據和信息的高級分析技術。由于大數據在推動組織數...
互聯網趨勢下,物流倉儲如何“玩”好大數據
前段時間電商物流界兩位大佬的“數據之爭”在網上鬧得沸沸揚揚,其他因素先不說,單說引起此次紛爭的“大數據”,已經是互聯網時代一個不得不思考的問題。早已有人斷言:得數據者得天下。巨沃成立至今一直專注于倉儲物流供應鏈的管理與訴求...