熊曉鴿:大數據是冬天里的寒梅
2012年被稱為大數據元年,大數據正在改變著中國的互聯網和移動互聯網行業,無論是基礎設施、數據管理平臺,還是一系列軟件應用——包括數據分析、商業智能、工作協作、移動化辦公以及各垂直行業的方方面面應用。隨著大數據的持續升溫,越來越多的人開始關注它、談論它,希望可以通過技術的革新,讓企業運行效率更高,成本降低,獲得更長遠的發展。

作為數據大國的中國,許多應用在數據產生速度上已經在世界范圍內名列前茅,中國的互聯網生態也漸趨于開放,在海量數據產生的時候,如何制定開放戰略,利用、管理所產生的數據,這是平臺增值和建立產業生態非常關鍵的問題。此外,移動互聯網和企業軟件在大數據時代,也將面臨全新的挑戰,大數據對傳統行業的變革作用也將帶來許多新的商機。小到公司治理,大到產業升級,甚至國家經濟戰略布局,大數據都扮演者越來越重要的角色。
2012年12月6日,IDG-Accel主辦的首屆“大數據論壇”在北京文津酒店召開,本次論壇由IDG資本創始合伙人熊曉鴿、微軟全球資本副總裁及亞太研發集團主席張亞勤、Accel Partners合伙人吉姆.布雷耶(Jim Breyer)擔任聯席主席。論壇就大數據領域最值得關心的幾個問題分別進行了專場探討,話題主要有:數據平臺開放策略和生態、企業如何擁抱大數據、大數據處理和管理技術、移動互聯網和數據驅動類應用。IDG資本合伙人李驍軍、毛丞宇、李豐和副總裁牛奎光分別主持了五個專場話題的討論。
會議集合了國內大數據生態系統最優秀的技術、商業和學術領袖,同時邀請了來自美國的大數據公司、學者和行業專家參與交流美國大數據領域的最前沿技術進展,騰訊集團高級執行副總裁湯道生、金山軟件CEO張宏江、新浪微博事業部副總經理蘆義、淘寶網首席商業智能官車品覺、Couchbase公司CEO Bob Wiederhold、Factual公司營銷及運營副總裁Eva Ho、與IDG資本投資的部分大數據公司3G門戶總裁張向東、91無線副總裁何云鵬、百分點科技首席科學家周濤、力美廣告CTO梁信平、豬八戒CTO曹陽等30多位大數據領域的專家發表了精彩觀點并進行交流,100多位業內人士參與了論壇。
IDG資本創始合伙人熊曉鴿在講到大數據的重要性時把大數據比喻為“夢想的起點”。他說:“移動終端、云服務以及大數據還有社交媒體,在[FS:PAGE]IDG集團所屬的市場研究公司IDC的未來預測中,定義為未來的第三平臺,第三平臺會在未來8年的時間創造21000億美元的價值,大數據是未來市場的一個非常重要的起點,沒有大數據,未來是沒法想象的,我們現在在談各種夢想,大數據便是夢想的起點。”
從投資的角度,熊曉鴿認為大數據可以為投資帶來更多的想象和驚喜。“大數據是冬天里的寒梅。”熊曉鴿說,“在投資的冬天里,作為風投公司如果對未來有潛力的技術加以關注,有可能開出了不起的花來,在上一代的平臺里,中國出了一些好公司,但是沒有一個以技術為領先的公司,在所謂的第三代平臺里,中國應該出現更多有突破性技術的大公司。”
在過去的20年中,IDG資本始終專注于中國市場,在互聯網和移動互聯網領域投資了一大批成功的企業,包括騰訊、百度、搜狐、奇虎360、土豆網、當當網、搜房網、攜程等。與此同時,IDG資本還建立了廣泛的海外網絡支持,合作伙伴遍布全球四大洲50多個國家。
下面各個專場討論嘉賓的發言摘錄:
一.中國互聯網巨頭的數據開放策略和生態
湯道生(騰訊社交網絡事業群總裁):騰訊的過去兩年的發展路程上也有好幾個層面,首先在最基礎的我們在社交應用上面借助于騰訊比較大的品牌,比如QQ、微博等流量平臺,我們支持了幾萬款的上線的應用,而當中的月收入的分層都超過千萬的應用,中間我們以往的不開放的數據逐步的開放,讓我們的合作伙伴有很好的環境接觸到用戶,提供他們獨特的服務,而且我們提供很基礎的建設。
在大數據提供數據以外,還有提供處理數據的能力,騰訊在過去兩年借著開放平臺的策略做了很多云平臺的服務,怎么幫助云平臺開放商的管理信息、安全性的保護等等,都做了很多的工作。最近我們做了一個非官方的統計,80%以上移動的開發者,都會考慮云的服務,過去的后端的建設還是成本很高的。騰訊的開放不僅僅是帳號的開放,是分享、聊天、騰訊、云的處理,大數據的處理的層面。
張宏江(金山軟件CEO):互聯網里面跑的最快的公司都是和大數據有關的公司,谷歌、facebook等,這些公司制所以估值很高,不光是本身的運營,這些數據所帶來的價值只發揮了很少的一部分,未來的價值更高,無[FS:PAGE]論是廣告還是對用戶的分析和預測上,能把大數據作為未來服務的公司一定是會有更大的價值。
盧義(新浪微博事業部副總):有交易就有傳染數據,還有社交網絡的數據,就是騰訊和新浪。騰訊給我們帶來的壓力挺大的,一種是線上的另一方面是今年更多的影響是微信的,其實不僅給我們帶來壓力也給其他的產品帶來了壓力。社交網絡是有公開傳播和識別網絡的,微信和公共服務一樣,微博也有部分的私密功能,微博最重要的一個中國的消息通道,我們會把這個能力建設的更強。
微博還會面向企業的這些數據,這塊在企業服務和準業用戶的服務,我們是中小企業微博,微博這便會有比較多的分析和客觀關系管理,大量的企業帳號在上面,這塊的市場空白比較大,這么多的粉絲和客戶需要跟進和維護,這塊的市場我們希望開放部分的數據的方式,提供更多的機會來服務于企業的市場。
龔世海(大眾點評網技術副總):點評接下來計劃1月份左右正式推出來第一版的數據開放平臺,小范圍的開放我們07、08年就開始做了,我們都是利用數據點為他們的用戶提供各種各樣的服務,到今天為止我們的有限的開放還是有的,有上百家不同的公司利用點評來為他們的用戶提供服務。
二.企業如何擁抱大數據
車品覺(支付寶首席商業智能官):我是淘寶的商業智能部的,每天都和數據打交道,很多的企業其實沒有在大數據里面,我自己的工作也是每天的調整自己在數據上的管理的方法,包括我的團隊是怎么的開放,在新的經濟形勢下如何產生價值,今天的BI很容易就失去了自己的方向。
傳統的運營是比較穩定的,物聯網連打法都天天在變,我們定了指標常常出現非常大的變化,如果想做一個固定的系統出來,控制今天的數據,你會發現明天就已經不能這樣監控了。這是在非常大的變化的企業里面,最關鍵的,可以說我們淘寶一淘變成了四淘寶,原來是一家公司,后來拆分了四家公司,這種情況是非常大的變化,我們遇見的問題是KPI一變,三個月后我們才能看見新的數據的指標。
如果把大數據拋開就是數據,我自己認為就是把傳統上還沒有用到的比較穩定的數據加一點東西進去,比如說競爭數據,外來的第三方數據,到底我能不能把這個數據拉進來[FS:PAGE]改進了我今天的數據的決策,其實我覺得今年的數據有兩個極端,一個數據是以為自己有很多的數據,我們好淘寶號稱有許多的數據,其實我們零售只有2/8,或者1/8,我能代表整個購物的數據嗎?這是不可能的,所謂的大數據就是如何利用別人的數據把整個東西更完整一點,把決策做扎實。
大數據的特性中間產生的關系講的是密度,不僅僅是廣度。有些數據包括了在大數據提升之下,以前很少人研究數據與數據的關聯。這里有一個很糟糕的事情,就是凡人都有小算盤,這個事情在我們自己內部都會出現,就是一個分公司拒絕提供數據,說那個數據是自己的,所以“我的數據”這個概念和大數據之間也會產生一個比較大的矛盾。
黎文憲(SAP全球副總):SAP是全球最大的應用軟件的開發商,對我們來講,我們跟客戶以前的很多種模式是我們賣給軟件給客戶,我們現在和客戶的合作方式是變成共同創新,速度、硬件、軟件似乎都不是問題,我們最大的問題是怎么樣把商業價值開發出來,這是我們一個真正的考慮比較大的瓶頸。
尚笠(英特爾中國研究院首席架構師):對我們來看的話,大數據就是我們作為一個信息領域的一個首位工具。比如像傳統行業,他們面臨一些數據,有的大有的小,核心是在于,他們并沒有這樣的相關的能力來處理、分析和應用這樣的數據。
傳統行業里面有一個嵌入式系統,比如做軟件平臺和硬件平臺,因特爾領域是非常的細分的,像大數據的話可能給了我們這么一個機會,使得我們的很多的技術和知識能夠應用到其他的領域里面去。我們的目的就是希望利用大數據作為一個工具,最終希望重新改變傳統領域里面的產業鏈。
陶波(羅克佳華副總):什么是大數據要看數據在哪里,我個人覺得數據在兩個地方,一個是你的生產或經營數據,對于互聯網來講就是你的網站產生的數據,無論是從哪個IP過來的。對于傳統行業就是你的自動化控制中所有的設備的參數,或者是樓宇的監測。第二類是管理數據,對于不同的行業來講一樣的,就是你的財務、人力數據,考勤、報銷等等,包括人力里面的簡歷。
對于傳統行業來講,它的生產數據,比如火力發電廠生產過程的數據怎么能夠做分析,對他們來講是一個全新的挑戰,總的來講我們應用的層次還比較低,即使是互聯[FS:PAGE]網企業也是比較低的,比如報表,我不知道今天的報銷和上次的報銷是不是一回事,就是簡單的數據管理系統,對于日常管理可以做的更好,傳統的行業可以向互聯網行業學習他們在生產方面的經驗,在管理方面有很多的空間。
我個人感覺事實上,第一呢,企業不具備知識,它不知道數據分析有什么好處,我為什么要把數據給你,你到底能給我們帶來什么好處,經常是你給你作出一些系統,他看到原來是可以產生一些價值。你光有信息化是不夠的,你要有現場的大量的數據介入的能力。這是我們碰到的一些挑戰。
三.大數據的處理和管理技術周濤(百分點首席科學家):同一個用戶在不同的媒體和不同的購物網站上有行為,我們需要把它變成同一個,非結構化的數據把它抽象出來。另外我們做的事情就是提供個性化的服務,萬一有一天完全個性化的事不能做怎么辦?我們一邊做數據,一邊想抽出一些知識,我們做數據存儲的時候是以唯一的ID做存儲架構的,我們通過這樣的行為把知識抽出來,不依賴具體的人,這是我們搜集和存儲數據的時候比較看中的。
姚宏宇(友友系統CEO):叫大數據也好,叫云計算也好,不是簡單的解決存儲問題就解決了所有的問題了,很多的成本是網絡的IO上發生的,怎么減少這個,存進去之后怎么用,用了之后怎么維護可持續發展,從性能的角度。相當于你花原來的1%的錢可以做一樣的事情,甚至更少。
剛才有嘉賓提到大數據3百億美元的市場,可是里面有多少是代表新興產業的,絕大多數都是互聯網企業,傳統的企業里面這個就非常的難,我們接觸的傳統的企業比較多,他們第一關心的是遷移產品,雖然你說的這么好,我怎么遷移,即使我要做一個新的系統,傳統的考慮問題和以新的互聯網為主的企業考慮的是不同的。
即使是一個新的系統,傳統的企業,業務非常多,我們最近做的傳統的零售行業的客戶,里面光是一個小部門,IT部門,你想一個零售企業都有多少系統,它里面有100多個業務系統,即使全新建一個系統也不能完全像互聯網企業一樣,其他的就不管了,這是我們現在看到的比較大的挑戰,除了性價比以外,還有一個很大的對他們的比較吸引的是可擴展性。
Bob Wiederhold(CouchBase CEO):考慮到存儲的話,許多的應用的數據量非常[FS:PAGE]大,但是我們對這種應用的本身需要快速的獲取數據,能夠支持大量的用戶群體,廣告平臺是非常好的例子,以前數據都是你喜歡和不喜歡的方式存儲起來,大部分的這樣的廣告平臺現在都是在使用個人用戶的信息。因為他們需要把這樣的個人信息建立帳戶,這點非常重要,這是一個數據發展的方向。
另一方面就是帳戶信息數據也會變的非常大,怎么樣能夠以快速來找到他們的數據。所有的用戶都是對數據庫的操作,整個的世界就會變的數據更為分布的方式。不是簡單的用一個中央式的系統,我們說到這個量級的數據級別的時候,在同時在線和使用的用戶群體的數量的時候,我們需要采用這樣的技術,我相信這一定是分布式的技術,在每種層面進行擴展,這是提升擴展的能力。
四.移動互聯網上的大數據玩法
何云鵬(91無線副總):移動互聯網從移動通信開始,運營商包括政府和企業都在做相關的研究,大數據不是新概念,什么叫大數據?淘寶有幾百萬的數據就是大數據?我覺得不是,更容易的挖掘價值才是大數據,移動互聯網的價值在哪里,它的緯度多,手機是隨身攜帶的設備,和人的身份是綁定的,有很多的傳感器,蘊含的價值無論是對廣告還是其他方面價值大。這是一個的觀點,第二為什么說研究領域和產業界脫節了,研究領域解決輸入問題,觸屏手機現在的發展給輸入反倒帶來的麻煩,現在的手機再出來還是解決輸入的問題讓人的交互更加的方便。
我們覺得未來是一個個性化的市場,每個人看起來的東西都不一樣,根據你的安裝、喜好、分享、評論去自動的給你展示你喜歡的東西,包括語音、增強現實的技術發展,個很多的其他的其他的增強現實帶來很多機會。
我看是三個緯度,早上我聽了很多大數據的類似的說法,像最早的并行運算,如果我們把大數據的本身的概念不看,本身構造三個緯度,第一技術,第二模型,可能涉及到建模,第三是人,技術是過剩的,我們現在做咨詢的話,最后和一個移動互聯網企業說你們應該這么干,他們都說給我一個人去做這個事情,現在更缺的是人,美國也出現了一些公司專門的培養這樣的科學家,和產業數據結合的。
陳繼東(人人游戲首席數據科學家):我們在大數據應用這塊主要是兩部分,一個是游戲,包括基于數據驅動的游戲的[FS:PAGE]運行和推廣,幫助移動和游戲來說如果進行精準的數據的運營,另外是針對移動的精準的投放。
我們多方合作,我們為什么做這個事呢?可以得到更多的用戶的信息,拿到更多的用戶的數據,可以幫助我們做推廣,更幫助我們了解移動用戶的行為模式,使得我們更好的把游戲進行推廣、開發。從游戲和廣告精準投放,大數據也有兩個作用,在這個平臺里面,受眾定向,一方面是量的問題,移動的屬性和wab的屬性是不同的,這對我們的用戶受眾的定向也有新的需求。
這是一方面我們比較關注的,通過大數據一個解決量的問題,一個解決質的問題,更好的從大數據里面挖掘用戶的行為數據,得到更精準的營銷,特別像用戶的使用模式,用戶在使用手機玩兒游戲,還是碎片化,導致的問題就是如何把碎片的行為關聯起來,這對數據分析提出了兩方面的要求一個是實時性,另外一個是深入的分析。以后的預測將是這個的發展,一方面深入的分析包括預測的分析,還有復雜的碎片化的時間如果關聯起來,跨設備,跨應用和跨屏。
我們公司在大數據方面的有三點挑戰,第一點大家討論了很多關于數據質量,不同的游戲之間數據打通或者不同玩家的數據的預處理,這里每一個企業都會面臨的問題,接口不規范,借口雜亂無章都導致了數據比較差,怎么樣選出我們高質量的數據。第二個問題在用戶的隱私和個性化之間找到一個平衡點,這是對移動的用戶來說比較有挑戰的問題,這個挑戰不光是技術,還有政策法規。第三未來的趨勢還是跨設備,跨平臺,跨應用,在移動互聯網一定是完成一個生活的完整的軌跡,做一個生活的分析,這一點都會有一個挑戰。
崔曉波(Talking Data CEO):我們做的是移動應用統計分析平臺,我們運營平臺會看到和其他普通開發者不太一樣的數據,我們看整個平臺的,比如用戶只在我的平臺玩兒了一款游戲,我們認為你只是這個游戲的用戶,如果你通過我們的交叉營銷,通過營銷手段,能夠玩其他的更多游戲,我們有所謂的在平臺的活躍率,還有一個是生命周期,包括一個產品的生命周期,有一些可能比較短,有一些比較長,我們會站在一定的角度平衡產品的好壞,我們從這個角度來看數據。
我們是按產品線分的,第一是統計分析產品,在關鍵的上線的產品,還有首周首月有專門的顧問幫他看報表給出一[FS:PAGE]些優化的建議。第二是廣告檢測產品線,更多的是和廣告一起優化廣告投放。發現廣告主的感覺和認知和業內完全不一樣,有一個團隊專門做這個。第三個團隊是專門的做數據挖掘和預測的,一方面我們有一些商店的客戶,主要是提供規則的一些挖掘,找出來什么樣的用戶在什么樣的情景下更容易下載這些應用。第二類是和一些大的公司,像國內最大的兩個業務公司也有合作,我們是幫他們優化他們的系統,他們對效果無法預測,比如三個月以后的系統會不會崩塌,內容會不會耗盡,這需要有一個完善的模型,在上線之前我們模擬10萬用戶,2天模擬2個月的情況,然后告訴他們結果。員工的性質來看前兩塊還是偏技術,后來是偏算法的。
五.數據驅動類應用
胡寧(MediaV CTO):我們就是做所謂的精準廣告的,本身現在的互聯網廣告的發展已經是非常典型的應用驅動型的大數據的發展,很多時候我們講的精準廣告學,怎么樣利用你接觸的所有的大數據取得更好的投放,最后的廣告都變成了相關的推薦,使得它有一個非常高的轉化率,最后做廣告變成了一個推薦系統,就變成了精準廣告。
原來在國內很多人買廣告是按天包段,還不是像國外的,按著暴光去買,這里面實時的計算對我們非常的重要,因為我們每一次暴光,我們都要經過非常復雜的計算,比如我們要經過對所有可能投的創意的風險。最后排序進行合適的創意的投放。需要有一個競價策略,所以這完全是一個大數據下的典型的應用。
這里面會有很多的挑戰,我們現在每天的數據量壓縮以后在220G,我們每天需要存檔的硬盤就有很多,我們現在做的分布式架構其實是我們自己搭的。另外什么時候國內可以出更好的云計算的平臺,使得我們不用花那么多的時間,我相信像我們這樣的企業會更容易發展起來。
現在的DNP都很火,我們也接觸了很多,現在沒有一家是做DNP的,現在存在的問題很多人有數據,但是這個數據首先講不太清楚,不好講是怎么來的,有時候就沒法用,另外一個很嚴重的真正有數據的不愿意拿出來,導致的情況就是說現在的市場很多的主件是沒有的,跟美國的市長的比較來講差別是很大的,我認為數據在整個行業是至關重要的角色,肯定有一些人能夠出來,以某種形式,可能不見得是DNP的形式,可能更貼近的廣告主,更好的指導廣告的投放,未[FS:PAGE]來的整個的趨勢是這樣的,只不過不會像美國DNP。
梁信屏(力美廣告CTO):大數據這邊我就分三點了解怎么樣用:第一是數據那么多,怎么樣從廣告主,在我們的平臺投放廣告,或者從用戶的互動,媒體的廣告出現或者第三方的數據來的時候怎么樣了解這些數據,這是基本的統計,把這些數據編成一個可看到的從這邊了解你的運營的狀況是怎么樣的。
再到高層一點的就是數據的了解就是洞察,不僅是有數據,這群用戶在我的系統里面有什么新的行為特征,我可以用,做后續的一些調整。最后這個數據,就是真的影響到你的業務怎么調整,從人工的調整,怎么調整你的投放的參數,或者是你的運營這邊的流程,或者是自動的調整,從你的算法這邊自動的去做預測。可以調整你的匹配模式。再帶給移動這邊和別的一些服務更有價值,是從這樣三層做。
Derrick Harris(GigaOM云計算資深撰稿人):我想在尋找數據的連接方面,所有的平臺和設備之間的互動,其實在美國很多的公司他們認為無論數據科學家多好,他們就是無法獲得所有想要的數據,我們知道如何來連接,如何來做,如何處理,如何搜索,但是中間還是有一個差距,現在大家都在進行數據的交易,數據已經成為一個貨幣了,你如果可以最終我們的線下的數據也是可以付錢給你的,如果你知道這個人本身在那里我們是可以付錢給你的。
作為消費者來說,他們都是有價值的數據,我真正想要獲得的信息是什么?我真正認為有價值的信息是什么?可能消費者他們也愿意,他們也希望在平臺上面看到自己想看到的東西。你把你最有價值的數據給我,我會給你一個產品,所以我們愿意給你你想要的數據,作為企業來說,我們可能在討論的是很難來獲得數據,很難來進行分析,但是我們看到的很多的創業家來自谷歌、雅虎,他們剛剛開始的時候數據并不多,首先他們一開始是放在應用程序的開發上,我們把所有的事情都弄的很簡單。
也許你并不是一個數據科學家,但是你了解這個程序怎么來運行,并且把這些工具建立到我們的應有程序當中,這就是做這個的一種方式。而不是說你把自己埋在數據部一直進行數據的分析。如果說我們有了這樣的工具的話,我們是可以讓自己更好的來利用。因為企業就是說要讓大家都參與進來,無論是數據的銷售者也好還是數據的科學家也好。[FS:PAGE]
相關文章
大數據等構成的人體信息物聯網將改變未來醫療模式
一條項鏈可以實時監測人體心肺功能、一個戒指可以監測呼吸脈搏等指標、一副眼鏡可以監測精神疾病患者狀況……記者20日從成都舉行的2021第二屆四川康復治療及產業論壇上獲悉,由大數據、云計算、有限傳輸與無線傳輸相結合構成的人體信息物...
依托大數據物聯網 開展防汛工作
記者從白云區綜合行政執法局獲悉,為確保轄區安全度汛,該局充分利用大數據、物聯網技術,開展職責范圍內防汛搶險的應急綜合調度、指揮、協調工作,以有效應對汛期突發事件、緊急或特殊情況。該局以白云區“數字城管”系統平臺為基礎,依托...
治理PM2.5推行智能型環保 云計算大數據首當其沖
兩會期間,全國人大代表、廣東省家電商會會長、TCL集團董事長李東生接受采訪時一句:“北京昨天的霧霾還很重,今天天氣很好,北京的天氣比較講政治。”的玩笑逗樂了在場所有記者。
大數據和分析解決方案如何在數字時代徹底改變業務?
如今的技術在不斷地發展。無論是自動駕駛汽車、機器人還是重型自動機械,技術只會隨著時間的推移而變得更好。然而,很多技術在很大程度上依賴于數據、各種規模和類型企業的信息,以及解釋這些數據和信息的高級分析技術。由于大數據在推動組織數...
互聯網趨勢下,物流倉儲如何“玩”好大數據
前段時間電商物流界兩位大佬的“數據之爭”在網上鬧得沸沸揚揚,其他因素先不說,單說引起此次紛爭的“大數據”,已經是互聯網時代一個不得不思考的問題。早已有人斷言:得數據者得天下。巨沃成立至今一直專注于倉儲物流供應鏈的管理與訴求...