姚宏宇博士:云平臺:理想與實踐
友友創新技術有限公司總經理姚宏宇博士
姚宏宇:我們公司從2007年開始在中國做云計算實踐,在這里跟大家分享一下我們的看法和經驗。今天演講分為三部分:理想,到底什么是云計算平臺的理想?在五年、十年,甚至二十年之后云計算會是什么樣的,給社會帶來什么變化。因為我們公司是專注做云計算平臺的,我就講講云計算平臺構建的方法和從不同角度看云計算平臺是什么東西。最后也是最痛苦的,我們比市場早行了一步,所以中途有成功的也有失敗的經驗,跟大家分一下。
對云計算本身做一點補充,因為我們從07年開始跟客戶交流云計算這個事情,發現交流到現在還是有一些事情說不清楚,今天大家都說云計算,很少人把云計算分為云計算服務和云計算平臺兩個東西,我個人覺得一定要說清楚,否則就很混淆。很簡單的例子,我有一個朋友做移動互聯網,剛開始創業,他用了十幾臺服務器提供服務,他說我這算不算云計算。我說你應該算云計算服務,但可能用的不是云計算平臺。大家還經常問我你們公司到底是做什么的,云計算也沒看你們服務。
云計算平臺是一個計算技術的不斷演進,從集群到網格,到分布式計算到云,云計算涵蓋了這兩個概念,但是這兩者之間沒有必然關系,你可以有云計算平臺,以技術為主要的,服務為輔,有云計算服務,以服務為主要的模式,以商業模式為主要的推動力,技術為輔助的手段。
從云計算服務角度,一切可以以服務形式提供給用戶的都可以叫做服務。現在提的很多都是從云計算服務角度出發的。云計算服務的理想是什么?或者云計算的理想最后要達到什么目的。從農業社會進化到工業社會,現在到信息社會,云計算就相當于信息社會的工業化革命。云計算帶來的是巨大的計算數據處理能力,讓成本變得更低廉。大家回想一下工業革命時候是什么樣的情況,工業革命帶來兩個很重要的變革,一是生產力的極大提高,二是社會所有的人獲取產品的成本和手段變得非常便宜、簡單,它提供了巨大的能力,能夠讓以前一些不敢想做的事現在變得可能。從云計算服務的角度,又讓所有這些計算能力變得非常廉價,非常方便獲取。所以從本質上,從理想來說,云計算是信息社會的一次工業化革命。從個人角度,從唯我所用變成唯我所用,從特定環境到隨時隨地,從固定支出到按需付費,有些服務就是你用多少花多[FS:PAGE]少錢。從企業角度,工業化革命還有一個很重要的特點,就是整個社會的分工更加精細化、模塊化,沒有人說要通吃所有的東西,就跟紡織做衣服一樣,我不知道大家有沒有到過浙江的義烏,現在到義烏,拿一張圖紙去,一天之內就可以把這個服裝從一張圖紙變成一件衣服,正因為所有的東西都已經很精細化,有人做扣子,有人提供布料,有人提供裁剪。我們提供云計算平臺,有人提供存儲服務,有人提供計算服務,有人提供郵箱服務,對客戶來說就是把這些組織在一起,他們拿著圖紙說把這些東西接起來,這就是我所需要的東西。從社會角度,提高社會IT服務的規模化生產,提高它的巨大能力,極大地降低成本,促進整個社會的創新進步。
我在前面稍微提了一下云計算服務和云計算平臺并不一定非得很強的關聯關系,沒有人說假如你把這個服務叫做云計算服務的話,一定得有云計算平臺這個技術,其實不是這樣的。現在很多的互聯網服務,甚至應用服務,仍然可以在云計算平臺上。其實可以稱為云計算服務,但是用的不是云計算技術。云計算平臺提供支撐非云計算服務的應用。我以前搞高性能計算的,以前一直用MPI等等并行計算的框架,其實現在已經有很多地方在研究如何把并行計算的框架在云平臺上實現,而且能解決原來并行計算框架上的問題。云計算服務必然帶來兩個非常重要的特點,一是多租賃的,可以提供給成千上萬,上百萬,上千萬用戶同時使用的。有人就問我既然已經叫云計算服務,為什么現在云計算還炒的這么厲害?用云計算平臺跟支撐的云計算服務,才能真正提高你的服務效率,把它的規模變得非常之大,而且充分發揮你的服務能力。
傳統IT系統里面一些常見的問題,從高可靠性的要求,第一是性能壓力,數據宇宙的爆炸,我以前在雅虎工作,我宇宙爆炸的速度比它還快,我們每年增長百分之三百,不光數據的走量,還包括數據的流量。另外需求增加,尤其是隨著物聯網出現,每個用戶的需求,每個應用程序沒有適合用戶的需求,怎么能有一種架構能夠讓它很快調整,這就需要云計算平臺。
高可用性的需求,我以前管過很大的數據中心,大概每個數據中心一般是5000-10000臺全新機器,第一年出的問題,磁盤壞了,網絡斷了,你平時想象不到的問題都會在那里面出現,換句話說你的IT信息系統建立的基礎是不穩固的。我可以打個比方,IT系統,就像建樓房,這個IT系統做市場的,必須得有一個很堅固的地基,才能保證上面的東西持續下去[FS:PAGE],但可惜的是所有的硬件都是不可靠的,怎么從整個系統層面保證可靠性?所以云計算平臺所辦的事情要建一個基礎,在沙地上把這個基石打出來,能夠建萬丈高樓。
云計算平臺的理想,最終要造出一個基于網絡可擴展的超級計算機。虛擬化,VMware虛擬化是把一臺機器虛擬成多臺,我這里是一定要把多臺虛擬成一臺。透明,底下所有的東西都可能隨時隨地壞掉的,怎么建一個系統,保證上面的運營不受影響,所以下面的系統運營是透明的。彈性,隨著業務增長,這個系統能平滑過渡,平滑增長,而不像現在的系統一樣,我先建這個,等我有能力重新再一個系統,把這個扔掉,再重新做。動態,最主要是適應現在各種IT業務,IT系統用戶需求的快速變化。有一個很明顯的例子,亞馬遜賣東西是有季節性的,尤其在美國,有一段時間銷售量和流量是平時的5倍,我以前負責的雅虎財經網更是這樣,中國財經可能也是這樣,每個股市總是在開盤之前半個小時,開盤之后半個小時,這一個小時之內流量是極其巨大的,然后就掉下去,快收盤了,大家趕緊把今天賣的股票賣掉,又產生巨大量,怎么樣調度資源,怎么樣在非峰值的時候做其他的用處。通用,不能說云計算平臺最底下的平臺,還要說做這個業務系統用這樣的業務平臺,所有的計算資源其實有三種,通信能力、存儲能力、處理能力。云計算平臺要做的事情就是把這三種能力在分散資源當中聚合起來。多租賃,必須有能力支持成千上萬、上百萬的用戶。綠色節能,我最近碰到一個很有意思的數據中心案例,有客戶提出,比如中國全國好幾個地方都有數據中心,但是數據中心平均使用率不是特別高,就問我有沒有可能達到這樣一個程度,有的數據中心在西南,有的在東南,有的在北邊,他說東北的電從網上幾電到幾電特別便宜,能不能在那個時間調度,讓我那個時間在那里運行,電特別便宜,晚上也比較冷,其他東西也能歇下來。我覺得這個很好,不光為企業節省成本,而且節省整個能源使用率。最主要就是把你的業務從用戶的需求反映到業務的需求,從業務的需求反映到IT系統的需求,從IT系統的需求反映到能源的需求,都能利用起來,最后適配化。
云計算平臺的構建,這是我們公司主要做的事情。云計算平臺的技術本質,里面的每一塊技術,虛擬化技術也好,網格并行計算技術也好,調度資源的技術也好,并不是說從2007年、2008年前才還是有的,有的技術已經有了二十年了,所以云計算的技術本身不是我要創造這種新的解決方案出[FS:PAGE]來,而是前面有幾十個、一百個各種各樣不同的技術集中在某一個領域,就是某一類問題,我怎么做集中管理,能夠讓這些技術模塊根據你的需求,根據你的IT業務的需求在IT架構上自由組合起來,能夠達到更高層次的分布式的集中,或者它的實現關鍵點,第一這個云必須運行在網絡上,必須是寬帶網絡,越寬越好。第二硬件,我和臺灣廣達林百里先生聊過,他們現在硬件都是積木化的應變,以后不是說買一個刀片機,而是賣一個小盒子,我這盒子里裝一個CPU,剩下99個全裝成硬盤,哪天不需要就把硬盤拔出來,裝CPU。系統軟件或者云的操作系統,就是云計算平臺也是可以積木化。我不相信世界上有完美的技術,針對所有的應用都是完美的,只能對這種應用這樣的架構最合適。所以云計算平臺從技術上要解決的是怎么讓這種堆砌變得非常簡單、快速。
構建云計算關鍵技術,云計算,自己管理一萬臺,十萬臺機器,就跟管理一萬個人,十萬個人的公司是一樣的。比如高效可信的管理傳輸,動態負載均衡存儲管理,必須有分層結構,不可能一個人管一萬個人,必須分成好幾層等等,這其實讓機器管機器和人管人從原理上是一樣的。
從三個角度看云計算平臺:云計算平臺是一個物理的聚合,換句話說我在北京有一個數據中心,在廣州有一個數據中心,在成都有一個數據中心,它們三個是連在一起的,這是整個云計算平臺,我們每一個都可以跑業務。但是每個數據中心里面的存儲資源、計算資源又是縱向可以互相分享,這就是資源的整合。最后一直強調通用的,有存儲、管理、通用計算,但是也有專用的,所以既有通用的云計算平臺,也有專用的云計算平臺。
我現在要給大家做一個實例分析,在座的各位都用過電子郵件,很多人都在談云計算安全問題,云計算服務怎么去推,一直考慮到數據的陰私性,但是你們不知道自己的郵件其實是你最隱秘的數據,但是大家現在很放心的放在163、Google,沒有人提出任何意見。舉這個例子有一定的代表性,先是物理的聚合,在歐洲、美國有三個數據中心,在亞洲有兩個數據中心,最后是一個整體,整個都是一個郵箱的平臺,在每一個數據中心里又分成幾塊,有前端處理,有郵件存儲,有郵件處理,按照縱向資源不同的整合,不同處理方式分成模塊。最后有專用和通用的,比如都會用多分布式文件系統,都會用到分布式數據庫,但是有一些東西并不是所有人都會用到,比如數據挖掘,防病毒、防垃圾,這兩個體系加起來就變成郵[FS:PAGE]箱整個云計算平臺。既有通用的云計算平臺,又有專用的。
很多人在說云計算帶來的是便宜,沒錯,但前面有一個條件,在一定規模之上,它會變得很便宜。我們會碰到有些用戶,你給我上這個平臺,我有五臺機器,能不能讓它變得很便宜,我很遺憾的告訴大家恐怕不可以,只有到了一定規模,你過了那個交叉點以后,規模越大越便宜。規模性帶來的影響,規模性不光是讓你平均成本、總體成本、TCO降低,它還會讓你云計算性能、可靠性,會根據規模的增加應該是線性增加。安裝部署的特點,我們最近遇到一個案例,就是用非集約化數據存儲,客戶非要按照傳統模式來部署云計算的硬件和軟件,就好象我現在發明一輛汽車,你說不行,我非得用腳去踩輪子,這樣是用不好的,所以在部署安裝的時候一定要注意,并不是傳統的方法不能用,一定要根據你的實際情況調節。最后是新的編程模式,現在很少有那樣的云計算平臺,就好象你原來的業務應用,把云計算平臺插進去,我不敢說沒有,但卻是很少有,多多少少都會有一些調整。大家都是編過程序的,就好想你用匯編語言編程序,后來用JAVA編程序,覺得輕松了很多,但是以前匯編的程序不想動它,能不能讓JAVA也可以編,難度很大,但不是完全不可能。
因為我做云計算很長時間,我以前在大規模分布式計算方面做了十年多,可以從三個角度看安全,用于安全服務的云,現在大家聽了很多,像瑞星、360都推出了類似的服務。大家其實最關心的是云本身的安全問題,我覺得云本身的安全問題沒有特別多的特殊化,比如原來云是建立在你Linux系統上,你不把系統補丁打上去,云也沒有辦法解決你這個問題。但是云的規模很大,所以帶來新的問題大家要真的注意,規模很大,出現問題的時候影響面會非常大。所以你要想有什么新的機制能夠盡快發現問題,盡快隔離問題。數據托管,數據放在別的地方,數據的私密性、安全性、可靠性如何保證。可移植性,這要解決,主要靠標準。最后是資源的動態調配,我的數據跑來跑去,到底在什么地方,我怎么監管它,中國的數據突然跑到美國,能不能監管。我曾經考慮過這個問題,我花一毛美金可以租亞馬遜的一個比較主流服務器的機室,我花一千美金可以租一萬臺機器一個小時,成本很低。
回過頭來,云計算并不是萬能的,至少在目前來說有三個瓶頸,第一解決的問題必須可以拆分開來,又可以聚合起來,并不適合于所有的場合,比如有些科學計算并不適合用云計算。第[FS:PAGE]二帶寬永遠是它的瓶頸,再寬也不夠,都可能用掉,而且帶寬成本非常之高。第三技術問題,標準問題,法律問題。云計算現在還處于非常早期的階段,無論從技術上,比如說分布式數據庫,我們公司演示了一下目前做的分布式數據庫,我們其他都能做得不錯,有一個很大的難題解決不了,就是事務在分布式云計算情況下如何管理,我覺得現在還沒有人能解決,從標準上、法律上,還有很多問題需要大家共同努力。今天的演講就到這里,謝謝大家!
主持人(董凱虹):謝謝姚博士。我們知道友友公司是一個專注于云計算業務的新興公司,友友的定位是云平臺,而平臺戰略因其復雜度比較高,通常是傳統大公司的專利,您覺得友友是如何克服這個復雜性問題的?
姚宏宇:友友靠的是兩點,說起來也沒什么根據,一是我們一些核心人員原來都是從特別大型的互聯網公司出來的,我們做云計算已經十年了,在這方面,至少在技術方面不落后。二是我們不服輸,我原來在雅虎管過很大的團隊,里面什么樣的人都有,但里面往往中國人、華人還是里面技術的中堅力量,我就不信這個邪,中國難道就造不出自己的技術軟件。謝謝大家!
相關文章
云計算容量管理的重要性及其實現方法
云計算模型的最大好處之一是它支持高度靈活和動態的資源使用。云計算用戶根據需要采用任意數量的資源,并且可以根據需求的變化自由調整其消耗量。這并不意味著云平臺能夠自動優化資源分配。對于大多數類型的云計算服務,由用戶來確定在任何...
治理PM2.5推行智能型環保 云計算大數據首當其沖
兩會期間,全國人大代表、廣東省家電商會會長、TCL集團董事長李東生接受采訪時一句:“北京昨天的霧霾還很重,今天天氣很好,北京的天氣比較講政治。”的玩笑逗樂了在場所有記者。
云計算的未來是什么?
一場突如其來的疫情使得很多人不得不宅在家里,這場疫情之中,很多線下實體店遭受了巨大的沖擊,但是很多互聯網企業卻在這次疫情之中賺的盆滿缽滿。我們可以發現由于無法在辦公室辦公和會議,很多公司開始了遠程辦公和遠程會議;由于醫院人...
如何選擇云計算物聯網平臺
企業的云計算物聯網平臺必須監視物聯網端點和事件流,分析邊緣計算和云平臺中的數據,并啟用應用程序開發和部署。物聯網(IoT)是當前計算世界中最熱門的概念之一。云計算物聯網平臺甚至可能在宣傳和炒作規模上超過物聯網。但是,這兩者...
云計算工作負載需要哪些保護
組織出于各種原因采用多個云平臺,例如提高效率和分配計算資源。根據《2021年Flexera云現狀報告》,92%的企業采用了多云戰略,80%的企業采用了混合云戰略。但這些企業也經常經歷管理復雜性的增加,這會影響安全性并增加風險。...