Ihab Bishara:一石三鳥:性能、功耗及成本
下面是Tilera公司,Tilera預算產品營銷總監Ihab Bishara先生演講全文。
Ihab Bishara:
我重點談三件事情,第一個談一談云方面的問題,在云方面,人們面臨最大的問題,尤其是發展的問題是什么,并且會談一談新解決方案,我們如何解決那些問題,我們會談一談我們如何解決這些問題。最后和大家分享一下我們之后的這些技術,并且這些技術是一些創新并且能夠給云計算帶來更多價值。
首先,這個內容是關于什么是云,云的概念很多,我之所以談這些,我們應該保證對云有共同理解,云對我們來說是一促計算資源,通過網絡聯系到一起,其實是一種抽象的管理,能夠給你提升非常簡單成本模型,不用買數據中心,只需要租一些服務器就可以了,可以使你做的非常有彈性,可以用更少資源實現更多事情,隨著企業增長可以隨時調整你的硬件設備,這個是云,云是非常偉大想法,確實現在在云方面有一定的趨勢,這頁最下面我們現在已經不再用10個或者是100個服務器,我們現在用的數量達到數千數萬,數據中心不斷的擴展,所以數據中心有的占幾萬平米這么大,由于云的供應商成本非常重要,所以買操作的服務器,他們必須考慮他們的利潤,所以優化成本對于云的成功非常重要的,除此之外,由于功耗的限制,所以我們現在的功耗以及足跡,也就是每個計算能力功耗必須要下降,所以只能達到10或者是5K瓦每個機柜,所以我們可能最多用5到15個。
這些是云現在面臨的問題,由于一種解決高性能功耗比是所有公司的投耗問題,在美國和中國所有公司想開發性能功耗比高的數據中心,所以功耗和冷卻是成本最高的事情,所以你在資本支出一美元的時候,在功耗和制冷方面消耗一美元,運營成本支出比資本成本高。
這張圖顯示的是問題是很多廠商面臨的問題,很多人可能之前看過這句話,英特爾和AMD沒有提供他們需要性能的產品,所以服務器要更便宜,性能更高,能效要更高,目前的解決方案實際上并沒有解決過去網絡數據中心面臨的問題,所以像Google,亞馬遜用的數據中心問題現在都沒有解決。
剛才我談的是云面臨的問題,增長非常快,發展速度會持續上升,但是這種性能功耗比的問題是阻礙進一步發展的主要障礙,我想用愛因斯坦的話,你用創造一個事物的思維不可能解決這個事物帶來的問題,確實這個話一次被一次的驗證了,所以在未來幾十年中也會如此。所以我們解決的是什么問題?目前的技術就像剛才說了,[FS:PAGE]解決性能和功效比問題,云計算數據中心沒有解決這個問題,他們的核的整合度很低,所以在你的筆記本上使用的核和服務器上是一樣的,甚至和PC也是一樣的,這種核組件更多,實際上云并不需要這么多的核,不需要臃腫的結構,而且這樣的話會使得你的成本非常高,我們怎么做的?和大家分享我們做的創新工作。Tilera實際上能夠解決我剛才提的所有問題。
首先我們從一張白紙開始設計,想要高能效的核,我們希望所有的是整合到一起的,不希望所有的是分離的,我們希望一個芯片能夠提供一種完整的解決方案,更高的整合能力,更低的能耗,可以使用標準的編程模式,不能使用標準編程模式不可能有統一的云。
來解釋下,如果你看一看這個標準核,左邊這個就是現在的標準核的狀況,像X86技術,這個核中只有4%的空間用于真正的計算能力,其他的大家可能用了,但是大部分時候沒有用,但是要為他花錢。所以這個想法非常簡單,有這么多沒有用的東西,我們應該充分利用這些空間,而不僅僅讓他浪費掉,所以我們使用多核,每個空間單位計算能力增加,這是云最為需要的東西,因為云是非常簡單的東西,只要提供更多計算能力性能肯定提高,并且每個單位的功耗的計算能力會增加,像IO和PCIE,我們提供整合化的解決方案。Tilera由于有這樣的想法,從1994年有這個想法,最開始有MIT的一些專家成立這個公司,之后我們在開發各種不同產品,第三代的處理器實際上可以用到100核,沒有任何其他的公司能夠做到這點,我們是唯一能夠提供100核處理器,集成在一個芯片上,LINUX可以用100核,這是Tilera提供的產品,我們想說如何將100核擴展下去。之后具體談。
這張圖不僅僅是一個展示,我們在樓下展臺上有這個實物,我只是給大家看這個圖,這個是用1級服務器OEM跑的,在兩個服務器上比較,這是一個云的應用,我們之所以進行這樣的比較,云應用非常簡單,只需要更多計算能力,我們提供這樣的解決方案。
另外一個重點,這是一個LINUX核,基于我們處理器,64核,里面看起來很空,這個核里沒有太多東西,因為所有東西整合一起了,這是為什么我們可以如此提高我們的容量和能力,在這個核中我們用LAMP,我們同樣做的一些開源應用,我們進行編譯,在這上可以用非常標準的工具,像C++,所有編程標準組件都可以用,這個功耗只有40瓦,這可能甚至比一個燈泡能耗還要低。
把所有的整合到一起來看數據中心,[FS:PAGE]如果比較一下,比如說最大的功率只能是5K,然后看一看服務器,是用X86還是Tilera,比較一下看兩個計算能力不一樣,差距不是一點,不僅是2、3倍問題,我們在一個機柜中有1萬核,X86有200個,可以算每秒差多少。再看I/O速度,我們的I/0比其他的解決方案快的多,你想象新技術帶來的無限可能,你的總體成本會大幅度下降,并且計算能力大幅度上升,同樣功耗前提下做更多事情。看Tilera和X86另外的比較,可以看到這是60的服務器,和100的服務器比較,我們單位功耗性能更高,我們也節電了。
接下來談一談我們如何實現這些東西,這個想法非常簡單,但是在這個簡單想法中有很多創新,我們最主要兩個部分,是一個完整的核,非常簡單,但是非常強大,這個核有緩存,處理器,單核中運用完整的操作系統,我們在這個核中加了一個轉換器,這個也是我們在架構中最重要的東西,能夠使得所有的核聯系到一起,我們有多層網絡,使得我們的擴展性比其他的解決方案要好的多,無論是總線為基礎還是其他為基礎的,這有64個核聯結到一起,我們稱為網格網絡,下一代技術中,我們每秒帶寬達到200T,可以看到我們的連接和速度非常快,我們這種增長速度不是線性的增長速度,有人問我們我們的核多強大,你看這張圖,看左邊這個,是我們Tilera單核的和其他的比較,你可以去網站看具體數字。你可以看我們的性能,我們08年發布性能,G36我們今年要推的核可能比英特爾更好,這些是非常強大的核,絕對不是小核,雖然體積小,但是功能強大,我們做計算型的機器。
再簡單談其他部分,談一體化方面的問題,每個芯片實際是一個整合系統,不僅僅有處理能力,有內存控制器,網絡I/O,是一個非常完整的芯片,可以直接用他做服務器,我們從一個完整的角度來看這個事情,看如何節約成本提高性能。整個系統整合在一個芯片上。
從技術角度看非常重要一點,緩存有一致性,現在很多的創新都在發展很多核,要做到一點緩存保存一致性,這個做起來不是非常容易,緩存一致性使編程更容易,可以在LINX上可以應用,可以共用內存,使得你現在的軟件可以在我們的芯片上很輕易運行,不需要做任何改變。
談一談軟件方面的事情,大家看一看,我們從公司成立第一天,使命是使我們的東西能夠更加普遍化,并且我們在這方面非常成功,我們有非常標準化工具在芯片上運行,我們融入一些開元的部分,本周我們的整合工作進行非常順利,很多公司支[FS:PAGE]持我們的工作,C和C++等等,只要想起來的東西,我們的芯片都是支持的。這樣的話使得編程更加容易和標準化,使用環境一樣,不用寫其他的代碼,用原來的代碼搬過來可以用。
在右邊是標準應用對陣和左邊差不多,我們的對陣差不多一樣,像虛擬化,上面有操作系統,上面有應用,很多客戶在這個整個過程中用C或者C++可以寫幾百萬行代碼,在我們芯片上的軟件環境你非常熟悉,和你現在使用的沒有任何差別。
如果從云的角度看這個事情的話,實際上我們有一個綜合的云對陣,從下到上,所有人們編程的時候都可以用,像數據挖掘等等所有這些東西都可以用,這是為什么我們推出這個產品的原因,基于此,一級OEM和ODM服務器將基于我們的產品在未來可以使用。
到目前為止我們已經做的不錯了,其實這僅僅是一個起點,我們在08年已經推出了處理器,我剛才給大家分析的是08年數據,今年下半年,我們在今年晚期可能推出3到16核處理器,性能和之前比翻一番,我們性能是翻番的,在今年4季度會推出,2011年我們的性能可能比之前翻了8倍,這是技術帶來的奇跡,我們之所以能夠實現這些目標,是因為我們應用了網格網絡,使得其擴展性非常的好,所以不會受到總線或者是其他的限制,我們可以用到幾百個核,這樣的話我們提高性能會非常快,我們的架構是允許我們能夠實現這一目標的。
GX系統產品我給大家簡單介紹一下,解釋一下為什么能夠翻兩倍,我們的芯片的緩存2G或者更高,可以用16到100個核,我們可以用64、100、32個,多少個核都可以,我們的網格網絡,我們的每秒帶寬達到200T,這使我們的擴展性可以進一步的延伸。
談專注的市場,我們不可能解決所有問題,我們只是專注于某些問題上像網絡應用,像數據挖掘,這是我們關注的市場,還有視頻代碼轉換,還有視頻監控,所有的這些都是我們關注的市場。如果用我們的產品,他們的總體成本,性能功耗比有大幅度提升,我們的產品實際上在基于現有架構有很多優勢,我們在未來幾十年中做轉換代碼的架構將是非常優異的,這樣的話我們的產品無論用于視頻監控,還是其他的應用,都可以省下很多成本,由于我們有著很強大的計算能力,并且每瓦計算能力更高,所以我們能夠給大家帶來更多價值,對于一個公司類似應用這樣的話可以給他們省很大成本。這是我們為什么專注這三個市場,現在的服務器性能當然不錯,但是需要擴張的,這是我們需要解決的問題[FS:PAGE]。
總結一下,剛才談到云和云最大問題,性能功耗比,成本問題,空間問題,這是云面臨的最大問題,我們提供的是一個經過事實驗證的解決方案,我們的產品在性能功耗比實際是非常高的,并且非常少的應用能夠跑在很多服務器上。
最后一點我談的如何實現這個目標,我談了一些細節的架構,并且也談了我們的具體工作,我們1994年以來開始研究,從07年的時候推出我們第一個服務器產品,現在我們經歷了第三代的架構,第三代處理器,并且我們的整體的性能還在不斷改善,因為客戶在不斷的使用不斷的部署,所以我們的工作使得多核的性能達到新高度,我們添加的不是一個兩個核,是因為我們使用基礎的架構使得我們能夠使其性能可以翻出幾倍,最后我想說,我們剛剛起步,我們未來10年有非常好的前景,你是否想節約你的總體應用成本。
謝謝各位。
提問:剛才您比較了X86和你們的CPU在計算能力和功耗區別,能不能比較一下ARM(音)芯片和你們芯片區別,ARM芯片進展也比較快。
Ihab Bishara:
我現在沒有看到ARM推出64核芯片你們見到過嗎,當然我不是說我比他們聰明,最終問題是擴展性,如何能夠擴展到100核,他們現在沒有這樣的技術,但是我們有,ARM他們幾個核,他們每秒20K速度,他們功效比較高。現在核心技術不是CORE怎么樣,是把CORE有效互聯,更有效組成一個CHIP。
提問:您介紹CPU和框架執行效率高關于吞吐量方面怎么提升的,比如磁盤陣列,或者是網絡的吞吐量。
Ihab Bishara:謝謝你的問題,如何改善我們網絡和網絡吞吐量兩問題,你和很多網絡數據中心人說,他們談應用問題,很多應用需要更多帶寬和I/O這是平衡問題,GX產品我們有22G的I/O,這個方面我們沒有問題,GX產品中,我們可以最大擴展到300G,這能夠進一步擴展,我們有一系列的產品,這使得你能夠基于你的需求選擇不同核產品滿足不同需求,所以我們的這些產品可以滿足所有應用帶來的需求。
提問:您的一個芯片中擴展多少核?
Ihab Bishara:
我們現在遵循摩爾定律,你問我們CTO他們會這么說,但是我只能說這么多。
相關文章
云計算的未來是什么?
一場突如其來的疫情使得很多人不得不宅在家里,這場疫情之中,很多線下實體店遭受了巨大的沖擊,但是很多互聯網企業卻在這次疫情之中賺的盆滿缽滿。我們可以發現由于無法在辦公室辦公和會議,很多公司開始了遠程辦公和遠程會議;由于醫院人...
如何選擇云計算物聯網平臺
企業的云計算物聯網平臺必須監視物聯網端點和事件流,分析邊緣計算和云平臺中的數據,并啟用應用程序開發和部署。物聯網(IoT)是當前計算世界中最熱門的概念之一。云計算物聯網平臺甚至可能在宣傳和炒作規模上超過物聯網。但是,這兩者...
云計算工作負載需要哪些保護
組織出于各種原因采用多個云平臺,例如提高效率和分配計算資源。根據《2021年Flexera云現狀報告》,92%的企業采用了多云戰略,80%的企業采用了混合云戰略。但這些企業也經常經歷管理復雜性的增加,這會影響安全性并增加風險。...
云計算專家如何彌補網絡安全技能差距
導讀:網絡安全技能的差距如今仍然是一個現實問題,但最終可能會解決。根據(ISC)2公司發布的2020年網絡安全勞動力的研究報告,網絡安全技能差距正在縮小。網絡安全技能的差距如今仍然是一個現實問題,但最終可能會解決。根據(ISC...
上海電信借AI、云計算等手段為復工人員保駕護航
正月已過,各地陸續按下了復工復產“快進鍵”,復工、抗疫要同時兼得,社區、園區、企業辦公樓、商鋪、批發市場等成為防疫抗疫“重點戰場”。在魔都上海,一大批“黑科技”正在加入“復工抗疫”戰,物聯網、人工智能、云計算等等紛紛上陣,...