在云計(jì)算出現(xiàn)之前,想要大量?jī)?chǔ)存和處理數(shù)據(jù)只能自己搭建服務(wù)器系統(tǒng)。這不僅需要很多IT知識(shí),還需要很高的成本,云計(jì)算技術(shù)的出現(xiàn)改變了這一切。
所謂“云服務(wù)”,是指通過(guò)互聯(lián)網(wǎng),讓很多用戶共享軟硬件資源,按照用戶需求提供計(jì)算機(jī)等設(shè)備。于是,用戶不再需要了解“云”中的基礎(chǔ)設(shè)施細(xì)節(jié),也不需要擁有相關(guān)的專業(yè)知識(shí),就能隨時(shí)隨地處理和存儲(chǔ)大量數(shù)據(jù)。因?yàn)樗麄儾挥秘?fù)責(zé)控制“云”中的設(shè)備和軟件,只需要付出相對(duì)低廉的費(fèi)用,把技術(shù)細(xì)節(jié)交給云服務(wù)的提供商來(lái)處理就好。
通過(guò)互聯(lián)網(wǎng),用戶可以非常方便地使用云服務(wù),因此互聯(lián)網(wǎng)上的“云”正迅速擴(kuò)張,變得越來(lái)越龐大,甚至能把產(chǎn)業(yè)鏈的不同環(huán)節(jié)整合在一起。此外,云計(jì)算還讓一些很有想象力的應(yīng)用成為現(xiàn)實(shí)。
云服務(wù)提供商集成的大量存儲(chǔ)和計(jì)算資源能形成規(guī)模效應(yīng),用戶可以隨時(shí)根據(jù)需要購(gòu)買相應(yīng)服務(wù),而不需要為了短暫的高峰需求購(gòu)買大量資源。從這個(gè)意義上說(shuō),云服務(wù)比本地服務(wù)更加節(jié)約資源和能源。
云計(jì)算的好處顯而易見(jiàn),但隨著其規(guī)模越來(lái)越大,云計(jì)算本身的能耗越來(lái)越不可忽視。今天,云計(jì)算的耗電量已經(jīng)超過(guò)全球總耗電量的1%。而且,把資源聚集在一起形成規(guī)模效應(yīng)本身也有成本。云計(jì)算服務(wù)商需要專門建設(shè)數(shù)據(jù)中心,并在數(shù)據(jù)中心里安置成百上千臺(tái)服務(wù)器、處理器和硬盤設(shè)備。這些設(shè)備運(yùn)行時(shí)會(huì)散發(fā)大量熱,因此數(shù)據(jù)中心需要額外的支持設(shè)備(比如散熱系統(tǒng))來(lái)維護(hù)正常運(yùn)作,互聯(lián)網(wǎng)公司谷歌甚至專門成立了能源部門為自己的數(shù)據(jù)中心供能。
從2000年到2007年,全世界數(shù)據(jù)中心的耗電量已從700億度增至3300億度,到2020年預(yù)計(jì)將超過(guò)1萬(wàn)億度。此外,在2014年,只有8.5%的數(shù)據(jù)中心負(fù)責(zé)人預(yù)計(jì)在2015年后數(shù)據(jù)中心的容量仍然夠用,到2020年時(shí),75%的數(shù)據(jù)中心必須要擴(kuò)容。因此,到2020年,預(yù)計(jì)數(shù)據(jù)中心的建設(shè)規(guī)模幾乎將是2010年的兩倍,達(dá)到780億美元,這讓云計(jì)算的能效、對(duì)環(huán)境的影響等問(wèn)題更為突出。
從上面這些數(shù)字可以看出,為云計(jì)算設(shè)計(jì)高能效的解決方案已經(jīng)是迫在眉睫的問(wèn)題。云計(jì)算耗能根源在哪?怎樣節(jié)約云計(jì)算?
云計(jì)算系統(tǒng)有幾個(gè)不可或缺的部分。首先,它需要大量的硬件設(shè)備來(lái)存儲(chǔ)并處理數(shù)據(jù)。這些硬件設(shè)備包括放置在機(jī)柜內(nèi)的計(jì)算和存儲(chǔ)服務(wù)器,以及處理器、內(nèi)存、硬盤等服務(wù)器組件。其次,在服務(wù)器之間,服務(wù)器與用戶之間需要連接,所以網(wǎng)絡(luò)也必不可少,它是連接用戶與計(jì)算、存儲(chǔ)等云資源的橋梁。此外,數(shù)據(jù)中心還需要專門的軟件來(lái)監(jiān)控和管理
云計(jì)算的基礎(chǔ)設(shè)施,這些軟件就是云管理系統(tǒng)(簡(jiǎn)稱CMS)。最后,云服務(wù)商還需要安裝合適的應(yīng)用軟件,幫助用戶使用云服務(wù)。
這幾個(gè)部分都需要消耗大量的能源,也都會(huì)損失和浪費(fèi)很多能源,比如在夜間溫度較低時(shí),散熱系統(tǒng)仍在全速運(yùn)行,或者系統(tǒng)在運(yùn)行,卻沒(méi)有為用戶提供服務(wù)。2003年,單機(jī)柜服務(wù)器的功率密度在0.25千瓦到1.5千瓦之間,而到了2014年,這個(gè)數(shù)字上升至10千瓦,預(yù)計(jì)到2020年會(huì)上升至30千瓦。而且,大多數(shù)服務(wù)器空載時(shí)的功率超過(guò)峰值功率的50%,服務(wù)器的平均利用率一般只有10%~50%。因此,一部只以20%性能運(yùn)行的服務(wù)器的能耗,可能相當(dāng)于它滿載時(shí)能耗的80%??紤]到僅在2013年最后一個(gè)季度,新服務(wù)器的出貨量就超過(guò)250萬(wàn)臺(tái),提高服務(wù)器的能效就成為第一要?jiǎng)?wù)。
而在網(wǎng)絡(luò)環(huán)節(jié),主要有3個(gè)地方會(huì)消耗能源:數(shù)據(jù)中心內(nèi)部的連接、不同數(shù)據(jù)中心間的網(wǎng)絡(luò)連接,以及讓外部用戶訪問(wèn)的固定網(wǎng)絡(luò)和無(wú)線網(wǎng)絡(luò)。在目前的數(shù)據(jù)中心,網(wǎng)絡(luò)成本占所有運(yùn)營(yíng)費(fèi)用的10%,這個(gè)數(shù)字還可能隨著互聯(lián)網(wǎng)流量的增加上漲到50%。
升級(jí)后,設(shè)備的熱載荷也會(huì)下降,這又會(huì)降低散熱系統(tǒng)的能耗,提升系統(tǒng)的穩(wěn)定性。不過(guò),只調(diào)整網(wǎng)絡(luò)設(shè)備是不夠的,因?yàn)楫?dāng)網(wǎng)絡(luò)連通性降低時(shí),系統(tǒng)性能也會(huì)下降。所以,還需要調(diào)整網(wǎng)絡(luò)結(jié)構(gòu),讓網(wǎng)絡(luò)流量可以沿著多個(gè)路徑傳播,或只通過(guò)少數(shù)幾個(gè)高能耗的關(guān)鍵路徑發(fā)送,而網(wǎng)絡(luò)中的其他部分則進(jìn)入低能耗模式。這種方案還可用于數(shù)據(jù)中心間的網(wǎng)絡(luò),充分挖掘網(wǎng)絡(luò)帶寬,因?yàn)榕總鬏斔璧某杀颈葐为?dú)傳輸要低。使用云管理系統(tǒng)的主要目的,是對(duì)基礎(chǔ)設(shè)施(包括服務(wù)器、虛擬機(jī)和應(yīng)用程序)進(jìn)行調(diào)度以實(shí)現(xiàn)負(fù)載平衡。虛擬機(jī)是體現(xiàn)云服務(wù)優(yōu)越性的最佳范例,它借助軟件模擬出計(jì)算機(jī)系統(tǒng),具有硬件功能,可以在完全隔離的環(huán)境中運(yùn)行。有幾種虛擬機(jī)的使用方法能提高云計(jì)算的能效。首先,可以讓虛擬機(jī)根據(jù)負(fù)載情況重新調(diào)配資源;其次,可以為虛擬機(jī)的布置選擇能效最高的物理機(jī);最后,可以將未充分利用的虛擬機(jī)遷移至數(shù)量更少的主機(jī)上,并把一直未使用的虛擬機(jī)關(guān)閉。
不過(guò),這些步驟需要CPU軟件功耗模式來(lái)實(shí)現(xiàn)。該模式下,軟件和硬件彼此協(xié)調(diào)以共同調(diào)整能耗。而且,服務(wù)器本身也可以通過(guò)調(diào)整實(shí)際負(fù)載來(lái)降低能耗。研究表明,即便使用簡(jiǎn)單的試探法(比如在服務(wù)器持續(xù)空載一段時(shí)間后關(guān)閉服務(wù)器),也能節(jié)約大量能源。
下一步措施是在更宏觀的范圍內(nèi)實(shí)施管理措施,比如合并多個(gè)數(shù)據(jù)中心。但是,這會(huì)增加虛擬機(jī)遷移所需的開(kāi)銷,在輸入輸出兩端都要消耗能量。為了弄清楚合并數(shù)據(jù)中心能否提高能效,我們可以借助一些模擬工具,如CloudSim,它可以評(píng)估
云計(jì)算管理系統(tǒng)消耗和節(jié)約的電量,并進(jìn)一步比較服務(wù)質(zhì)量的變化。顯然,如果既能降低能耗,又不會(huì)影響用戶使用云服務(wù),這種合并就有利于降低云計(jì)算的能耗。云管理系統(tǒng)不僅可以控制服務(wù)器,還可以控制網(wǎng)絡(luò)系統(tǒng),甚至控制散熱和供電,因?yàn)樵乒芾硐到y(tǒng)“知道”需要哪些資源,不需要哪些資源,因此可以選擇合適的虛擬技術(shù),并在服務(wù)器空載時(shí)關(guān)閉散熱設(shè)備。為云計(jì)算提供支持的數(shù)據(jù)中心是一套高度耦合的系統(tǒng),幾乎可以視作一臺(tái)大型計(jì)算機(jī)。
應(yīng)用設(shè)備是云計(jì)算中可管理的最小單位,但它們的性能可以影響所需服務(wù)器的數(shù)量,從而產(chǎn)生多米諾效應(yīng),進(jìn)一步影響網(wǎng)絡(luò)規(guī)模和支持性的設(shè)備——比如散熱和供電設(shè)備的數(shù)量。因此,為目標(biāo)應(yīng)用程序選擇適當(dāng)?shù)挠布Y源,可能會(huì)對(duì)數(shù)據(jù)中心的總體能耗產(chǎn)生重大影響。這里的實(shí)例包括,用GPU而不是CPU運(yùn)行可以高度并行的應(yīng)用程序 (有些程序可以在成千上萬(wàn)個(gè)處理器上同時(shí)運(yùn)行,節(jié)省運(yùn)算時(shí)間)。和CPU相比,GPU上的計(jì)算單元非常密集,可以同時(shí)執(zhí)行很多任務(wù),更適合并行計(jì)算,同時(shí)能耗更低。
美國(guó)勞倫斯·伯克利國(guó)家實(shí)驗(yàn)室開(kāi)發(fā)出的開(kāi)源能效評(píng)估模型CLEER能對(duì)應(yīng)用轉(zhuǎn)移至云端的過(guò)程進(jìn)行節(jié)能分析。CLEER估計(jì),和現(xiàn)有的分布式使用商業(yè)軟件相比,云計(jì)算有可能把現(xiàn)在的能耗降低95%左右。此外,內(nèi)容數(shù)字化也能極大降低能耗。
靈活的云架構(gòu)還能間接優(yōu)化能源利用。比如,數(shù)據(jù)中心中用來(lái)調(diào)整硬件負(fù)載狀態(tài)的技術(shù)還可以用來(lái)調(diào)節(jié)電網(wǎng)頻率,這樣電網(wǎng)就能保持在最優(yōu)頻率上,從而有助于能效在更宏觀層面上的提升。未來(lái)研究人員既需要讓能效解決方案照顧到云計(jì)算系統(tǒng)里的每個(gè)單元,也要讓整個(gè)系統(tǒng)高效運(yùn)行,這樣才能解決云計(jì)算的能耗問(wèn)題,
云計(jì)算也才能讓我們的世界變得更好。