加入收藏 設(shè)為首頁 聯(lián)系我們 歡迎光臨本網(wǎng)站!
郵箱:support@zcecs.com
地址:北京市西城區(qū)南濱河路27號貴都國際中心A座1111室
如今的數(shù)據(jù)中心運營和管理變得越來越復(fù)雜,這已經(jīng)不是什么秘密。數(shù)據(jù)中心具有更多類型的硬件和管理軟件,更改工作負(fù)載更加頻繁。隨著公共云的應(yīng)用日益廣泛,以及邊緣計算即將來臨,數(shù)據(jù)中心的事務(wù)將變得更加復(fù)雜。
許多業(yè)界人士都希望采用機器學(xué)習(xí),讓數(shù)據(jù)中心管理人員可以更加輕松地應(yīng)對復(fù)雜的事務(wù)。一些廠商已經(jīng)推出了采用機器學(xué)習(xí)算法的數(shù)據(jù)中心管理軟件。有些軟件從數(shù)據(jù)中心和計算機的整體角度來解決問題,而其他軟件則專注于優(yōu)化冷卻設(shè)施或電源。雖然冷卻系統(tǒng)是當(dāng)今數(shù)據(jù)中心設(shè)施的主要能耗大戶,但將智能軟件工具應(yīng)用于數(shù)據(jù)中心電氣設(shè)備管理還有很多工作要做。
一家名為Virtual Power Systems(VPS)的初創(chuàng)公司正在使用機器學(xué)習(xí)來解決數(shù)據(jù)中心電力中斷問題。數(shù)據(jù)中心通常擁有冗余的后備電源系統(tǒng),以確保電力中斷時為負(fù)載提供不間斷電源,而設(shè)計人員無法預(yù)測將在何時使用這種設(shè)施。
VPS公司推出的“軟件定義電源”解決方案使用智能電氣硬件(包括施耐德電氣等合作伙伴的設(shè)備)和內(nèi)置電池,可以在整個數(shù)據(jù)中心內(nèi)更有效地重新分配電源。該公司表示,隨著用戶需求的變化,它可以動態(tài)地完成部署。
該軟件名為ICE,它使用機器學(xué)習(xí)功能進行電源需求預(yù)測(其中包括電池管理和電源峰值概率),并將配置文件發(fā)送到數(shù)據(jù)中心IT設(shè)備硬件中運行的推理引擎,然后推理引擎調(diào)整電力負(fù)載的效率。能夠根據(jù)實際需要對每個機架進行調(diào)整。
“當(dāng)用戶擁有冗余的基礎(chǔ)設(shè)施時,通常為機架設(shè)備提供兩條不同電力來源的線路,以防止萬一發(fā)生故障,可以將負(fù)載設(shè)備切換到另一條線路。”VPS公司首席技術(shù)官Karimulla Shaikh說,“這意味著用戶的每條電力線路最多只能承載50%的負(fù)載容量。通過使用智能開關(guān),可以為100%的負(fù)載提供電力。如果發(fā)生故障,它可以立即切換,并將所有負(fù)載切換到UPS電源,然后使用我們的軟件將應(yīng)用程序轉(zhuǎn)移到別處或使部分工作負(fù)載脫機。”
由軟件構(gòu)建的機器學(xué)習(xí)模型也可以用作模擬器,以了解如果添加更多服務(wù)器或機架設(shè)備對電源傳輸?shù)挠绊憽?/p>
Shaikh表示,但這只是一個開始。VPS公司正在與一些客戶合作,研究如何避免傳統(tǒng)的冗余數(shù)據(jù)中心基礎(chǔ)設(shè)施設(shè)計,并關(guān)注數(shù)據(jù)中心能源之間的動態(tài)切換,例如公用事業(yè)、燃料電池和間歇性可再生能源。
Nlyte Software公司首席戰(zhàn)略官Enzo Greco將其數(shù)據(jù)中心基礎(chǔ)設(shè)施管理(DCIM)軟件比喻為“數(shù)據(jù)中心的實時ERP(企業(yè)資源規(guī)劃)”,最近采用IBM公司沃森機器學(xué)習(xí)服務(wù)的解決方案增加了預(yù)測性熱量和電源管理功能。沃森可以幫助建立基于傳感器、設(shè)備和應(yīng)用程序工作負(fù)載信息的模型。Greco表示,在許多情況下,收集所有數(shù)據(jù)已經(jīng)變得相當(dāng)容易,那么為什么不利用它來獲得更多優(yōu)勢呢?
許多設(shè)備都具有溫度和濕度傳感器,實時提供服務(wù)器數(shù)據(jù)和電源數(shù)據(jù)。Greco說:“無論是UPS還是PDU,這些數(shù)據(jù)都可以從現(xiàn)代設(shè)備中獲得。”機器學(xué)習(xí)系統(tǒng)可以發(fā)現(xiàn)不同系統(tǒng)和端點之間的隱藏模式和相互作用。
“我們能夠預(yù)測任何時候的服務(wù)器和機架級別的電源異常。”Greco說,“在穩(wěn)定狀態(tài)下,機架設(shè)備可能消耗10kW的功率,但在某些時候,它可能會達(dá)到15kW。有了足夠的歷史數(shù)據(jù),用戶就可以預(yù)測機架設(shè)備何時消耗15kW的電源。負(fù)載高峰可能是在批處理模式下運行負(fù)載,或者可能是交易系統(tǒng)正在高峰運行。”
他說,如果可以預(yù)測負(fù)載高峰,就可以通過減少或轉(zhuǎn)移工作負(fù)載,關(guān)閉服務(wù)器,或?qū)PS電池進行一些預(yù)防性維護來做好準(zhǔn)備。
Nlyte公司大多數(shù)的客戶都在使用機器學(xué)習(xí)系統(tǒng)來獲取警報,并了解潛在的問題區(qū)域。該軟件公司還在開發(fā)預(yù)測故障和預(yù)防性維護模塊。“功率和熱量是預(yù)測故障的非常好的指標(biāo)。”Greco說,“如果可以預(yù)測電力異常,那可能就是這些主要指標(biāo)的應(yīng)用問題,或者可能發(fā)生機械問題。”
除了檢測異常比工作人員更快之外,機器學(xué)習(xí)還可以幫助工作人員更清楚地了解其設(shè)施中電氣基礎(chǔ)設(shè)施的冗余情況。Uptime Institute公司研究副總裁Rhonda Ascierto表示,“這將確保數(shù)據(jù)中心設(shè)施按照用戶預(yù)期的冗余配置進行操作,盡管這些設(shè)施的性質(zhì)在不斷變化。”
采用機器學(xué)習(xí)有可能將數(shù)據(jù)中心可用性策略從被動變?yōu)橹鲃印?ldquo;UPS電源是一種反應(yīng)性設(shè)備,需要一直等到電源發(fā)生故障,然后將故障轉(zhuǎn)移。”他解釋說,“UPS電源在電力中斷之后快速反應(yīng),這是被動的。而積極主動意味著不再等待,也就是說與其將來遇到問題,不如現(xiàn)在解決。”