加入收藏 設(shè)為首頁(yè) 聯(lián)系我們 歡迎光臨本網(wǎng)站!
郵箱:support@zcecs.com
地址:北京市西城區(qū)南濱河路27號(hào)貴都國(guó)際中心A座1111室
全球公認(rèn)的Tier標(biāo)準(zhǔn)將數(shù)據(jù)中心的可用性分為四個(gè)等級(jí):
Tier I: 基本容量
Tier II: 冗余容量
Tier III: 可同時(shí)維護(hù)
Tier IV: 容錯(cuò)
目前國(guó)內(nèi)存在一些對(duì)Tier標(biāo)準(zhǔn)錯(cuò)誤、過(guò)時(shí)的認(rèn)知,對(duì)業(yè)主和從業(yè)人員有著不同程度的誤導(dǎo)。
在閱讀本文之前,請(qǐng)所有從業(yè)者務(wù)必了解,Uptime Institute是關(guān)于Tier標(biāo)準(zhǔn)唯一的制定、解釋及認(rèn)證機(jī)構(gòu),Uptime Institute不會(huì)設(shè)計(jì)、建造和操作數(shù)據(jù)中心以確保中立,從而對(duì)數(shù)據(jù)中心的基礎(chǔ)設(shè)施、操作和策略提供中立、客觀、公正的評(píng)估。
以下關(guān)于Tier標(biāo)準(zhǔn)的理解誤區(qū)案例,全部來(lái)自Uptime Institute官網(wǎng)內(nèi)容,作者利用業(yè)余時(shí)間翻譯整理出來(lái),以供國(guó)內(nèi)用戶(hù)和同行學(xué)習(xí)參考,但最終仍以Uptime Institute官網(wǎng)的英文版本為準(zhǔn)。
「理解1」Tier等級(jí)與組織業(yè)務(wù)沒(méi)有關(guān)系
錯(cuò)。Tier從創(chuàng)立開(kāi)始就是基于業(yè)務(wù)驅(qū)動(dòng)而對(duì)其數(shù)據(jù)中心進(jìn)行性能評(píng)估的基準(zhǔn)體系。一個(gè)組織通過(guò)其業(yè)務(wù)對(duì)風(fēng)險(xiǎn)的容忍度來(lái)確定Tier等級(jí)。換句話(huà)說(shuō),一個(gè)公司的業(yè)務(wù)要求決定了其數(shù)據(jù)中心的Tier等級(jí)。如果不根據(jù)自身業(yè)務(wù)的特殊性確定基礎(chǔ)設(shè)施的Tier等級(jí),往往會(huì)發(fā)生濫用Tier等級(jí)和企業(yè)內(nèi)部溝通的被短路等問(wèn)題。
「理解2」Tier IV是最好的
錯(cuò)。一個(gè)企業(yè)組織對(duì)風(fēng)險(xiǎn)的容忍程度決定了Tier等級(jí)。Tier IV并非對(duì)所有組織都是最好的答案,當(dāng)然Tier II也不是。業(yè)主應(yīng)在明確自身的Tier等級(jí)之前做盡職調(diào)查,如果業(yè)務(wù)目標(biāo)沒(méi)有明確就來(lái)確定Tier等級(jí),會(huì)造成不必要的投資。
Tier I和Tier II也是一種常見(jiàn)的戰(zhàn)術(shù)方案,在以成本或速度為導(dǎo)向、不必關(guān)注生命周期成本和性能的業(yè)務(wù)需求中經(jīng)常會(huì)采用。當(dāng)一個(gè)組織的營(yíng)業(yè)收入不需要依靠實(shí)時(shí)交付的產(chǎn)品和服務(wù)時(shí),經(jīng)常會(huì)采用Tier I或Tier II等級(jí)。一般來(lái)說(shuō),采用Tier I或Tier II的組織,是那些依照合約不必對(duì)系統(tǒng)可用性不足引起的損失負(fù)責(zé)的業(yè)務(wù)。
而選擇Tier III和TierIV的數(shù)據(jù)中心,則是對(duì)系統(tǒng)不間斷和長(zhǎng)期可用有嚴(yán)格要求的業(yè)務(wù)。在一個(gè)Tier III的系統(tǒng)中,任何一個(gè)容量組件可以有計(jì)劃地從系統(tǒng)中移除,而不會(huì)影響關(guān)鍵環(huán)境或IT進(jìn)程。Tier IV則更加強(qiáng)悍,任何容量組件和分配路徑可以容忍一次失效、錯(cuò)誤或計(jì)劃外事件,而不影響關(guān)鍵業(yè)務(wù)環(huán)境或IT進(jìn)程。
因此,我們不能說(shuō)Tier IV比TierII好,而是數(shù)據(jù)中心的性能和能力應(yīng)與業(yè)務(wù)需求相匹配。否則要不就是過(guò)度投資,要不就是業(yè)務(wù)要冒更大的風(fēng)險(xiǎn)。
舉個(gè)例子來(lái)說(shuō),在建造一個(gè)Tier II的數(shù)據(jù)中心前,要知道Tier II并不包含可同時(shí)維護(hù)的功能,業(yè)主應(yīng)該清晰的知道自己的業(yè)務(wù)能否容忍一個(gè)計(jì)劃內(nèi)的、或與維修相關(guān)的停機(jī),以及運(yùn)維團(tuán)隊(duì)如何協(xié)調(diào)基于整個(gè)數(shù)據(jù)中心來(lái)進(jìn)行停機(jī)維修。
因此,數(shù)據(jù)中心Tier等級(jí)應(yīng)由其業(yè)務(wù)目標(biāo)來(lái)確定。
「理解3」組件數(shù)量決定Tier等級(jí)
錯(cuò)。Tier認(rèn)證是對(duì)數(shù)據(jù)中心具體基礎(chǔ)設(shè)施的性能做評(píng)估,而不是一份檢測(cè)清單或類(lèi)似于食譜的指導(dǎo)手冊(cè)。不幸的是,一些一知半解的人直接采用“N”來(lái)定義可用性,認(rèn)為N是滿(mǎn)足負(fù)載要求的最小組件數(shù)量,而只要并上更多的組件就提高了可用性,例如N+1,N+2,2N或者2(N+1)。但是,增加組件的數(shù)量并不能決定或保證獲得更高的Tier等級(jí)。因?yàn)門(mén)ier也包含對(duì)分配路徑和其它子系統(tǒng)要素的評(píng)估,而不僅僅是考慮“N”。舉例來(lái)說(shuō),只用N+1的組件數(shù)量也可能達(dá)到Tier IV的等級(jí)。因此,Tier等級(jí)是依靠組件在冗余分配路徑中的配置及連接方式來(lái)決定的,而不是單純依靠設(shè)備的數(shù)量。
「理解4」做Tier認(rèn)證,有設(shè)計(jì)認(rèn)證就行了
錯(cuò)。Tier設(shè)計(jì)認(rèn)證(TCDD)只是一個(gè)Tier等級(jí)認(rèn)證的第一步。在TCDD時(shí),Uptime Institute的專(zhuān)家對(duì)100%完成的設(shè)計(jì)圖紙進(jìn)行審查,確保每一個(gè)電力、暖通、監(jiān)控和自動(dòng)化子系統(tǒng)滿(mǎn)足Tier基礎(chǔ)概念,在整個(gè)系統(tǒng)鏈條上不存在任何弱點(diǎn)。設(shè)計(jì)認(rèn)證可以認(rèn)為是數(shù)據(jù)中心的一個(gè)里程碑,確認(rèn)相應(yīng)的設(shè)計(jì)已經(jīng)達(dá)到的目標(biāo)Tier等級(jí),數(shù)據(jù)中心業(yè)主可以放心開(kāi)始建設(shè)了。
設(shè)計(jì)認(rèn)證(TCDD)將設(shè)計(jì)文檔打包審查,目的是在數(shù)據(jù)中心得到建造認(rèn)證(TCCF)之前做臨時(shí)性的認(rèn)可。Uptime Institute尚未對(duì)此數(shù)據(jù)中心的建設(shè)做審核,所以我們此時(shí)并不能說(shuō)這個(gè)數(shù)據(jù)中心的建設(shè)達(dá)到了Tier等級(jí)。為強(qiáng)調(diào)這一點(diǎn),Uptime Institute對(duì)設(shè)計(jì)認(rèn)證設(shè)置了失效期。所有在2014年1月之后授予的Tier設(shè)計(jì)認(rèn)證都將在兩年之后過(guò)期。
在建造認(rèn)證(TCCF)中,Uptime Institute的專(zhuān)家會(huì)做現(xiàn)場(chǎng)訪問(wèn),找尋圖紙和安裝的設(shè)備是否有差異。專(zhuān)家還將現(xiàn)場(chǎng)觀察測(cè)試和驗(yàn)證,證明系統(tǒng)可以達(dá)到Tier要求。原則上講,建造認(rèn)證才是Tier認(rèn)證的根本,找到系統(tǒng)中真實(shí)存在的盲點(diǎn)和弱點(diǎn)。Uptime Institute的專(zhuān)家表示,幾乎每一個(gè)做建造認(rèn)證的數(shù)據(jù)中心都會(huì)與設(shè)計(jì)認(rèn)證的圖紙存在差異,以至于整個(gè)系統(tǒng)或部分子系統(tǒng)實(shí)際并無(wú)法達(dá)到Tier的要求。
最近,Uptime Institute設(shè)立了Tier運(yùn)維認(rèn)證(TierCertification of Operational Sustainability)來(lái)評(píng)估運(yùn)維人員的操作和管理關(guān)鍵基礎(chǔ)設(shè)施的能力。甚至在很多嚴(yán)格設(shè)計(jì)和建造的數(shù)據(jù)中心中,都因?yàn)槿狈Τ墒斓木C合管理和操作程序而發(fā)生了中斷事故。因此,只有三個(gè)階段都通過(guò)認(rèn)證,數(shù)據(jù)中心的業(yè)主才能真正放心,確保他們的數(shù)據(jù)中心得到最大程度的保護(hù)。
「理解5」Tier等級(jí)可預(yù)測(cè)每年的停機(jī)時(shí)間(Downtime)
錯(cuò)。早在2009年,Uptime Institute就從Tier標(biāo)準(zhǔn)中去掉了相關(guān)“每年停機(jī)時(shí)間預(yù)測(cè)”的參考內(nèi)容。但即使如此,停機(jī)時(shí)間Downtime也從來(lái)不是定義Tier等級(jí)的參數(shù)。在Tier Standard: Topology中規(guī)定,Tier可用性等級(jí)必須對(duì)應(yīng)明確的系統(tǒng)功能結(jié)果,即明確的性能目標(biāo),例如:具有冗余容量、可同時(shí)維護(hù)(通常指系統(tǒng)在計(jì)劃范圍內(nèi),可以移除任何一個(gè)容量組件或分配組件而不影響IT系統(tǒng)運(yùn)行)、或容錯(cuò)(通常指基礎(chǔ)設(shè)施中發(fā)生一個(gè)計(jì)劃外的錯(cuò)誤而不影響IT系統(tǒng)運(yùn)行)。但是,即使是一個(gè)Tier IV的數(shù)據(jù)中心,達(dá)到了容錯(cuò)的級(jí)別,也可能存在因操作和管理問(wèn)題造成停機(jī)的概率。
現(xiàn)在是有數(shù)學(xué)統(tǒng)計(jì)工具可以預(yù)測(cè)失效頻率和恢復(fù)時(shí)間。如果只考慮過(guò)去的正常工作時(shí)間與總時(shí)間的比值,“可用性”就是一個(gè)簡(jiǎn)單的算術(shù)問(wèn)題了。認(rèn)為找到一些數(shù)字、頻率和中斷持續(xù)時(shí)間等參數(shù)就會(huì)推導(dǎo)出所謂的“可用性”結(jié)果。但是,還是小心使用這種統(tǒng)計(jì)工具為妙。因?yàn)樵谶@些數(shù)學(xué)統(tǒng)計(jì)工具中,一般都不會(huì)考慮人的行為影響。此外,我們用統(tǒng)計(jì)百年不遇颶風(fēng)來(lái)舉例:我們是可以得到一個(gè)模糊的颶風(fēng)發(fā)生概率,但同樣有可能一年發(fā)生多個(gè)百年不遇的颶風(fēng)。
「理解6」Tier認(rèn)證只適用于新建數(shù)據(jù)中心
錯(cuò)。Uptime Institute已經(jīng)認(rèn)證了很多已建成的數(shù)據(jù)中心。只是,在帶載的情況下做建造認(rèn)證的測(cè)試程序會(huì)比較有富有挑戰(zhàn)性。對(duì)于一個(gè)已經(jīng)建成的數(shù)據(jù)中心,最好不要上來(lái)直接做設(shè)計(jì)認(rèn)證(TCDD),而是先從TGA(Tier GapAnalysis)開(kāi)始。TGA 將對(duì)數(shù)據(jù)中心設(shè)計(jì)中的不足之處進(jìn)行高標(biāo)準(zhǔn)的概括性審查。這會(huì)給業(yè)主提供足夠的決策依據(jù),是否繼續(xù)進(jìn)行詳細(xì)、徹底的設(shè)計(jì)認(rèn)證(TCDD)工作。建造認(rèn)證(TCCF)是在不同的功率負(fù)載下進(jìn)行性能測(cè)試,可以采用假負(fù)載或?qū)嶋HIT負(fù)載,或混合的方式。
「理解7」Tier標(biāo)準(zhǔn)只是美國(guó)用的標(biāo)準(zhǔn)
錯(cuò)。Uptime Institute已經(jīng)在超過(guò)85個(gè)國(guó)家和地區(qū)交付了Tier認(rèn)證。
并且,Tier標(biāo)準(zhǔn)允許多種方案和各種各樣的配置方法,在設(shè)計(jì)、建造和運(yùn)維上最大程度滿(mǎn)足Tier性能需要與當(dāng)?shù)胤ㄒ?guī)的匹配。時(shí)至今日,Tier標(biāo)準(zhǔn)還沒(méi)有跟任何地區(qū)的建筑法規(guī)、立法章程、司法管轄權(quán)有沖突。
「理解8」TIA-942是Tier標(biāo)準(zhǔn)的具體指導(dǎo)文件
錯(cuò)。在2014年,Uptime Institute與美國(guó)通信協(xié)會(huì)(TIA)達(dá)成一致,雙方開(kāi)始明確區(qū)分各自的基準(zhǔn)體系,以避免行業(yè)混淆、明確界定責(zé)任。也就是說(shuō),TIA關(guān)于數(shù)據(jù)中心的評(píng)估體系中已經(jīng)不被允許再使用“Tier”這個(gè)術(shù)語(yǔ)。
Tier標(biāo)準(zhǔn)的核心目標(biāo)在于為數(shù)據(jù)中心業(yè)主通過(guò)可用性指標(biāo)來(lái)定義其所擁有的數(shù)據(jù)中心的性能水平。相比之下,TIA的會(huì)員單位專(zhuān)家則是專(zhuān)注在如何部署一個(gè)領(lǐng)先的通信網(wǎng)絡(luò)。
「理解9」市電來(lái)源決定Tier等級(jí)
大錯(cuò)特錯(cuò)。依據(jù)Tier Standard: Topology白皮書(shū),數(shù)據(jù)中心唯一可靠的電力來(lái)源是發(fā)電機(jī)組。原因在于市電電力往往受制于計(jì)劃外的中斷,即使在所謂電網(wǎng)可靠的地方。電力回路、變電站、電網(wǎng)的數(shù)量等關(guān)于市電對(duì)數(shù)據(jù)中心供電的參數(shù),都不會(huì)決定和影響數(shù)據(jù)中心Tier等級(jí)?梢哉f(shuō),Tier標(biāo)準(zhǔn)根本不用考慮市電。大部分取得Tier認(rèn)證的數(shù)據(jù)中心把市電作為主要電力來(lái)源的原因僅僅是因?yàn)槭须姷慕?jīng)濟(jì)性,但是市電根本不會(huì)影響Tier等級(jí)目標(biāo)。
「理解10」對(duì)于Tier III和Tier IV,發(fā)電機(jī)必須每時(shí)每刻都在運(yùn)行
錯(cuò)。Tier標(biāo)準(zhǔn)并不需要發(fā)電機(jī)每時(shí)每刻都在運(yùn)行;诔杀竞凸芾碓颍ǔG闆r數(shù)據(jù)中心都是以市電作為主供電。但與此同時(shí),發(fā)電機(jī)組必須正確配置、選型,確保發(fā)電機(jī)組可以無(wú)限制的承擔(dān)關(guān)鍵負(fù)載。因?yàn)樵赥ier標(biāo)準(zhǔn)中,數(shù)據(jù)中心默認(rèn)是由發(fā)電機(jī)組供電。為了達(dá)到Tier要求,必須謹(jǐn)慎配置發(fā)電機(jī)組的容量和配電路徑。