數(shù)據(jù)備份 目前存儲(chǔ)管理中最重要的操作
對(duì)于許多企業(yè)的IT網(wǎng)管來(lái)說(shuō),數(shù)據(jù)的備份/恢復(fù)仍是目前存儲(chǔ)管理中最令人頭疼的操作。每天,接近三分之二的時(shí)間與精力用于應(yīng)付失敗的備份操作和解決磁帶及其他媒介的錯(cuò)誤。讓我們來(lái)回顧一下備份/恢復(fù)發(fā)展的歷史,也許會(huì)對(duì)解決IT管理員們的這一煩惱有所幫助。
上世紀(jì)70年代,IT革命處于萌芽階段。那時(shí)的數(shù)據(jù)量很小,通常只有幾十兆到幾百兆。當(dāng)時(shí)的硬盤(pán)成本更是接近天價(jià),每兆硬盤(pán)空間的售價(jià)超過(guò)了3000美元,購(gòu)買(mǎi)一個(gè)容量小于10兆的硬盤(pán)所需的費(fèi)用,甚至超過(guò)了一個(gè)系統(tǒng)程序員全年的工資。另一方面,基于硬盤(pán)的存儲(chǔ)技術(shù)卻還剛剛起步?;谏鲜鲈?,當(dāng)初進(jìn)行備份/恢復(fù)操作時(shí),往往采用磁帶作為備份介質(zhì)。
基于磁帶的“備份/恢復(fù)”面臨的問(wèn)題
進(jìn)入21世紀(jì)的海量數(shù)據(jù)時(shí)代,與30年前相比,數(shù)據(jù)量已經(jīng)從幾十、幾百兆增長(zhǎng)至幾千TB;而且由于數(shù)據(jù)備份和恢復(fù)操作幾乎是貫穿全年的例行工作(Routine Job),如果現(xiàn)在仍然以磁帶作為最基本的備份介質(zhì),不僅會(huì)耗費(fèi)管理員大量的時(shí)間和精力,同時(shí)也會(huì)產(chǎn)生諸多問(wèn)題。主要表現(xiàn)在以下幾方面:
工作量巨大
數(shù)據(jù)備份和恢復(fù)操作貫穿全年365天
備份/恢復(fù)的工作量占整個(gè)存儲(chǔ)管理的60%-70%
數(shù)據(jù)很難有效恢復(fù)
由于備份窗口或介質(zhì)失效等原因,備份作業(yè)的成功率只有70%左右
恢復(fù)時(shí)間太長(zhǎng),從磁帶中恢復(fù)單個(gè)文件往往要花費(fèi)幾個(gè)小時(shí)甚至1天
本質(zhì)上是一項(xiàng)“體力活”
磁帶庫(kù)內(nèi)磁帶的循環(huán)更新,將磁帶拿進(jìn)取出,不可避免仍需要大量人工干預(yù)
進(jìn)行離場(chǎng)保護(hù)時(shí),大量磁帶在數(shù)據(jù)中心和異地之間的來(lái)回運(yùn)輸,需要耗費(fèi)大量的人力
“一體化數(shù)據(jù)保護(hù)”是解決問(wèn)題的最佳途徑
好在時(shí)至今日,隨著數(shù)據(jù)量的成倍增長(zhǎng),計(jì)算機(jī)技術(shù)也有了突飛猛進(jìn)。硬件尤其是硬盤(pán)的價(jià)格與早期相比有了大幅下降,不斷刷新的硬盤(pán)容量也令人驚喜。基于磁盤(pán)的存儲(chǔ)新技術(shù)(如快照、鏡象等)日益涌現(xiàn)。調(diào)查顯示,目前超過(guò)80%的恢復(fù)請(qǐng)求是在數(shù)據(jù)丟失后48小時(shí)內(nèi)提出的,這意味著恢復(fù)速度更快的基于磁盤(pán)的存儲(chǔ)技術(shù)開(kāi)始成為主流。而由于磁帶在某些方面仍具有不可取代的優(yōu)勢(shì),如價(jià)格低廉、適合數(shù)據(jù)的長(zhǎng)久保留等,因此采用以磁盤(pán)和磁帶技術(shù)相結(jié)合的所謂“一體化數(shù)據(jù)保護(hù)”方案,成為很多企業(yè)在進(jìn)行數(shù)據(jù)保護(hù)時(shí)的最佳做法。實(shí)施步驟見(jiàn)下圖:
下面,我們對(duì)上圖中的每一模塊進(jìn)行詳細(xì)解釋。
本地鏡象(快速恢復(fù)卷):
在某一時(shí)間點(diǎn),對(duì)生產(chǎn)數(shù)據(jù)進(jìn)行同步,然后斷開(kāi),以保留生產(chǎn)數(shù)據(jù)在該時(shí)間點(diǎn)的靜止?fàn)顟B(tài)
用于對(duì)保留期內(nèi)整個(gè)數(shù)據(jù)的快速恢復(fù)
一天可做一次或若干次本地快速恢復(fù)卷,保留24小時(shí)
磁盤(pán)消耗量高(100%)
對(duì)應(yīng)用影響較大
數(shù)據(jù)快照:
采用Copy-on-Write的方法保留與前一基準(zhǔn)點(diǎn)相比已變化的數(shù)據(jù)
基準(zhǔn)點(diǎn)數(shù)據(jù)出現(xiàn)問(wèn)題就無(wú)法使用
用于保留期內(nèi)對(duì)少量數(shù)據(jù)的快速恢復(fù)
使用頻率較高, 例如:每2小時(shí)快照一次,常保留24—48小時(shí)
磁盤(pán)消耗量較低(5%-20%)
對(duì)應(yīng)用影響較小
異地鏡象:
對(duì)生產(chǎn)數(shù)據(jù)的100%異地鏡像
對(duì)由于邏輯錯(cuò)誤而丟失的數(shù)據(jù)沒(méi)有保護(hù)作用
常用于對(duì)生產(chǎn)站點(diǎn)的容災(zāi)保護(hù)
采用連續(xù)復(fù)制以保持與生產(chǎn)數(shù)據(jù)一致
同步復(fù)制方式
異步復(fù)制方式
近線存儲(chǔ):
用于對(duì)生產(chǎn)數(shù)據(jù)進(jìn)行備份
常采用廉價(jià)的ATA/SATA磁盤(pán)陣列作為備份設(shè)備,以提高速度和可靠性
通常數(shù)據(jù)保留時(shí)間為1周-1個(gè)月,然后,被遷至磁帶庫(kù)作更長(zhǎng)時(shí)間的保留或歸檔
磁帶庫(kù):
磁帶是數(shù)據(jù)長(zhǎng)久保留/歸檔的最佳選擇
磁帶上的數(shù)據(jù)往往被視為數(shù)據(jù)保護(hù)的最后防線
由于磁帶可以在物理上與生產(chǎn)系統(tǒng)脫離,磁帶可以用于數(shù)據(jù)離場(chǎng)保護(hù)
磁帶存儲(chǔ)成本仍然是最低的
某世界著名的大型石油公司的“一體化數(shù)據(jù)保護(hù)”做法就很值得借鑒:每天上午8點(diǎn),對(duì)重要的SAP數(shù)據(jù)做一次“克隆”,產(chǎn)生本地鏡象;之后每隔4小時(shí)對(duì)數(shù)據(jù)變化量進(jìn)行快照,每個(gè)快照保留48小時(shí)。每天晚上12點(diǎn),將快照中的數(shù)據(jù)備份到近線存儲(chǔ)設(shè)備,保留兩周。兩周后,將數(shù)據(jù)拷貝到磁帶庫(kù)中保留一年。磁帶庫(kù)中的數(shù)據(jù)同時(shí)復(fù)制有多個(gè)副本,其中一個(gè)數(shù)據(jù)副本作離場(chǎng)保護(hù),妥善保管到異地的倉(cāng)庫(kù)或辦公室。與此同時(shí),這些數(shù)據(jù)也采用復(fù)制的方式產(chǎn)生異地鏡象,以實(shí)現(xiàn)容災(zāi)保護(hù)。 #p#page_title#e#
可想而知,在上述“一體化數(shù)據(jù)保護(hù)”措施的周密保全下,該公司面對(duì)各種情況下的數(shù)據(jù)丟失都能從容應(yīng)對(duì):若需要恢復(fù)48小時(shí)內(nèi)丟失的數(shù)據(jù),可從本地鏡象和快照中恢復(fù);若需恢復(fù)兩周內(nèi)遺失的數(shù)據(jù),可從近線存儲(chǔ)設(shè)備中恢復(fù);而兩周以后的數(shù)據(jù)則可以從磁帶庫(kù)中進(jìn)行恢復(fù);萬(wàn)一發(fā)生了火災(zāi)或類(lèi)似“9.11”之類(lèi)的大型災(zāi)難,也不必驚慌失措,則可以切換到容災(zāi)點(diǎn)(異地鏡象),也可以從離場(chǎng)保護(hù)的磁帶副本中恢復(fù)所有數(shù)據(jù)。
CommVault能幫助客戶(hù)更好地實(shí)現(xiàn)“一體化數(shù)據(jù)保護(hù)”
上面提到的例子生動(dòng)地展示了“一體化數(shù)據(jù)保護(hù)”的顯著優(yōu)勢(shì)。然而真正實(shí)施起來(lái)卻是非常困難的。原因在于,上面提到的所謂數(shù)據(jù)復(fù)制(異地鏡象)、數(shù)據(jù)克隆、數(shù)據(jù)快照等技術(shù)都依賴(lài)于磁盤(pán)硬件,所以不同的廠商就會(huì)有不同的實(shí)現(xiàn)方式,使得用戶(hù)使用起來(lái)非常困難——要求IT管理員必須同時(shí)掌握多種管理軟件,在不同的操作界面中來(lái)回切換,而且需要大量的手工操作(比如編寫(xiě)腳本)來(lái)實(shí)現(xiàn)多種技術(shù)的協(xié)同工作,因此不僅大大增加了使用成本,同時(shí)也非常容易出錯(cuò)。
美國(guó)慷孚系統(tǒng)公司(CommVault Systems Inc.)一直以來(lái)致力于研究如何有效地進(jìn)行數(shù)據(jù)管理,它的“統(tǒng)一數(shù)據(jù)管理”平臺(tái)為真正實(shí)現(xiàn)“一體化數(shù)據(jù)保護(hù)”提供了有效的解決方案。通過(guò)CommVault的“統(tǒng)一數(shù)據(jù)管理”平臺(tái),在一個(gè)單一的圖形化管理界面中,用戶(hù)只需要針對(duì)所需要的各種數(shù)據(jù)副本,包括本地鏡象、數(shù)據(jù)快照、異地鏡象、數(shù)據(jù)備份等制定相應(yīng)的策略(如存放在什么設(shè)備上、保留多久、何時(shí)存放等),CommVault的軟件會(huì)自動(dòng)地協(xié)調(diào)相應(yīng)的硬件設(shè)備進(jìn)行工作,真正實(shí)現(xiàn)完美的“一體化數(shù)據(jù)保護(hù)”。