重复数据删除技术重新定义BuRA
信息爆炸式增长让CIO们面临挑战。作为全球信息管理解决方案的领导者,EMC不断推出新技术、新产品,帮助CIO们应对这些挑战。纵观EMC当前的技术和产品,归档和重复数据删除是它应对信息爆炸的两大绝招。这里,我们介绍它的第二招:重复数据删除。
重复数据删除技术重新定义BuRA
2007年,数字宇宙的信息量达到2810亿GB,到2011年,数字宇宙的信息量将达到18000亿GB,比2006年增长10倍。如此庞大的数字信息中,70%由个人创造,然而其中有85%的信息,企业需要负责其安全性、隐私、可靠性和法规遵从等。如何迎接信息爆炸式增长带来的管理挑战,是CIO们不得不面对的问题。
大禹治水 堵不如疏
五千年来,大禹一直是中华民族心中的治水英雄。相比之下,另一个鲜为人知的事情是,大禹的父亲因为治水不力被舜斩杀。大禹的治水方法就是"开渠排水、疏通河道";而他父亲的办法只是一味筑高水渠,水渠一旦溃坝,会造成更大的水灾。
当前,信息管理出现了同样的情形。过去,我们曾经将磁带、光盘称为海量存储,因为可以在系统之外不断增加磁带和光盘。但是,根据IDC的数据,目前数字宇宙的年复合增长率是60%,而存储容量增长的速度只有35%左右。很快就会出现存储容量缺口,我们能够提供的存储容量,包括磁盘、磁带、光盘、闪存和内存等,所有介质容量加起来,都不足以保存我们所创建和复制的所有信息。
除了容量问题,在操作上也存在问题。以数据备份而言,客户对于备份窗口的要求很高。要备份的数据越来越多,备份窗口不足(无法在允许的时间内备份完所有数据),但是,IT系统不可能停机备份数据从而影响到关键业务应用,服务级别不能降低。
同时,IDC还发现,存储容量越来越大,存储介质的生命周期却越来越短。我们可以阅读几千前的石刻或烧陶文字、一千年以前的活字印刷,可以看100年以前的缩微胶片,但我们恐怕已经无法读取30年前的8磁道磁带、20年前的软盘、10年前VHS磁带。数字记录媒体的寿命因为介质退化、回放装置淘汰,根本无法跟石头和纸张相比拟。有鉴于此,美国国家媒体实验建议的方案就是每10-20年将数字记录转录到新的介质上。除非这些数字记录管理有序,否则这将是一个异常艰巨的任务。
如何做到管理有序?磁带和光盘肯定不是好的选择。磁带对物理环境温度、湿度要求高,容易粘连,磁带时间久了还会自行消磁;光盘驱动器三年更新一代,我们保存了15年的数据,可能已经没有可以读取数据的光驱,光盘本身也不是非常可靠。此外,大量产生的磁带和光盘,空间占用非常可观,查找也相当困难。磁盘在性能上有优越性,但尽管磁盘价格不断下降,仍然不可能像磁带和光盘那样海量供应。重复数据删除技术的产生,让数据量大大降低,为磁盘存储带来了革命性的解决之道。