【赛迪网讯】我今天要讲的议题就是如何来做数据的备份。特别是针对医疗系统如何来永久的保存我的数据。实际上EMCLegatu提供了一个全套的信息周期管理的一个软件,这是一个电子邮件系统的一个归档和永久保存的一个软件,右边是一个存储的管理软件,下面是数据的复制和数据分发的一个软件,包含了基于Windows系统对时时的数据进行时时的复制,能够保证在同时有两份数据,这个在证券用得比较多,像华夏证券和银河证券,我们做的就是北京的证券数据时时的复制到上海去。下面是一个智能的数据的管理软件,这个软件在医院里面的PACS系统会用上,我是把磁带库或者光盘库虚拟成一个大的磁盘阵列的一部分。这个就是数据的备份和恢复的软件,这个在人民医院是有用的,所以我会重点讲一下人民医院是如何来用的。这是一个双机的集群管理软件,这个也是在人民医院有的,所以下面我们简单介绍一下。
人民医院系统他是两台数据库共享一个备机来做一个保护,这个是通过AAM的软件来实现1对多的保护。这个都是被备机保护的,任何一台数据库和服务器的停止,都能够时时的把服务切换到备机上去,保证服务的不中断,保证业务的连续性。这里面跑的是微软的软件。这里有一台备份的服务器和一台索尼的磁带库来跑数据的备份,这上面用的就是EMCLegatu的软件来做所有数据的备份。
之所以选择EMCLegatu的软件来做这套系统,是基于以下几个考虑,第一点EMCLegatu的软件是支持操作系统最广的,他可以维持微软的,IBM的等等,当我处在一个双机或者是多机的集群的环境里面的话,当我的生产机突然死机,我的业务会切换到备机上去,这个时候作为磁带备份的服务器,一定要识别到我们这个系统已经做了一个切换,这样他才能继续做数据的备份,如果他不能识别出来,他会告诉你他的备份是失败的。这块目前EMCLegatu是做得最好的。还有一个是专利的一个技术就是一个并行流和一个交叉备份。他是同时从多个客户端的多个数据流备份到一台备份服务器或一个备份节点。他的备份的速度是很快的。我们知道作为备份软件的话,它必须提供各种的备份的级别,这里面我们通常都是三种备份级别,一个是完全备份,第二个是增量备份,第三个是差分备份。完全的备份就是你指定某一个数据,他就把这个数据实在的全部存储到这个磁带里面去,完全备份的时间比较长,他知道是完全备份,他就不会考虑你是增量备还是什么备,他会立即恢复,这是最简单的。增量备份是跟上次备的来比较,这个备份量会比较小,备份的时间也是最少的,但是恢复的复杂度是最大的,假如说星期五突然数据丢失了,首先要恢复星期一的全备份,然后再恢复星期二的增量备份,然后是星期三,星期四,一直恢复到星期五。还有一个就是差分备份,他的备份量比增量备份大,但是比完全备份小。
他就是每次跟全备份来比较,全备份之后的变化数据他每天得做备份,假如说星期五是跟星期一做比较,这样恢复的时候首先你恢复星期一全备份,然后再恢复星期五的一个差分备份,两次就可以恢复过来。这种策略如何选定,我们会介绍一下人民医院我们是如何来运用这种策略的。
还有一个就是合并的备份,第一天我做了一个全备份,第二天做了一个增量备份,第三天又做了一个增量备份,我希望在第三天得到一个全备份,它可以把第一天的全备份,第二天的增量备份,第三天的增量备份都提出来,做成一个星期三的全备份。这个是由服务器独立完成的,跟应用系统没有任何的关系,所以应用系统只是做的一个增量备份,但是通过服务器可以做成一个新的全备份,这样会比较方便。
这就是人民医院采用的备份策略,主要是基于第一点人民医院所有的数据都需要做永久的保存,至少是20年要保存下来,因为有些病人可能要查用这些数据。第二个,我的磁带量是有限的,因为现在购买的话只购买了24盘索尼的磁带,这24盘要保证一年的使用。第三个,我所有这些数据我都要做一个永久保存。所以这几点的话是在医院里面的需求,为了实现这种需求,我就不能做一个简单的备份策略,否则的话,第一点是否能够永久保存是一个问号,第二点磁带是不是够用,也是一个问号。如果说24盘磁带要用一年,那么我们一个月只能是两盘磁带的一个量。如果超过2盘磁带,那么我们这个备份策略就失败了,就超过了我们的容量。那么我们设计的是星期五都做全备份,其他时间都做增量备份,那么我们一算磁带容量不够,后来我们就考虑两周做一次全备份,然后在星期三的时候做一次差分备份,其他时间都做增量备份。可以看到两周之内我们是有一个全备份,第二个两周又是一个重复的过程,所以只要看到两周的备份策略就可以了。我们在星期三做差分备份,主要是基于恢复的考虑,如果两周只做一个全备份,而其他时间都做增量备份的话,如果这天数据丢失,我要恢复多少个增量备份,我要恢复十几个增量备份,这个复杂度是很大,并且恢复的时间也相当的漫长。这是我们所不允许的,因为一旦系统出现灾难的话,你不可能说给我4、5个小时来恢复数据。所以我们要尽量保证我们磁带的可用,同时要保证我的恢复能够尽量的快。
所以我们在星期三加了一个差分备份。这样当我这一天丢失数据的时候,我只需要恢复周五的全备份,然后再恢复周一的差分备份,再恢复周二和周三的增量备份,这样我一个月2盘磁带就够用了。
还有一个问题就是数据要永久保存,这样带来一个备份将来20年后会达到一个什么样的量。我们在做备份系统的时候一定要考虑,如果说我的所有文件将来越来越大的时候,本身服务器带的这个磁盘空间不够大的时候,如何来承担这个备份,一旦我所有的备份丢失的话,我所有的备份都无效了,因为我不知道哪个磁带是备份那个数据。那么如何来解决这个问题,这个问题也就是当初为什么要选EMC的一个很重要的一个因素。现在目前世界上只有EMC的Legatu能实现备份是两套,这样就很好的解决了我的磁盘空间不够的一个状况。大约备份缩影是我备份量的5%的一个容量。人民医院全备份所有的数据是50个G的数据,我乘以2,加上一年12个月,再存上20年,再乘以5%。如果说我的数据真的要保持20年,我的备份数据是很大的,那么如何来解决这个问题?EMC有两套备份,一套是放在备份的服务器上的,一套是放在磁带上的,第一个放在备份服务器硬盘上的这个文件缩影,只保留一年。一年之后这个缩影将从硬盘上删除掉,但是这个索引,但是这个索引他会有另外一个介质索引,他所有的数据将来你要保存一年之后不会在磁带里面找到索引,将来20年后我要找我的数据,因为我每次把磁带取出来的时候都会有标签,这个磁带是从多少时间到多少时间的,所以多少年之后我要找2004年5月1号的数据,这个磁带上会有一个标签,把这个磁带盒拿出来,通过EMCLegatu的软件,恢复到硬盘上去,然后可以看到这个磁带里面备份了哪些问题,我可以看看我需要备份那个文件,你可以选择。所以他是把索引分散到每个磁带上去,这样便于永久保存,而这种功能是只有EMCLegatu才拥有的。所有的备份软件都只有一套备份索引。即使我的备份服务器上的索引全部丢失了,没有关系,通过磁带一样可以恢复出来。
还有一个就是数据恢复和查询,我的数据要恢复到一个第三方的机器上面,我要做一个数据的查询,或者验证一下备份是不是可以恢复,这个时候Legatu可以进行选择。那么以上就是Legatu的一些优点。由于时间的关系,谢谢大家坚持到最后。谢谢大家!