· 每日国外媒体IT头条摘要
· 世界IT名刊 精彩报道
· 高端访谈 见证展望IT业
· 非典型评论 观点犀利精辟
 赛迪网 > 资讯中心 中国计算机报 > 文章
  IT资讯搜索
 
IT产品搜索

800万元:一次疏忽的代价(图) (1)

发布时间:2008.01.08 16:31     来源:赛迪网-中国计算机报    作者:孙翊威 洪俊峰

【赛迪网讯】A集团是全球知名的成衣制造商。一个偶然机会,我进入其在广东某地的分厂。分厂承担着整个集团的辅料生产任务。在信息化建设方面,A集团紧跟时代脚步,一套辅料生产MIS系统支撑着辅料厂的全部日常业务运行。如果这个MIS系统停止一个小时,那么直接损失将在200万元左右。

我的任务重复而简单。每日早上9点到公司对磁带机磁带进行更换。由于当时我对服务器没有管理权限,因此对服务器的检查仅限于观察各个信号灯(红灯是故障,绿灯是正常,黄灯是正在读写操作或者初始化)是否正常。服务器维护由集团系统维护人员每周一通过PC Anywhere远程连接检查。就这样,我的维护工作平淡无奇地持续了半年,直到有一天出了问题。

三次尝试均告失败

那天,当我像往常一样将目光扫向服务器时,红色的灯光映入眼帘,而且还是两个。仔细看去,红灯亮在RAID5的位置,两个红灯代表三个磁盘中的两个出现了故障。我心里开始有点紧张。按规定我应先打电话通知直接主管。我想昨天的数据还在,即使硬盘损坏,采用手工补单的方式也可以找回丢失的数据。我按步骤检查服务器硬件是否真的损坏。重新启动服务器,结果故障依旧。根据售后条款确认服务器还处于硬件商的服务周期内,我马上拨打电话寻求技术支持。他们根据我的现象描述提供了电话远程支持。我按提示进行操作。

数据备份和恢复是企业贯穿全年的常规工作

打开磁盘阵列柜,再次启动服务器。进入NetRaid管理程序查看阵列信息,发现硬盘ID0与硬盘ID2状态为Failed,运用修改配置将硬盘ID0强制Online,重新启动服务器。在进入NT前的硬件自检时,出现硬盘ID2、ID0依次闪红灯,访问D盘失败。第一次尝试失败。接着进行第二次尝试。打开磁盘阵列柜,启动服务器。进入NetRaid管理程序选择磁盘阵列,将阵列配置信息清空,然后新建磁盘阵列信息(不作初始化),并将硬盘ID2与ID0强制Online后,重新启动服务器,在进入NT前的硬件自检时,问题依旧。尝试访问D盘再次以失败结束。

事不过三,我打算做最后一次努力。关闭磁盘阵列柜,将磁盘阵列柜上的所有3块硬盘全部拔除,启动服务器,正常进入NT。打开磁盘阵列柜用NetRaid管理软件,将硬盘ID0、ID1、ID2,进行热插拔,但进行至硬盘ID0、ID2时,软件检测不到硬盘。到这个时候我们意识到RAID5受到了最致命的损坏,而且是两块硬盘同时出现故障。此时,惟一的选择就是启动IT处理应急方案。我立即启用备用服务器。因为备用机的数据库没有数据,需要将磁带机的备份数据导入。在场的同事随即着手准备恢复最近一次磁带机的备份数据。

45天没有备份数据

“不对啊!”负责将备份数据导入服务器的同事一声惊呼让大家的神经紧张了起来。“数据恢复过来的时间不对,怎么是一个半月前的数据?”几双眼睛仔仔细细地把恢复好的数据察了一遍。的确是一个半月前的数据。现在大家已经没有心思去追究这个问题。我重新复查了一遍,经过详细检查15盒磁带的内容,发现最近有效数据的的确确是一个半月前的。随后检查服务器的备份机制,结果发现服务器的自动备份工作自一个半月前就停止了。汗,开始往外冒!

随后,启动第二步应急方案:恢复硬盘数据。分厂领导和IT经理带上服务器驱车20多公里连夜赶到省城。联系一家专业数据恢复公司。但是为时已晚。由于已经按照800电话的技术指导做过Rebuild,硬盘上的数据无法再恢复。最后得到的结果是,在NT4系统里能看到所有文件名,但所有文件大小全为0K。知道这是一种什么感觉吗?这就像一个即将被洪水没顶的人,向空中张着的双手摸到了一根以为是“救命稻草”的真稻草。生的希望在瞬间又消逝了。想有感觉但来不及有感觉。

就在服务器送去抢救的第二天,厂里决定采用手工输入的方式恢复丢失的数据。一时间,全厂通宵达旦,人人加班。这阵势是建厂来少见的。加班加了3个周末我们才将丢失了一个半月的数据全部补齐。

1 2 下一页>>


[ 发表评论 ] 字体[  ] [ 打印 ] [ 进入博客 ] [ 进入论坛 ]  [ 推荐给朋友 ]
  相关文章
  客户需求反馈表
* 姓  名:
更多资料 了解方案 认识厂商
* 单位名称:
* 联系电话:
* 电子邮件:
  赛迪推荐  
  IT产品 ·笔记本·台式机·服务器·打印·投影
IT产品搜索 
  IT技术 ·开发·网管·安全·数据库·操作系统
  博客·论坛 ·曾剑秋·项立刚·Java学习·网管