单位:中国建设银行深圳市分行某部
服务器型号:ibm 3631服务器, SCSI 9.1G 硬盘共10块盘
阵列级别:RAID5
操作系统:windows 2000 server 分区类型:NTFS
故障现象:
服务器担负整个BusinessObject系统(全球著名的商务智能解决方案供应商BusinessObject公司,专注于金融系统)的运行,2007年10月18号例行检查时发现阵列柜上2个盘报警,当时找到该系统的系统集成供应商,来解决无果的情况下,客户找到我们公司,在电话中初步了解了情况,工程师即赴现场帮助客户解决问题,到达现场后,部门领导和工程师详谈出问题的经过,在达成一致的认识后,进入建行计算机运行中心。
建行的工作人员标好盘序,把10块盘插到另一台同型号的服务器本上,结果还是一样。等插回到本机上时,8块全部亮红灯报错了。还有客户只是在客户端使用根本就不知道分区大小,阵列级别等的情况。工程师在对所有的硬盘做镜像后从底层分析物理扇区分布情况,发现10块硬盘里面做了4组阵列 0,1号两个盘组成的raid1,2,3,4,5,6,7这六块盘的阵列级别不是很明显,8,9号盘又是组的RAID1。很快2组raid1就找出来了,但是怎么在什么都不知道情况把2,3,4,5,6,7这六块盘通过分析找处阵列级别呢?经过半个小时的分析,原来这六块盘做的是是2组raid5,2,3,4号盘这三个盘组的一组RAID5,5,6,7号这3个盘又组的另外一组RAID5, 前后包括准备环境,镜像,分析扇区,导出数据,搭建环境验证数据,直到银行BO系统全部应用起来花了一天多时间。