博客网 >

使用dd命令恢复集群节点系统盘
作者:分类:默认分类标签:
使用dd命令恢复集群节点系统盘
 
  前一段时间,刚刚从IBM购入的集群系统的35号节点node035出现了系统无法启动的状况。这个集群系统是搭建在RedHat Linux 9.0平台,使用XCAT软件包管理。一旦某个节点出现了系统盘数据损坏,从而造成无法启动的情况,可以采用硬盘分区克隆的方法,然后稍加改动,即可恢复正常。
  一、同时挂接正常节点(node064)的硬盘和node035的硬盘到某个微机上(ibm05)上,准备把node064的根分区和/boot分区克隆到node035的相应分区。费了七牛八虎之力,在ibm05上挂了这两个外来盘,这下把ibm05可累坏了,共挂了4块盘。
  1,两块硬盘都是宽口SCSI盘,要挂在ibm05上,需要用转接卡和四个跳线帽。在转接卡上把ID分别设置为ID2和ID3(原机中有一块盘占用了ID1);另在磁盘背面设置跳线如下:


  保证系统不从这两块盘引导,注意:在安装到原节点的时候,把跳线帽拿掉即可。
  2,在启动时,按Ctrl+A,检测到SCSI盘如下(注意在BIOS的启动选项中把ibm05自身的系统盘设置为0号位置。)
  a,原机系统盘:SCSI ID #0 IBM-ESXS MAP3367NP FN
  b,原机数据盘:SCSI ID #2 SEAGATE ST136403LC
  c,node035磁盘:SCSI ID #4 IBM-ESXS ST3146807LC FN
  d,node064磁盘:SCSI-ID #12 IBM-ESXS ST3146807LC FN
  注意:其实这一步这样做挺麻烦,完全可以把node035的盘插放到node064的另一个空闲的磁盘插槽 ,但是为了不给娇贵的集群节点带来麻烦,所以放到了比较强壮的台式机上。
  二、启动机器,查看磁盘。
  fdisk –l
  发现四块磁盘,分别为sda、sdb、sdc、sdd;
  为了确认sdc和sdd到底是哪块盘,把标签上写有node064的那块盘单独挂载,启动后,在其第二个分区/dev/sdd2里建了一个目录作为标记。重启动后,确认四块盘为:
  /dev/sda:原机的系统盘;
  /dev/sdb:原机的数据盘;
  /dev/sdc:node035的磁盘;
  /dev/sdd:node064的磁盘。
  且/dev/sdd7为根分区;/dev/sdd1为/boot分区。
  这样,就考虑把/dev/sdd中的相应分区克隆到/dev/sdc上即可。
  三、克隆相应分区。
  根据事后经验,做两个dd就可以了。
  dd if=/dev/sdd1 of=/dev/sdc1 bs=512k
  dd if=/dev/sdd7 of=/dev/sdc7 bs=512k
  注意,如果在dd过程中出现I/O错误,别担心。删掉这个分区,重新分区即可。但是,一定要保证系统重启动一下才行。然后,再执行dd就应该可以了。
  四、更改系统文件。
  以为直接用node035就可以启动系统了,大错特错了。显示错误如下:
  Error: /bin/insmod exited abnormally!
因为这两块盘都是属于集群系统中的节点的,启动并不完全归属于自身,而是要受管理节点(mgmt)的支配和扶持。所以要插放到集群的节点上才能够看出是否能够启动。
  放到节点上启动后,终于出现了分外可爱的红帽子系统。但是,在mount文件系统的过程中,显示:
  Could not find matching filesystem: LABEL=/sw
  Give root password for maintenance
  (or type Control+D to continue):
  哦,原来dd时曾经取消了/sw分区(/dev/sdd2)的克隆过程,并重新分区了,当然找不到那个卷标为/sw的文件系统了。于是,在/etc/fstab中,把/sw那行的卷标去掉了。再重启,不出这个问题了。
  接下来,更该了ip地址:
  Ifconfig eth0 192.168.0.35
  把node064的/etc/fstab拷贝过来,据此逐一建立了原本没有的目录,用于mount管理节点和I/O节点的文件系统。
  在此启动,文件系统都正常挂载了。
  五、更该hostname。
  这本该是很容易的事情,可是花了一些时间才改好。
  1,#hostname node035
  2,vi /etc/sysconfig/network,让其内容如下:
  NETWORKING=yes
  HOSTNAME=node035
  GATEWAYDEV=eth0
  GATEWAY=192.168.0.254
  NISDOMAIN=jlwznis
  3,修改/etc/hosts。这一步发现重启后总是变为127.0.0.1和192.168.0.35。经查看hosts中的注释,发现:#This part is created automatically by the /etc/init.d/auto_cfg_ip,于是查看auto_cfg_ip脚本中的注释,发现若存在/etc/hosts_template则将其追加到hosts中,于是拷贝了一份hosts到hosts_template中。这下,保证了/etc/hosts的正确性。
  事情做到这一步,已经到了用户评测的时候了。经验证,集群上运行的软件可以正常运行,那么这种克隆系统盘的做法也被证明是可行的。
<< Sun Blade 2000 系... / 探亲 >>

专题推荐

不平凡的水果世界

不平凡的水果世界

平凡的水果世界,平凡中的不平凡。 今朝看水果是水果 ,看水果还是水果 ,看水果已不是水果。这境界,谁人可比?在不平凡的水果世界里,仁者见仁,智者见智。

中国春节的那些习俗

中国春节的那些习俗

正月是农历新年的开始,人们往往将它看作是新的一年年运好坏的兆示期。所以,过年的时候“禁忌”特别多。当然,各个地方的风俗习惯不一样,过年的禁忌也是不一样的。

评论
0/200
表情 验证码:

大猫

  • 文章总数0
  • 画报总数0
  • 画报点击数0
  • 文章点击数0
个人排行
        博文分类
        日期归档