深 圳 东 莞 香 港 北 京 上 海 成 都
重 庆 南 京 西 安 广 元 柳 州 南 宁
繁體 ENGLISH
联系我们
众成深圳 0755-83013835
众成香港 0852-92522538
马来西亚 +60333246385
众成上海 13162531849
众成成都 028-85241794
众成重庆 13996297205
众成西安 15829886958
众成广元 0839-8808158
众成柳州 0772-7377391
众成温州 0577-68697650
您所在的位置是:首页 》技术交流 》 磁盘阵列

HP UNIX:EMS错误的报告AutiRAID状态为down

EMS错误的报告AutiRAID状态为down

问题描述
一个系统具有 7 个正在服务器上运行的 autoraid,它们都是正常的。但是,EMS 却认为它们已经关闭。将这些资源重新设置为 UP 时,set_fixed 命令会报告存在资源或者错误消息:

/storage/status/disk_arrays/AutoRAID/0000000F4EF5  DOWN FALSE
/storage/status/disk_arrays/AutoRAID/0000000FB2FA  DOWN FALSE
/storage/status/disk_arrays/AutoRAID/0000000FB353  DOWN FALSE
/storage/status/disk_arrays/AutoRAID/0000000FBA8E  DOWN FALSE
/storage/status/disk_arrays/AutoRAID/000000105274  DOWN FALSE
/storage/status/disk_arrays/AutoRAID/000000137139  DOWN FALSE
/storage/status/disk_arrays/AutoRAID/00000037B53F  DOWN FALSE

下面是 set_fixed -n 的输出结果:

(258)==> set_fixed -n /storage/status/disk_arrays                     /AutoRAID/0000000F4EF5
set_fixed: /storage/status/disk_arrays/AutoRAID/0000000F4EF5           not set to UP
state  as Resource Name does not exist on the system and thus cannot be set to UP.

该资源确实存在。是否需要执行某些操作来重新生成服务器上内容的正确状态?

使用的诊断步骤:

1) set_fixed -l 的完整输出:

(431)==> set_fixed -l
/storage/status/disk_arrays/AutoRAID/ARMServer      UP  TRUE
/storage/status/disk_arrays/AutoRAID/0000000F4EF5  DOWN FALSE
/storage/status/disk_arrays/AutoRAID/0000000FB2FA  DOWN FALSE
/storage/status/disk_arrays/AutoRAID/0000000FB353  DOWN FALSE
/storage/status/disk_arrays/AutoRAID/0000000FBA8E  DOWN FALSE
/storage/status/disk_arrays/AutoRAID/000000105274  DOWN FALSE
/storage/status/disk_arrays/AutoRAID/000000137139  DOWN FALSE
/storage/status/disk_arrays/AutoRAID/00000037B53F  DOWN FALSE
.
.

2) set_fixed -L 的输出:

(432)==> set_fixed -L
Monitor in DOWN State
/storage/status/disk_arrays/AutoRAID/0000000F4EF5  NO_STATE_CONTROL
/storage/status/disk_arrays/AutoRAID/0000000FB2FA  NO_STATE_CONTROL
/storage/status/disk_arrays/AutoRAID/0000000FB353  NO_STATE_CONTROL
/storage/status/disk_arrays/AutoRAID/0000000FBA8E  NO_STATE_CONTROL
/storage/status/disk_arrays/AutoRAID/000000105274  NO_STATE_CONTROL
/storage/status/disk_arrays/AutoRAID/000000137139  NO_STATE_CONTROL
/storage/status/disk_arrays/AutoRAID/00000037B53F  NO_STATE_CONTROL

3) 运行 /etc/opt/resmon/lbin/moncheck 看它是否会正确列出这 7 个 Autoraid array。


配置信息

HP-UX 11.00
EMS
Autoraid Storage
STM version A.31.00

解决方法

很可能是 set_fixed 用于确定这些资源的 psm_data 文件已损坏。
Set_fixed 应该列出与 monconfig 相同的资源。

如果不是,则使用下列过程重新构建 psm_data 文件:

1) 停止 EMS 监视:
# /etc/opt/resmon/lbin/monconfig
-> (K)ill (disable) monitoring

2) 停止 psmctd:
# cstm
cstm>>dsd
-- Daemon Shut Down --
(要关闭 diagmond,运行 File -> Administration -> STM Shutdown)
选择主机 (主机名) 上要关闭的 Deamon 
    1 diaglogd
    2 psmctd
Enter selection : 2
...

3) 移动 psm_data 文件:
# mv /var/stm/data/psm_data /tmp/psm_data

4) 重新启动 pcmctd:
# cstm
cstm>dsu
-- Daemon Start Up --
(要启动 diagmond,运行 File -> Administration -> STM Startup)
选择主机 (主机名) 上要启动的 Deamon

    1 cclogd
    2 memlogd
    3 psmctd
Enter selection [done]: 3
Select Deamon to Start on the host (hostname)
    1 cclogd
    2 memlogd
*   3 psmctd
Enter selection [done]: done

注意: 重新构建 psm_data 文件需要一些时间。
请使用 ’ll’ 检查它的大小,如果大小不再发生变化,则说明重新构建完成了。

重新启动 EMS 监视
# /etc/opt/resmon/lbin/monconfig
-> (E)nable Monitoring

这样应该能够识别这些资源了,如果这些资源的状态为 DOWN,则将其重新
设置为 UP。

(the end) 

.........The following is original English document....... 
         
EMS incorrectly reports status of Autoraids as down 
Problem Description
A system has 7 autoraids running off a server, which are all normal. However,
EMS thinks they are down.  The set_fixed command reports non existent resources
or error messages when setting resources back to UP:

/storage/status/disk_arrays/AutoRAID/0000000F4EF5  DOWN FALSE
/storage/status/disk_arrays/AutoRAID/0000000FB2FA  DOWN FALSE
/storage/status/disk_arrays/AutoRAID/0000000FB353  DOWN FALSE
/storage/status/disk_arrays/AutoRAID/0000000FBA8E  DOWN FALSE
/storage/status/disk_arrays/AutoRAID/000000105274  DOWN FALSE
/storage/status/disk_arrays/AutoRAID/000000137139  DOWN FALSE
/storage/status/disk_arrays/AutoRAID/00000037B53F  DOWN FALSE

Here is the output of a set_fixed -n:

(258)==> set_fixed -n /storage/status/disk_arrays                     /AutoRAID/0000000F4EF5
set_fixed: /storage/status/disk_arrays/AutoRAID/0000000F4EF5           not set to UP
state  as Resource Name does not exist on the system and thus cannot be set to UP.

The resource really does exist.  Is there something that needs to be done to regenerate the correct status of what is on the server?

DIAGNOSTIC STEPS USED:

1) The full output of set_fixed -l:

(431)==> set_fixed -l
/storage/status/disk_arrays/AutoRAID/ARMServer       UP  TRUE
/storage/status/disk_arrays/AutoRAID/0000000F4EF5  DOWN FALSE
/storage/status/disk_arrays/AutoRAID/0000000FB2FA  DOWN FALSE
/storage/status/disk_arrays/AutoRAID/0000000FB353  DOWN FALSE
/storage/status/disk_arrays/AutoRAID/0000000FBA8E  DOWN FALSE
/storage/status/disk_arrays/AutoRAID/000000105274  DOWN FALSE
/storage/status/disk_arrays/AutoRAID/000000137139  DOWN FALSE
/storage/status/disk_arrays/AutoRAID/00000037B53F  DOWN FALSE
.
.
2) The output from set_fixed -L:

(432)==> set_fixed -L
Monitor in DOWN State
/storage/status/disk_arrays/AutoRAID/0000000F4EF5 NO_STATE_CONTROL
/storage/status/disk_arrays/AutoRAID/0000000FB2FA NO_STATE_CONTROL
/storage/status/disk_arrays/AutoRAID/0000000FB353 NO_STATE_CONTROL
/storage/status/disk_arrays/AutoRAID/0000000FBA8E NO_STATE_CONTROL
/storage/status/disk_arrays/AutoRAID/000000105274 NO_STATE_CONTROL
/storage/status/disk_arrays/AutoRAID/000000137139 NO_STATE_CONTROL
/storage/status/disk_arrays/AutoRAID/00000037B53F NO_STATE_CONTROL

3) Run /etc/opt/resmon/lbin/moncheck to see if it lists the 7 autoraid arrays correctly.

Configuration Info
HP-UX 11.00
EMS
Autoraid Storage
STM version A.31.00

Solution
Most likely the psm_data file which set_fixed uses to determine the resources is corrupt. Set_fixed should list the same resources as monconfig.

If not, use this procedure to rebuild the psm_data file:

1) Stop EMS monitoring:
# /etc/opt/resmon/lbin/monconfig
-> (K)ill (disable) monitoring

2) Stop psmctd:
# cstm
cstm>>dsd
-- Daemon Shut Down --
(To shut down diagmond, run File -> Administration   -> STM Shutdown)
Select Deamon to Shut Down on the host (hostname)
    1 diaglogd
    2 psmctd
Enter selection : 2
...

3) Move the psm_data file:
# mv /var/stm/data/psm_data /tmp/psm_data

4) Restart pcmctd:
# cstm
cstm>dsu
-- Daemon Start Up --
(To start diagmond, run File -> Administration -> STM Startup)
Select Deamon to Start on the host (hostname)
    1 cclogd
    2 memlogd
    3 psmctd
Enter selection [done]: 3
Select Deamon to Start on the host (hostname)
    1 cclogd
    2 memlogd
*   3 psmctd
Enter selection [done]: done

NOTE: It takes a while for the psm_data file to be rebuilt. Keep checking its size with ’ll’, if the size does not change any longer the rebuild is done.

Restart EMS monitoring
# /etc/opt/resmon/lbin/monconfig
-> (E)nable Monitoring

It should now be able to recognize the resources and set them back to UP if they are DOWN.
 

地址:深圳市福田区华强北新亚洲电子商城二期国利大厦6楼635室         邮编:518031
电话:0755-25083835    83013835    82543635    13713907515    13164784245    QQ:906831882
传真:0755-82543635            联系人:王先生            邮箱:wxj810@126.com   粤icp备09013775号