因服务器硬件故障而系统重启后,MQ 无法传输信息?

现在我就让一个奇怪的MQ问题干扰着,百思不得其解。。。

事情是这样的:

a,b机装有mq7 For aix. 没传信息前,发送通道显示正常运行状态,b机往a机一传信息,发送通道就显示retrying状态,信息就堵在传输队列,但将传输队列的信息清除,隔一会儿发送通道就自动显示正常状态,a->b传,b->a机都一样情况,做了a<->b机之间的通道重置操作,情况还是一样,还是只要发送信息,通道就显示retreing状态,清除传输队队列信息,就显示正常。重建发送/接收通道,情况也一样,但在一台win10和linux之间的测试环境,一样的队列名,一样的通道名,一样的MQ7,一样的监听端口,就是操作系统不一样。但win10和linux之间就一切正常,传输信息正常。通道也正常。也不会显示retreing.
只知道两台AIX机器。B机之前因为硬件故障崩溃过而重启过,之后MQ就不能正常传输信息。B机没因硬件故障重启过之前,MQ之间的通信一切正常。故障重启后就不正常。
win10与Linux之间的MQ的测试环境,是我在本机搭建的虚拟机测试环境。在这个测试环境WIN10与LINUX之间是完全可以正常传输信息的。
A,B机是AIX6.1,MQ是MQ7. 现在A-B机之间可以PING通。

我怀疑是不是A,B机之间的网络仍然有限制,致使A,B机之间不能正常传输信息。在国内某著名的中间件论坛发贴,询问,有回复说,建议重MQ,我知道重建MQ是一个办法,但不清楚这MQ还是否其它中间件和数据库关联,不清楚应用环境情况,不敢冒然重建

那现在应该怎样查问题?那位朋友路过,看到这个问题,能否分享一下经验与方法?

以下文章点击率最高

Loading…

  1. 最后确诊断因硬件故障而造成B机原来的MQ队列管理器已经损坏,无法使用,需要重建,重建后,A,B机之间即可以联通,也可以互转信息。。。

  2. 这次故障,也比较少见,很容易迷惑排障人员,因为,这个MQ 队列管理器正常显示运行状态,监听器也访问正常。也可以正常连接。只是通道不正常,也很容易让人以为 MQ队列管理器还是正常的,只是出现简单的通道故障和网络问题,所以,一开始没有确认这个MQ队列管理器内部已经出现问题….

发表评论