上一主题: 组件故障下一主题: CA AppLogic® 网格控制器的自动恢复


网络故障

CA AppLogic® 可以容忍外部(公共)或主干(专用)网络的故障,而不会导致应用停机(前提是网格的硬件设置配置了网络高可用性,并且网络尚未降级)。 通过执行 grid info 命令,用户可以验证其网格的网络 HA 是否启用/可用。

当 CA AppLogic® 检测到网络故障时,它通过将消息发布到网格显示板来向用户报告该问题。 此外,可以通过检查可从网格显示板获取的网格 HA 状态,或通过 grid info 命令来查看受影响的网络的 HA 状态。 发生下列事件之一时,CA AppLogic® 将在外部网络或主干网上检测到网络故障:

如果在受影响的网络尚未处于降级状态时发生以上故障,则不应出现任何应用停机现象。 不过,在恢复过程中网络连接可能出现短暂的中断(几秒钟)。 如果网络 HA 已经降级,并且有其他网络故障,则根据故障的类型,整个网格和所有应用都可能受影响。

注意:如果使用网络 HA 配置,并且发生外部网络故障,则使用外部接口的应用/组件可能在最多 5 分钟内无法访问。 这可能起因于缓存 MAC 地址的外部路由器。 等待路由器刷新其 ARP 缓存,或通过应用还原操作同时发送 ARP 响应和 arping。 这仅影响外部网络。 主干网不受影响。

管理员可以使用 grid info --verbose 和 srv info --extended 命令查看与网络 HA 相关的信息,包括描述网络拓扑的信息。

CA AppLogic® 向网格管理员提供可以用于动态地配置网络 HA 的以下命令:

此外,服务器命令通过让服务器上指定 NIC 的 LED 指示灯闪烁一分钟以使网格管理员能够识别服务器和 NIC。 服务器命令的格式为:

srv identify server name nic=NIC name 

有关网格和服务器网络 HA 配置命令的详细信息,请分别参阅网格 CLI 参考和 CLI 参考。