上一主题: help 命令(3tsrv 实用工具)下一主题: 使用 CA AppLogic®


如何维护网格

作为主干管理员,您想在网格上执行管理任务和高级操作。 这些操作包括检索服务器信息、检查网络运行情况,以及查看网格失败情况。 BFC 维护人员可以定期地执行这些任务。

以下图表显示如何在典型环境中维护网格:

显示如何维护网格的图表。

  1. 检索并修改服务器信息
  2. 如果您有很多服务器,请从网格中删除一台服务器

    例如,由于未充分利用的资源,您打算将所需的最少服务器数量从 5 更改为 4。

  3. 如果您要检测网格中的问题,请检查网络运行情况
  4. 如果网格失败,请完成以下步骤:
    1. 查看网格失败日志
    2. 还原网格控制器操作
检索并修改服务器信息

3tsrv 实用工具驻留在每个服务器的 dom0。 只有网格管理员有访问该实用工具的权限。 使用该实用工具检索和修改服务器信息,并执行各种功能,例如收集日志用于故障分析。

完成以下步骤:

  1. 执行以下命令:
    3tsrv command [ prop[=val] ]* [ --batch ][ --force ] 
    
    command

    指定要执行的命令。

    prop=val

    指定其他特定命令的参数。 如果您不指定 val,该产品则假定布尔属性值为 TRUE。

    --batch

    指定实用工具从脚本执行且不应显示冗长的错误消息。 该变量也采用 UDL 格式显示输出。

    --force

    强制指定的操作。

  2. 请考虑以下支持的命令:
    信息

    检索详细的服务器信息。

    set

    设置服务器信息。

    重新启动

    重新启动服务器。

    shutdown

    关闭服务器。

    applogic activate

    激活服务器上的产品。

    applogic deactivate

    停用服务器上的产品。

    applogic start

    启动服务器上的产品。

    applogic stop

    停止服务器上的产品。

    diskchk enable

    启用服务器上的磁盘故障检测。

    diskchk disable

    禁用服务器上的磁盘故障检测。

    bd list

    列出由服务器上的产品使用的活动块设备

    sd get

    显示服务器数据文件的内容

    sd set

    更新服务器数据文件

    logs collect

    收集服务器日志和信息

    help

    显示实用工具的帮助。

    例如,您想查看有关服务器的详细信息。

    执行以下命令:

    3tsrv info [ --batch ]
    
从网格删除服务器

您可以使用“网格属性”页面中的“服务器操作”从网格删除服务器。

如果指定的最小数值和目标数值相等,则可能需要降低最小服务器值。 例如,您的网格具有 5 个值设置为 5/5/5(最小/目标/最大)的服务器。 需要将最小值设置为 4,因为 svr5 未充分利用。

注意:如果最小服务器值小于目标值,则不需要首先调整最小值。 例如,如果指定的最小/目标/最大为 5/7/7,则可以在不调整最小值的情况下删除两个服务器。

完成以下步骤:

  1. 从 BFC UI 中,打开“网格属性”页面的“Xen”或“VMware”选项卡。
  2. 输入 4 作为最小值。
  3. 打开网格 shell。
  4. 执行以下命令:
    3t srv disable srv<n>
    
    n

    要从网格删除的服务器号。

    注意:如果在步骤 5d 中选中“强制删除”复选框,则此步骤是可选的。

  5. 请完成下列步骤:
    1. 从 BFC UI 中,在“网格属性”页面上选择“服务器”选项卡。
    2. 选择要删除的服务器,然后从“服务器操作”下拉列表中单击“删除”。
    3. 如果不希望其他网格选择此服务器,则启用“隔离”选项。
    4. 要删除在 CA AppLogic® 中未禁用的服务器,请选择“强制删除”选项。
检查网络运行情况

通过 3tnetha 实用工具,您可以编写各种网络和相关选项检查的脚本。 作为定期状况检查的一部分,该产品定期调用 3tnetha 脚本。

完成以下步骤:

  1. 在控制器的以下目录内找到脚本:
    /var/applogic/scripts
    

    默认情况下,该脚本除退出 0 之外,不执行任何操作。

  2. 验证输出脚本:
查看网格失败日志

您可以根据该网格的行为进行故障排除。 将任何意外的网格失败报告给 CA 支持。 然而,在提交缺陷报告之前,请查看《版本说明》以确认您的问题是未知问题。

完成以下步骤:

  1. 请确认您是否经历以下任何网格行为:

    在此示例中,您无法验证您的问题是否是已知问题。 您决定提出缺陷报告。

    您想从网格收集所有日志,包括备份。 例如,xxxx.1、xxxx.2 等。

    网格和服务器日志需要管理员访问权限。 您将这些日志发送到 CA 支持。

    注意:可以在每个服务器上使用 3tsrv 实用工具来收集服务器特定日志和信息。

  2. 从以下目录收集网格控制器日志:
  1. 收集网格 (dom0) 中的每个服务器的以下信息:
还原网格控制器操作

如果网格控制器服务器失败,产品则会检测到网格控制器恢复问题。 这些问题可能导致网格控制器不可访问。

完成以下步骤:

  1. 如果由于一个或多个网格控制器服务器关闭而网格没有控制器 HA,请考虑以下信息:
  2. 如果没有正确配置 HA 网格控制器,请考虑以下信息:
  3. 如果单个服务器网格没有 HA 功能,请考虑以下信息:
  4. 如果您没有使用适当数量的控制器内存、控制器 CPU 或服务器内存来配置网格,请考虑以下信息:

您已成功执行网格维护。