上一主题: VLAN 0 支持(BFC 3.5.2 及更高版本)下一主题: 升级 BFC


常见问题解答

问题:什么是 IPMI,为什么要使用 IPMI?

答案:IPIM 表示智能平台管理接口,它是一种业界标准机制,用于通过 IP 网络远程控制电源状态(打开、关闭、循环)。 BFC 控制器使用该功能来管理受控服务器的电源,使得 BFC 可以关闭 CA AppLogic® 网格当前未使用的服务器的电源。 如果希望通过 CA AppLogic® 控制服务器的 IPMI 电源,则它们应当位于 BFC 和 AppLogic 网格控制器都能访问的网络上。 为了实现最安全的设置,应从主干子网分配地址,这是因为 BFC 和 AppLogic 控制器可以访问此地址,而外部环境通常不能访问。

问题:我的计算机符合 IPMI 1.0 标准,是否可正常运行?

答案:不可以,IPIM 支持需要 1.5 或更高版本。

问题:我的服务器没有 IPMI 电源控制器,是否仍可使用它?

答案:可以,但是您的电源管理级别将受到较多限制。 如果有 IPMI 电源控制器,那么当不使用服务器时,会关闭服务器以节约数据中心的电力/冷却功耗。 如果没有 IPIM 控制器,则服务器必须运行基础的操作系统(自动执行),以使 BFC 可以在需要服务器提供服务时,发出远程命令来重新启动服务器。 此外,如果操作系统无响应,则可以使用 IPMI 电源控制器来强制重新加电。

问题:我一直在使用以前版本的 CA AppLogic®,硬件能否与新版本一起使用?

答案:视具体情况而定。 新版本的 CA AppLogic® 要求连接到主干网的服务器的 NIC 可进行 PXE 启动。 此外的情况取决于要使用新版本的方式。 如果要同时在主干中使用 Xen 和 ESX 配置,则需要确认现有硬件位于 VMware ESX 硬件兼容性列表 (HCL) 中。 可以从以下网址访问 ESX 4.0.0 HCL 列表:http://www.vmware.com/resources/compatibility/search.php。 如果您的服务器未列在 ESX 4.0.0 HCL 上,需要用 ESX 支持的硬件来替换它才能使用 CA AppLogic® 3.0 或更高版本的 ESX 功能。 此外,即使 ESX 支持您的硬件,但是我们发现 ESX 的资源需求大大高于 Xen。 对于所有的 ESX 安装,建议至少安装 8GB 物理内存。

问题:是否需要更改服务器的任何设置以使服务器能与 3.0 或更高版本的 CA AppLogic® 一起使用?

答案:是,您需要在 BIOS 中作出一些更改,并验证 IPMI 电源的访问方法(如果存在)。 具体而言,检查以下各项:

  1. BIOS 配置
    1. 确认已启用“A/C power recovery”,以便可以在彻底失败后接通电源时打开电源。
    2. 将主干 NIC 集配置为 PXE 启动,以便可以在启动时发现服务器。
    3. 将上一步骤中的主干 NIC 配置为先于其他本地设备启动。
    4. 如果所使用服务器的处理器支持超线程功能,则必须禁用超线程功能。
  2. IPMI 配置
    1. 在 IPMI 界面中(通常在 BIOS 后,但在启动前),确认已启用“IPMI over LAN”。

问题:服务器发现的工作原理是什么?

答案:服务器发现是通过使用一些业界标准(DHCP、PXE 启动、IPMI…)实现的。 过程如下:

  1. 根据以上服务器问答配置 BIOS 和 IPMI 设置。

    之后,服务器将打开,并在主干网上进行 PXE 启动。

  2. BFC 服务器上的 dhcpd 服务在主干上为服务器提供 IP 地址,只需满足以下条件:
    1. 如果处于手工配置模式,dhcpd 需要确认服务器的主干 MAC 位于您在“管理”页面的“发现”选项卡上指定的 MAC 地址列表中。
    2. 如果处于自动发现模式,dhcpd 需要确认服务器的主干 MAC 没有位于您在“管理”页面的“发现”选项卡上指定的 MAC 地址列表中。
    3. IP 地址在主干网和外部网络上都可用,如 BFC 中所配置的那样。
  3. 提供地址后,服务器被配置为启动 BFC 的实用工具映像。 该映像将启动服务器,并收集一组有限的清单数据,这组清单数据会自动发送回 BFC 服务器。
  4. 然后,服务器被认为是“已发现”,并显示在 BFC 管理应用程序中。
  5. 如果服务器的电源受控制,则发现服务器后会立即关闭其电源。 如果服务器的电源不受控(请参阅电源类型“手工”的讨论),服务器将继续运行实用工具映像。

问题:配置电源网时,用户模式和系统模式有什么区别?

答案:用户模式通知 BFC 不配置 IPMI 电源控制器,而是遵守用户原先配置的联网信息。 该模式是最常用的模式(在 UI 中创建电源网时的默认模式),因为它使电源控制器的 IP 地址保持预配置的 IP 地址不变,从而可以直接访问它们。

相反,如果用户不希望在启动发现过程前手工配置每个 IPMI 电源控制器,则应选择系统模式。 使用该模式时,BFC 将根据用户在“管理”->“网络”->“电源”选项卡下输入的电源网配置,在发现/清点过程中自动为 IPMI 电源控制器配置网络参数。 在发现过程中指定网络配置后,该配置将不会变化。 因此,用户可以随意使用 BFC UI 服务器列表中显示的电源控制器 IP 地址,以从外部访问 IPMI 界面。

问题:何时将手工配置(“白名单”)模式用于发现?

答案:手工配置模式通常用于以下环境:主干网并非专用于由 BFC 安装管理的一组服务器。 在该模式中,用户必须明确输入将用于在主干网上启动服务器的 NIC 的 MAC 地址。 BFC 将仅响应白名单中配置的 MAC 地址发出的 DHCP 请求。 该模式确保 BFC 控制器将永不管理尚未明确添加到包含项的服务器。 该模式是运行 BFC 控制器的最安全模式,但是添加新服务器用于管理时需要用户进行大量工作,因为在 BFC 继续进行发现/清点过程前,必须手工收集启动 NIC 的 MAC 地址,并将这些地址输入到手工配置列表中。 在安装时,BFC 处于手工配置模式(列表为空)。

问题:何时将自动发现(“黑名单”)模式用于发现?

答案:自动发现模式通常用于以下环境:主干网专用于由 BFC 安装管理的一组服务器。 在该模式中,BFC 将响应在主干网上看到的所有 DHCP 请求(除了在“管理”页面的“发现”选项卡上的地址列表中输入的那些 MAC 地址)。 在自动发现模式中,无需手工收集每个服务器的 MAC 地址、确定主干网上的 NIC,然后手工将该 MAC 地址输入白名单中,就可以加入和使用其他服务器。 不进行数据收集和数据输入可将扩充主干容量的开销降到最低。 在该模式中,可以使用自动发现列表来解决错误地将服务器添加到错误网络中的配置问题,而不必等待正确地配置服务器,BFC 管理员只需将服务器的 MAC 地址添加到“管理”页面的“发现”选项卡上的地址列表中,直到完成重新配置。

问题:我已经打开服务器,但是该服务器未显示在服务器列表中。

答案:发生该问题时,在再次尝试发现服务器之前执行以下检查。

  1. 是否将服务器上正确的 NIC 设置为 PXE 启动? 必须将主干网上的 NIC 配置为进行启动。 如果将正确的 NIC 配置为 PXE 启动,是否在 BIOS 中正确设置了启动顺序以使 NIC 在本地磁盘前启动?
  2. 如果处于手工配置(“白名单”)发现模式,请验证是否正确地将启动 NIC 的 MAC 地址输入到白名单中(“管理”->“发现”)。 此外,在“管理”->“发现”选项卡上验证是否已打开发现。 如果未打开,则打开发现(如果要编辑黑名单或白名单,需要再次关闭发现)
  3. 已配置的主干网中是否有可用的 IP 地址? 转至“管理”->“网络”->“主干”选项卡,验证是否具有可分发给新服务器的可用 IP 地址。 如果没有,需要编辑范围并添加其他 IP 地址用于分发。
  4. 已配置的外部网络中是否有可用的 IP 地址? 转至“管理”->“网络”->“外部”选项卡,验证是否具有可分发给新服务器的可用 IP 地址。 如果没有,需要编辑范围并添加其他 IP 地址用于分发。
  5. 主干网上运行的服务器是否在使用为 BFC 配置的用于分发的 IP 地址。 例如:托管公司和 IT 部门经常通过操作系统创建服务器映像,以在交付使用之前验证是否正确配置了服务器及其网络。 如果这些服务器仍在运行,且它们正在使用主干网上已分配给 BFC 用于管理的 IP 地址,那么由于冲突,BFC 的 DHCP 服务器将不会分发已配置的 IP 地址。 重新配置主干网 IP 地址空间以删除正在使用的这些 IP,或者在准备好发现服务器以在 BFC 中使用之前关闭服务器的电源。
  6. 确认您的 /etc/hosts 文件中没有任何不正确的条目。

验证所有内容后,再次启动服务器,同时观察服务器控制台和 BFC 控制服务器上的 DHCP 服务器输出(如果服务器仍不能发现,这两者之一将指导我们正确操作)。 对于服务器控制台访问,通常可以通过附加到服务器的外部 KVM 查看控制台,或者许多 IPMI 控制器通过 IPMI Web 界面提供 KVM 访问。 选取相应的访问机制来查看存在问题的服务器控制台。 要访问 DHCP 服务器输出,请以根用户身份登录 BFC 控制节点,并在终端会话中键入“tail –100f /var/log/messages”。 这样会显示启动网格服务器时这些服务器发出的 dhcp 请求。

现在已完全准备好,继续进行操作并重新打开服务器的电源(通过按电源按钮的物理方式,或通过 IPMI 界面的远程方式)

观察服务器控制台,确认在完成 POST 操作后正确的 NIC 可发出 PXE 请求。

如果在节点 PXE 启动前发生内容如下的错误:

链接故障,检查电缆?

可能存在连线或交换机问题,因为出问题的 NIC 未与交换机建立链接。 请联系您的托管服务提供商或本地 IT 员工,让他们验证服务器网络连接。

如果正确的 NIC 是 PXE 启动,但是最终超时,那么将需要检查多个项目。 首先,在服务器尝试 PXE 启动时,检查 /var/log/messages 输出,查看是否有类似

Apr 30 19:52:40 bfc dhcpd: DHCPREQUEST for 192.168.0.26 (192.168.0.11) from b8:ac:6f:8f:2d:a3 via eth0

Apr 30 19:52:40 bfc dhcpd: DHCPACK on 192.168.0.26 to b8:ac:6f:8f:2d:a3 via eth0

Apr 30 19:52:40 bfc xinetd[942]: START: tftp pid=1367 from=192.168.0.26

Apr 30 19:52:40 bfc in.tftpd[1368]: tftp: client does not accept options

的条目显示在日志中,且 MAC 地址为有问题的服务器的地址。

如果条目未出现在 DHCP 输出中,则为 PXE 启动配置了错误的 NIC,或者配置了正确的 NIC,但是连接或交换机配置不正确。 请联系您的托管服务提供商或本地 IT 员工,让他们验证服务器网络配置。

如果在日志中看到 DHCP 请求,但是看到

Apr 30 12:23:53 bfc dhcpd: DHCPDISCOVER from f2:32:1d:00:22:00 via eth0: network 192.168.0/24: no free leases

您可能忘记了配置主干网中的 IP 地址池,或地址已经用尽。 请参阅上面的步骤 3。

如果已确认您具有可用的 IP,那么重新验证步骤 2 以确保系统已准备好响应服务器的 MAC 地址。

如果在 DHCP 日志中看到类似如下的文本

Apr 30 00:40:15 bfc dhcpd: Abandoning IP address 192.168.0.20: pinged before offer

主干网上的服务器当前正在使用已配置到 BFC 中用于分配的 IP 地址范围。 请参阅上面的步骤 4。

如果已进行到此步,那么应已在 DHCP 日志中看到类似如下的文本

Apr 30 19:52:40 bfc dhcpd: DHCPREQUEST for 192.168.0.26 (192.168.0.11) from b8:ac:6f:8f:2d:a3 via eth0

Apr 30 19:52:40 bfc dhcpd: DHCPACK on 192.168.0.26 to b8:ac:6f:8f:2d:a3 via eth0

Apr 30 19:52:40 bfc xinetd[942]: START: tftp pid=1367 from=192.168.0.26

Apr 30 19:52:40 bfc in.tftpd[1368]: tftp: client does not accept options

如果在服务器控制台上看到错误,那么问题可能是 Linux 清单映像未识别服务器的某些方面。 请捕获该错误输出并与 CA 支持联系,以执行进一步诊断步骤。

如果服务器控制台上出现类似如下的提示

请按 Enter 激活该控制台。

服务器已正确地 PXE 启动发现/清单映像。 如果仍未在 BFC UI 中看到服务器,请与 CA 支持联系,以执行进一步诊断操作。

问题:我的服务器在 UI 中可见,但是电源类型为手工(虽然具有 IPMI 控制器)。

答案:这通常是由于以下问题之一导致的。

  1. 是否为 BFC 配置了电源网范围,以便为 IPMI 电源控制器分配 IP 地址(“管理”->“网络”->“电源”)。 要使 BFC 使用 IPMI 电源管理功能,必须使用以下 IP 网络来配置它:该 IP 网络包含要用来访问存在问题的 IPMI 电源控制器的 IP 地址。
  2. 您是否正在以用户模式运行…
    1. 是否为存在问题的 IPMI 电源控制器配置了网络信息? 注意:我们已看到服务器中 Web 界面和 IPMI 电源控制器有不同的 MAC 地址,因此 Web 界面和 IPMI 界面必须配置各自的网络信息。 此外,在这些类型的服务器上,它可能显示 IPMI 电源命令(如 IPMITool)正在工作,因为 Web 界面将 IPMI 编码的命令直接转发到 IPMI 界面进行处理。 遗憾地是,在这种情况下,当在发现/清点过程中查询 IPMI 界面的网络配置时,将返回全零 IP 地址(因为地址未配置)。由于这些地址无效,BFC 将因故障而返回手工电源。
    2. 验证存在问题的 IPMI 控制器的 IP 地址信息在为 BFC 配置的电源网中。 如果分配给主机的 IP 地址不在 BFC 中为电源网配置的 IP 地址范围内,那么 BFC 无法正确地保留供使用的电源控制器的 IP 地址,这将导致 BFC 返回到手工电源模式。

问题:已正确发现我的服务器,并已正确将电源控制器识别为 IPMI,但是现在电源控制器显示已降级。

答案:这意味着已正确清点到服务器,并已正确配置 IPMI 控制器(在用户模式或系统模式中),不过 BFC 控制器在执行其常规运行状况和状态检查时无法在已配置的 IP 地址上联系 IPMI 电源控制器。 请验证是否已为电源网输入正确的 IP 地址范围(“管理”->“网络”->“电源”),并验证可从 BFC 控制节点路由网络。 您可以通过登录 BFC 控制节点并尝试 ping 其中一个 IPMI 电源控制器的 IP 地址来进行验证。 如果该操作不起作用,那么请联系托管公司或本地 IT 员工来验证网络链接是否正确。

问题:在重新安装 BFC 时出现错误,指出由于尚未删除网格而无法重新安装 BFC,但是没有任何网格正在运行

答案:这是已知问题,应对方法是使用“-f”标记运行安装程序。 这样会强制安装程序忽略该检查。

问题:在安装和重新安装 BFC 时出现错误,指出“/”文件系统中没有足够的磁盘空间。

答案:在“/”文件系统上,BFC 和 CA AppLogic® 至少需要 25 GB 可用磁盘空间来保存 BFC 安装。 请确保存在必备磁盘空间,然后重新进行安装。