上一主题: 为网络配置 VLAN

下一主题: 升级 BFC


安装和发现问答

问题:什么是 IPMI,为什么要使用 IPMI?

答案:IPIM 表示智能平台管理接口,它是一种业界标准机制,用于通过 IP 网络远程控制电源状态(打开、关闭、循环)。 BFC 控制器使用该功能来管理受控服务器的电源,使得 BFC 可以关闭 CA AppLogic 网格当前未使用的服务器的电源。 如果希望通过 CA AppLogic 控制服务器的 IPMI 电源,则它们应当位于 BFC 和 AppLogic 网格控制器都能访问的网络上。 为了实现最安全的设置,应从主干子网分配地址,这是因为 BFC 和 AppLogic 控制器可以访问此地址,而外部环境通常不能访问。

问题:我的计算机符合 IPMI 1.0 标准,是否可正常运行?

答案:不可以,IPIM 支持需要 1.5 或更高版本。

问题:我的服务器没有 IPMI 电源控制器,是否仍可使用它?

答案:可以,但是您的电源管理级别将受到较多限制。 如果有 IPMI 电源控制器,那么当不使用服务器时,会关闭服务器以节约数据中心的电力/冷却功耗。 如果没有 IPIM 控制器,则服务器必须运行基础的操作系统(自动执行),以使 BFC 可以在需要服务器提供服务时,发出远程命令来重新启动服务器。 此外,如果操作系统无响应,则可以使用 IPMI 电源控制器来强制重新加电。

问题:我一直在使用以前版本的 CA AppLogic,硬件能否与新版本一起使用?

答案:视具体情况而定。 新版本的 CA AppLogic 要求连接到主干网络的服务器的 NIC 可进行 PXE 启动。 此外的情况取决于要使用新版本的方式。 如果要同时在主干中使用 Xen 和 ESX 配置,则需要确认现有硬件位于 VMware ESX 硬件兼容性列表 (HCL) 中。 可以从以下网址访问 ESX 4.0.0 HCL 列表:http://www.vmware.com/resources/compatibility/search.php。 如果您的服务器未列在 ESX 4.0.0 HCL 上,需要用 ESX 支持的硬件来替换它才能使用 CA AppLogic 3.0 或更高版本的 ESX 功能。 此外,即使 ESX 支持您的硬件,但是我们发现 ESX 的资源需求大大高于 Xen。 对于所有的 ESX 安装,建议至少安装 8GB 物理内存。

问题:是否需要更改服务器的任何设置以使服务器能与 3.0 或更高版本的 CA AppLogic 一起使用?

答案:是,您需要在 BIOS 中作出一些更改,并验证 IPMI 电源的访问方法(如果存在)。 具体而言,检查以下各项:

  1. BIOS 配置
    1. 确认已启用“A/C power recovery”,以便可以在彻底失败后接通电源时打开电源。
    2. 将主干 NIC 集配置为 PXE 启动,以便可以在启动时发现服务器。
    3. 将上一步骤中的主干 NIC 配置为先于其他本地设备启动。
    4. 如果所使用服务器的处理器支持超线程功能,则必须禁用超线程功能。
  2. IPMI 配置
    1. 在 IPMI 界面中(通常在 BIOS 后,但在启动前),确认已启用“IPMI over LAN”。

问题:服务器发现的工作原理是什么?

答案:服务器发现是通过使用一些业界标准(DHCP、PXE 启动、IPMI…)实现的。 过程如下:

  1. 根据以上服务器问答配置 BIOS 和 IPMI 设置。
  2. 之后,服务器将打开电源,并在主干网络上进行 PXE 启动
  3. BFC 服务器上的 dhcpd 服务在主干上为服务器提供 IP 地址,只需满足以下条件:
    1. 如果使用手动配置模式,dhcpd 确认服务器的主干 MAC 在列表上
    2. 如果使用自动发现模式,dhcpd 确认服务器的主干 MAC 未在列表上
    3. 在 BFC 中配置 IP 地址后,该地址在主干和外部网络上都可用
  4. 提供地址后,服务器被配置为启动 BFC 的实用工具映像。 该映像将启动服务器,并收集一组有限的清单数据,这组清单数据会自动发送回 BFC 服务器。
  5. 然后,服务器被认为是“已发现”,并显示在 BFC 管理应用程序中。
  6. 如果服务器的电源受控制,则发现服务器后会立即关闭其电源。 如果服务器的电源不受控(参见电源类型“手动”的讨论),服务器将继续运行实用工具映像。

问题:配置电源网时,用户模式和系统模式有什么区别?

答案:用户模式通知 BFC 不配置 IPMI 电源控制器,而是遵守用户原先配置的联网信息。 该模式是最常用的模式(在 UI 中创建电源网时的默认模式),因为它使电源控制器的 IP 地址保持预配置的 IP 地址不变,从而可以直接访问它们。

相反,如果用户不希望在启动发现过程前手动配置每个 IPMI 电源控制器,则应选择系统模式。 使用该模式时,BFC 将根据用户在“管理”->“网络”->“电源”选项卡下输入的电源网配置,在发现/清点过程中自动为 IPMI 电源控制器配置网络参数。 在发现过程中指定网络配置后,该配置将不会变化。 因此,用户可以随意使用 BFC UI 服务器列表中显示的电源控制器 IP 地址,以从外部访问 IPMI 界面。

问题:何时将自动配置(“白名单”)模式用于发现?

答案:自动配置模式通常用于以下环境:主干网络并非专用于由 BFC 安装管理的一组服务器。 在该模式中,用户必须明确输入将用于在主干网络上启动服务器的 NIC 的 MAC 地址。 BFC 将仅响应白名单中配置的 MAC 地址发出的 DHCP 请求。 该模式确保 BFC 控制器将永不管理尚未明确添加到包含项的服务器。 该模式是运行 BFC 控制器的最安全模式,但是添加新服务器用于管理时需要用户进行大量工作,因为在 BFC 继续进行发现/清点过程前,必须手动收集启动 NIC 的 MAC 地址,并将这些地址输入到手动配置列表中。 在安装时,BFC 处于手动配置模式(列表为空)。

问题:何时将自动发现(“黑名单”)模式用于发现?

答案:自动发现模式通常用于以下环境:主干网络专用于由 BFC 安装管理的一组服务器。 在该模式中,BFC 将响应在主干网络上看到的所有 DHCP 请求(除了在列表中输入的那些 MAC 地址)。 在该模式中,无需手动收集每个服务器的 MAC 地址、确定主干网络上的 NIC,然后手动将该 MAC 地址输入白名单中,就可以加入和使用其他服务器。 不进行数据收集和数据输入可将扩充主干容量的开销降到最低。 在该模式中,可以使用自动发现来应对配置问题,如错误地将服务器添加到错误的网络中时,不必等待正确地配置服务器,在完成重新配置前,BFC 管理员只需将服务器的 MAC 地址添加到该列表中。

问题:我已经打开服务器的电源,但是该服务器未显示在服务器列表中

答案:发生该问题时,在再次尝试发现服务器之前执行以下检查。

  1. 是否将服务器上正确的 NIC 设置为 PXE 启动? 必须将主干网络上的 NIC 配置为进行启动。 如果将正确的 NIC 配置为 PXE 启动,是否在 BIOS 中正确设置了启动顺序以使 NIC 在本地磁盘前启动?
  2. 如果处于手动配置(“白名单”)发现模式,请验证是否正确地将启动 NIC 的 MAC 地址输入到白名单中(“管理”->“发现”)。 此外,在“管理”->“发现”选项卡上验证是否已打开发现。 如果未打开,则打开发现(如果要编辑黑名单或白名单,需要再次关闭发现)
  3. 已配置的主干网络中是否有可用的 IP 地址? 转至“管理”->“网络”->“主干”选项卡,验证是否具有可分发给新服务器的可用 IP 地址。 如果没有,需要编辑范围并添加其他 IP 地址用于分发。
  4. 已配置的外部网络中是否有可用的 IP 地址? 转至“管理”->“网络”->“外部”选项卡,验证是否具有可分发给新服务器的可用 IP 地址。 如果没有,需要编辑范围并添加其他 IP 地址用于分发。
  5. 主干网络上运行的服务器是否在使用为 BFC 配置的用于分发的 IP 地址。 例如:托管公司和 IT 部门经常通过操作系统创建服务器映像,以在交付使用之前验证是否正确配置了服务器及其网络。 如果这些服务器仍在运行,且它们正在使用主干网络上已分配给 BFC 用于管理的 IP 地址,那么由于冲突,BFC 的 DHCP 服务器将不会分发已配置的 IP 地址。 重新配置主干网络 IP 地址空间以删除正在使用的这些 IP,或者在准备好发现服务器以在 BFC 中使用之前关闭服务器的电源。
  6. 是否按照安装说明正确配置了 /etc/hosts 文件? 如果未正确配置该文件,dhcpd 服务可能无法运行或者无法正确运行,发现将不能运行。

验证所有内容后,再次启动服务器,同时观察服务器控制台和 BFC 控制服务器上的 DHCP 服务器输出(如果服务器仍不能发现,这两者之一将指导我们正确操作)。 对于服务器控制台访问,通常可以通过附加到服务器的外部 KVM 查看控制台,或者许多 IPMI 控制器通过 IPMI Web 界面提供 KVM 访问。 选取相应的访问机制来查看存在问题的服务器控制台。 要访问 DHCP 服务器输出,请以根用户身份登录 BFC 控制节点,并在终端会话中键入“tail –100f /var/log/messages”。 这样会显示启动网格服务器时这些服务器发出的 dhcp 请求。

现在已完全准备好,继续进行操作并重新打开服务器的电源(通过按电源按钮的物理方式,或通过 IPMI 界面的远程方式)

观察服务器控制台,确认在完成 POST 操作后正确的 NIC 可发出 PXE 请求。

如果在节点 PXE 启动前发生内容如下的错误:

链接故障,检查电缆?

可能存在连线或交换机问题,因为出问题的 NIC 未与交换机建立链接。 请联系您的托管服务提供商或本地 IT 员工,让他们验证服务器网络连接。

如果正确的 NIC 是 PXE 启动,但是最终超时,那么将需要检查多个项目。 首先,在服务器尝试 PXE 启动时,检查 /var/log/messages 输出,查看是否有类似

Apr 30 19:52:40 bfc dhcpd: DHCPREQUEST for 192.168.0.26 (192.168.0.11) from b8:ac:6f:8f:2d:a3 via eth0

Apr 30 19:52:40 bfc dhcpd: DHCPACK on 192.168.0.26 to b8:ac:6f:8f:2d:a3 via eth0

Apr 30 19:52:40 bfc xinetd[942]: START: tftp pid=1367 from=192.168.0.26

Apr 30 19:52:40 bfc in.tftpd[1368]: tftp: client does not accept options

的条目显示在日志中,且 MAC 地址为有问题的服务器的地址。

如果条目未出现在 DHCP 输出中,则为 PXE 启动配置了错误的 NIC,或者配置了正确的 NIC,但是连接或交换机配置不正确。 请联系您的托管服务提供商或本地 IT 员工,让他们验证服务器网络配置。

如果在日志中看到 DHCP 请求,但是看到

Apr 30 12:23:53 bfc dhcpd: DHCPDISCOVER from f2:32:1d:00:22:00 via eth0: network 192.168.0/24: no free leases

您可能忘记了配置主干网络中的 IP 地址池,或地址已经用尽。 请参阅上面的步骤 3。

如果已确认您具有可用的 IP,那么重新验证步骤 2 以确保系统已准备好响应服务器的 MAC 地址。

如果在 DHCP 日志中看到类似如下的文本

Apr 30 00:40:15 bfc dhcpd: Abandoning IP address 192.168.0.20: pinged before offer

主干网络上的服务器当前正在使用已配置到 BFC 中用于分配的 IP 地址范围。 请参阅上面的步骤 4。

如果已进行到此步,那么应已在 DHCP 日志中看到类似如下的文本

Apr 30 19:52:40 bfc dhcpd: DHCPREQUEST for 192.168.0.26 (192.168.0.11) from b8:ac:6f:8f:2d:a3 via eth0

Apr 30 19:52:40 bfc dhcpd: DHCPACK on 192.168.0.26 to b8:ac:6f:8f:2d:a3 via eth0

Apr 30 19:52:40 bfc xinetd[942]: START: tftp pid=1367 from=192.168.0.26

Apr 30 19:52:40 bfc in.tftpd[1368]: tftp: client does not accept options

如果在服务器控制台上看到错误,那么问题可能是 Linux 清单映像未识别服务器的某些方面。 请捕获该错误输出并与 CA 支持联系,以执行进一步诊断步骤。

如果服务器控制台上出现类似如下的提示

请按 Enter 激活该控制台。

服务器已正确地 PXE 启动发现/清单映像。 如果仍未在 BFC UI 中看到服务器,请与 CA 支持联系,以执行进一步诊断操作。

问题:我的服务器在 UI 中可见,但是电源类型为手动(虽然具有 IPMI 控制器)。

答案:这通常是由于以下问题之一导致的。

  1. 是否为 BFC 配置了电源网范围,以便为 IPMI 电源控制器分配 IP 地址(“管理”->“网络”->“电源”)。 要使 BFC 使用 IPMI 电源管理功能,必须使用以下 IP 网络来配置它:该 IP 网络包含要用来访问存在问题的 IPMI 电源控制器的 IP 地址。
  2. 您是否正在以用户模式运行…
    1. 是否为存在问题的 IPMI 电源控制器配置了网络信息? 注意:我们已看到服务器中 Web 界面和 IPMI 电源控制器有不同的 MAC 地址,因此 Web 界面和 IPMI 界面必须配置各自的网络信息。 此外,在这些类型的服务器上,它可能显示 IPMI 电源命令(如 IPMITool)正在工作,因为 Web 界面将 IPMI 编码的命令直接转发到 IPMI 界面进行处理。 遗憾地是,在这种情况下,当在发现/清点过程中查询 IPMI 界面的网络配置时,将返回全零 IP 地址(因为地址未配置)。由于这些地址无效,BFC 将因故障而返回手动电源。
    2. 验证存在问题的 IPMI 控制器的 IP 地址信息在为 BFC 配置的电源网中。 如果分配给主机的 IP 地址不在 BFC 中为电源网配置的 IP 地址范围内,那么 BFC 无法正确地保留供使用的电源控制器的 IP 地址,这将导致 BFC 返回到手动电源模式。

问题:已正确发现我的服务器,并已正确将电源控制器识别为 IPMI,但是现在电源控制器显示已降级。

答案:这意味着已正确清点到服务器,并已正确配置 IPMI 控制器(在用户模式或系统模式中),不过 BFC 控制器在执行其常规运行状况和状态检查时无法在已配置的 IP 地址上联系 IPMI 电源控制器。 请验证是否已为电源网输入正确的 IP 地址范围(“管理”->“网络”->“电源”),并验证可从 BFC 控制节点路由网络。 您可以通过登录 BFC 控制节点并尝试 ping 其中一个 IPMI 电源控制器的 IP 地址来进行验证。 如果该操作不起作用,那么请联系托管公司或本地 IT 员工来验证网络链接是否正确。

问题:在重新安装结构控制器时出现错误,指出由于尚未删除网格而无法重新安装结构控制器,但是没有任何网格正在运行

答案:这是已知问题,应对方法是使用“-f”标记运行安装程序。 这样会强制安装程序忽略该检查。

问题:在安装和重新安装 BFC 时出现错误,指出“/”文件系统中没有足够的磁盘空间。

答案:在“/”文件系统上,BFC 和 CA AppLogic 至少需要 25 GB 可用磁盘空间来保存 BFC 安装。 请确保存在必备磁盘空间,然后重新进行安装。