上一主题: 重要说明

下一主题: 重要缺陷修复


已知问题和限制

本节介绍当前的已知问题和限制。

CA AppLogic 限制
  1. 网格大小局限于每个 Xen 网格有 128 个服务器,每个 ESX 有 80 个服务器
    这是 CA AppLogic 当前版本的限制。 该版本已证实最多可使用 30 个服务器;然而,也支持多达 128(Xen)和多达 80(ESX)个服务器的配置。
  2. CA AppLogic 当前无法安装在带有 3 TB 或更大驱动器的服务器上。
  3. 为使用户界面正常运行,请为网格控制器的主机启用 JavaScript、弹出式菜单和 cookie。 确保您的浏览器已更新为最新的可用版本,以修正影响 AJAX 应用的缺陷。
  4. 未对组件终端实施协议,仅实施了端点。

    这意味着组件只能与所连接的组件(及其自身的服务器和网格控制器)进行交互。 不过,应在新组件上指定相应的协议,以确保 CA AppLogic 的未来版本中应用设计的完整性和兼容性。

  5. 总可用磁盘空间不将卷镜像考虑在内

    grid info 命令所报告的总可用磁盘空间是一个原始估算值,未将卷镜像考虑在内。 实际的可用磁盘空间是报告的可用空间量除以镜像数(默认情况下为 2)所得到的值。 例如:如果有 1000 GB 的可用磁盘空间,网格配置为 2 个镜像,则可用的磁盘空间为 500 GB。 此外,为了成功镜像卷,必须至少在 X 个服务器上有足够的磁盘空间,其中 X 是镜像数(即使 CA AppLogic 无法创建其中任何一个镜像,但仍会创建卷,并显示无法镜像卷的警告)。

  6. 如果某个服务器在应用启动期间出现故障,可能会导致应用无法启动

    如果启动了某个应用,且网格的其中一个服务器出现故障,则当该应用的一个或多个组件排定在出现故障的服务器上运行时,该应用将无法启动。 如果发生此情况,只需重新启动应用即可。

  7. 可通过 filer 使用的卷管理 GUI 具有每个文件 10 MB 的上载限制

    要将更大的文件上传到卷,请使用 vol manage shell 命令;请不要忘记为此命令指定外部 IP 设置,以便从卷管理器内部进行远程访问。 有关详细信息,请参见 vol manage 命令参考。

  8. zFS 可在 OpenSolaris 组件的启动卷上使用

    CA AppLogic 确实支持从基于 zfs 的启动卷启动 OpenSolaris 组件。 但请注意,此行为未经过 CA 验证,可能不起作用。 Solaris 10 不支持 zfs。

  9. 用于 Solaris 卷操作的 CA AppLogic Solaris filer 支持 zfs 的有限变体

    当前,仅支持单设备 zfs 池。 为了在 CA AppLogic 中充分利用所有 zfs 功能,用户可以在其组件内部装配自己的 zfs 池。 如果某个 zfs 池要用于镜像,在创建该池中使用的 CA AppLogic 卷时应禁用 CA AppLogic 镜像(在创建卷时使用 mirrored=0 选项)。 此外,使用 CA AppLogic Solaris filer 创建的 zfs 池将不能在 Solaris 10 中运行。 有关所有 CA AppLogic 操作系统限制,请参见《组件开发人员指南》

  10. ufssol 文件系统的最大卷大小为 1TB-1MB

    如果您需要大容量存储,请使用不同的文件系统。

  11. 组件配置的属性标记仅受 volfix 配置模式支持

    新的 dhcp 配置模式不支持组件配置的属性标记。 在将组件从 volfix 配置模式转换为 dhcp 配置模式时,APK 文档介绍了如何处理依赖组件配置属性标记的组件。 有关详细信息,请参见组件工具包 (APK)。

  12. 如果应用以只读模式打开,将不会出现验证标记

    要看到应用的验证标记,请以编辑模式打开应用。 验证标记用于标记未正确配置所有强制性属性/终端/卷的组件。

  13. 基于文本的图形控制台在安装后必须与 Solaris 10 配合使用

    在安装过程中,iso2class 可用于使用图形控制台安装 Solaris 10 组件。 但是,在完成安装并重新启动组件后,图形控制台仍然可用,但必须以文本模式使用(不能访问 Solaris 10 桌面-严格基于文本的访问)。 这是由于 Solaris 10 GUI 的问题(不是 CA AppLogic 缺陷)。

  14. 随 CA AppLogic 分发的所有组件缺少 GUI/桌面软件包/支持(X11、Gnome 桌面等)

    因此,图形控制台不能与这些组件一起使用。 这是有意设计的,是为了使组件尽可能地紧凑。 使用新的 iso2class 实用工具,用户可以自己创建具有完全桌面支持的组件。

  15. 如果同时运行其组件具有相同实例名的多个 Windows 应用,会在 Windows 中导致重复的计算机名称错误

    此错误是由于 CA AppLogic 将组件的计算机名称设置为实例名称而导致的。 因此,如果在网格上运行的多个组件具有相同的实例名称,则在 Windows 的图形控制台中会显示重复的名称错误。 此错误只是个警告,并不影响网格或其操作。 但是,如果需要使用 Windows 作为域控制器,则需要为每个组件将计算机名称设置为唯一的名称。 您可以使用 wincfg 实用工具在您的组件中设置计算机名称。

  16. 图形控制台需要在 IE/FF 浏览器中使用最新的 Java 版本

    我们已经在 IE/FF/Chrome/Safari 上测试过 Java 6 update 7 版本。 如果未使用最新的 Java 版本,图形控制台可能无法正常运行(将在试图加载时挂起)。 在将图形控制台错误报告给 CA 之前,请务必确认您使用的是最新的 Java 版本(如果您需要在浏览器中升级 java,随后一定要重新打开浏览器,以使图形控制台正常工作)。

  17. 在控制器恢复时可能无法满足故障转移组

    在备用服务器成为新的主服务器时,如果该服务器上没有足够的资源来启动网格控制器,则 CA AppLogic 会在网格中的其他服务器上重新启动新主服务器上运行的组件,这样即可从新主服务器上启动网格控制器。 请注意,这可能会中断组件故障转移组。 如果 CA AppLogic 停止这些组件之一,则可能无法在其他服务器上重新启动该组件,因为可能没有足够的资源来满足故障转移组。

  18. 基于 Xen-HVM 的组件所使用的内存大于所配置的内存

    所有基于 HVM 的组件(Solaris 10、Windows 等)所使用的服务器内存大于所配置的内存。 通常,根据分配给基于 HVM 的组件的内存量,组件会使用组件运行所在的服务器的附加内存(此附加内存是服务器上运行的虚拟 Hypervisor 所需的内存,称为影子内存)。 因此,尽管与分配给组件的内存相比,服务器可能有足够的内存,但组件可能无法在该服务器上运行,因为服务器上可能没有基于 HVM 的组件所需附加影子内存。 在应用启动期间,CA AppLogic 排定程序在排定组件时会将此附加卷子内存考虑在内。

  19. 使用 10G 主干网(Xen 和 ESX)时,不同服务器上运行的组件之间的最大网络吞吐量可达 2Gbps。

    在使用 10G 的主干时,不同服务器上运行的组件之间可达到的最大吞吐量约为 2Gbps(可能是由于 CA AppLogic 使用的 Hypervisor 中的某种限制)。

  20. Internet Explorer 无法用于访问基于 Ubuntu 的组件的图形控制台。

    可以使用任何其他浏览器。

  21. CA AppLogic 3.x 中新增的共享接口支持不适用于基于 Windows 的组件

    共享接口应与所有其他操作系统一起使用。

  22. 如果网格的任何服务器有 4 TB 以上的本地存储区,整个网格的 dom0 内存必须设成 1 GB。 可在您安装网格时,通过 BFC 使用参数 dom0_vm_mb=1024 来指定该设置。
  23. BFC 使您可以为每个 VLAN 配置多个 IP 范围,CA AppLogic 显示板和应用连接配置 GUI 会列出 VLAN 和 IP 范围的每种可能组合。 这将在未来的版本中得到修复。
  24. 使用 CA AppLogic 分发的目录和示例应用尚未更新以包括新的多个外部接口 (MEI) 功能。 因此,如果用户分支默认目录组件之一,并且想使用多个外部接口,则必须更改该组件的脚本(脚本假定组件只有一个外部接口)。 在未来的版本,将更新目录和示例应用,以支持 MEI。
已知问题

下面是此版本中的已知问题:

严重性级别 1
严重性级别 2
严重性级别 3
  1. 在没有写缓存的情况下使用 HP Smart Array RAID 控制器时减少性能

    在没有启用写缓存的情况下,使用 HP Smart Array RAID 控制器时,会减少 50% 的性能。 此问题已经在带有 Smart Array P410i 256mb 的 HP DL 580 G7 服务器上经过检验。 这些卡需要安装启用写缓存的电池或电容器。

  2. 确保在 Emulex 10G NIC 上的 SR-IOV BIOS 设置为禁用

    在使用 ServerEngines Corp. Emulex OneConnect 10Gb NIC (be3) (rev 01) NIC 和 CA AppLogic 时,如果启用“SR-IOV BIOS”选项,那么这些 NIC 会不正确地退回数据包。 这些退回的数据包改变桥的转发缓存,导致桥丢弃数据包,而不是将他们转发给正确的目标。 这在 CA AppLogic 中引起不稳定性,导致间歇的应用启动失败。 因此,请确保对于网格中所有服务器上的所有 Emulex 10G NIC, SR-IOV BIOS 设置为禁用。

  3. 缺陷 SCR 6280 - 使用 10G 主干 (Xen) 时,运行在不同服务器上的组件之间的最大网络吞吐量约为 2.5 Gbps

    在使用 10G 主干时,运行在不同服务器上的组件之间可实现的最大吞吐量约为 2.5 Gbps(您可根据正在使用的 10G 硬件类型看到不同的结果)。 CA 当前正在研究几个网络优化项目(如启用巨大框架),可能在将来 CA AppLogic 版本中启用,以便增强 10G 网络性能。

  4. 缺陷 SCR 2203-卷挂接阻塞导致无法启动应用(很少见,且无法重现)

    应用极少会由于其中一个服务器上的卷挂接阻塞而无法启动。 CA AppLogic 会检测阻塞的卷挂接并通过网格显示板将其报告给用户。 如果您的网格上发生此问题,请通知 CA Support。 或者,可以通过禁用或重新启动发生挂接阻塞的服务器来解决此问题。

  5. 缺陷 SCR 3416-如果主服务器无法响应,网格控制器将不会自动恢复

    如果发生这种情况,重新启动主服务器会将网格还原为操作状态。

  6. 缺陷 SCR 2239 - CAT

    VDS:安全漏洞:初始用户/密码设置

  7. 缺陷 SCR 2243-CA AppLogic GUI 在与 Microsoft Internet Explorer 6 或 7 一起使用时会泄漏内存

    如果使用 Microsoft Internet Explorer 6 或 7 访问 CA AppLogic GUI,在打开应用进行编辑或打开 Web shell 时,GUI 会泄漏内存(其中每项操作泄漏 5-20 MB 系统内存)。 建议每隔几小时关闭并重新打开一次浏览器,以解决内存泄漏问题。 也可以使用 Firefox、Chrome 或 Safari 来代替 Internet Explorer。

  8. 缺陷 SCR 1471-当网格控制器上存在负载时,GUI 会超时并注销用户

    当网格控制器上的负载较重时,GUI 不再自动注销用户。 相反,用户会收到一条消息,指出发生网络错误。 但是,在这种情况下,GUI 仍正常运行。 仅当控制器上存在较重负载时(时启动 4 个应用和复制大型卷),才会收到网络错误消息。 在大型网格中,请尝试将多达整个 CPU 核心和 1 GB RAM 的内存分配给控制器。

  9. 缺陷 SCR 857-网格重新启动可能会将一个或多个系统卷降级

    如果使用 grid reboot 命令来重新启动网格,则网格在重新启动之后恢复正常时,一个或多个系统卷可能会降级。 CA AppLogic 会首先自动修复这些卷。

  10. 缺陷 SCR 1199-无法迁移数据流均位于禁用的服务器上的卷

    在迁移卷时,请确认其中至少一个数据流位于启用的服务器上,否则无法执行迁移命令。 可通过操作两次将卷从其原始服务器组中完全迁移出来。

  11. 缺陷 SCR 1496-由于重新启动服务器花费的时间太长,网格自动应用恢复 (HA) 可能会失败

    一些物理服务器在重新启动时可能会花费很长时间-这可能导致 CA AppLogic 的网格自动恢复失败。 此问题的最终结果是在网格从故障状态恢复后,有些应用可能无法自动重新启动。 这是因为,网格控制器最多留出 10 分钟来等待所有服务器重新启动并重新连接到网格控制器(这些时间对于重新启动所有服务器来说是不够的)。 解决方法是,在所有服务器均已重新连接到网格控制器之后手动重新启动应用-执行“list srv”可帮助确保所有服务器均连接到了网格控制器,它们应处于 UP 状态。 在 CA AppLogic 2.1 中,服务器启动超时为 10 分钟,如果由于硬件或 BIOS 故障导致服务器无法启动,通常会发生此问题。

  12. 缺陷 SCR 1234-在操作员有意重新启动网格时,网格振荡文件有时不会重置

    在操作员重新启动网格时,网格振荡状态理应重置,并且会在显示板上应显示一条消息,指出操作员有意重新启动网格(“操作员已重新启动网格...”)。 有时,在重新启动网格时,既不重置网格文件,也不显示显示板消息。 这可能引起的唯一问题是,下一个网格失败时应用可能不自动重新启动(取决于出现该缺陷时,网格已失败的次数)。 解决该问题的方法是,如果在有意重新启动网格之后,没有显示显示板消息,请联系 CA Support以重置网格上的网格振荡状态。

  13. 缺陷 SCR 1360-组件显示的内存和磁盘大小要稍小于分配的大小

    资源稍微减少的原因与服务区域的分配有关。 对于内存,可能是由于与虚拟机的内存映射表相关的 XEN 所致。 对于磁盘,是由于常规文件系统服务区域所致(这与在常规 Linux 服务器上一样)。

  14. 缺陷 SCR 2293-有时,在编辑器中打开应用会出现这样的消息:应用已锁定进行编辑

    在这种情况下,该应用未由任何其他用户打开进行编辑,但是 CA AppLogic 编辑器会错误地认为有其他用户打开该应用进行编辑。 如果发生该问题,只需在编辑器打开应用出现提示时直接覆盖该应用锁。

  15. 缺陷 SCR 2313-在使用 CA AppLogic GUI 时,IE6/7 要比 FireFox/Chrome/Safari 大约慢 2 倍

    速度减慢的时间主要发生于在 CA AppLogic 应用编辑器中打开应用时。

  16. 缺陷 SCR 2497-在打开图形控制台时客户端计算机崩溃之后,重新打开图形控制台需要 15 分钟

    如果客户端使图形控制台打开并且它们失去与 Internet 的连接(客户端网卡故障、客户端计算机崩溃、Internet 访问不可用等),则重新打开图形控制台将需要 15 分钟。

  17. 缺陷 SCR 2548/SCR 2549-在将 CA AppLogic 图形控制台用于 Ubuntu 时出现问题

    在使用 CA AppLogic 图形控制台时,鼠标很难在 Ubuntu 中使用。 这是由于 XEN VNC 支持的限制(不支持鼠标加速)。 一些用户报道称,调整 Ubuntu 中的鼠标设置可解决该问题。 此外,在文本中通过键盘键入内容时,很少会重复多次键击操作(在此情况下,只需删除显示的额外字符)。

  18. 缺陷 SCR 2498-用户在文本启动控制台中输入的所有文本都回显到控制台

    这包括登录到组件时输入的密码。 文本启动控制台应仅用于调试目的。 可使用 SSH 控制台来实现所有其他目的。

  19. 缺陷 SCR 2501-用户必须按 Enter 键才能在第二次打开文本启动控制台之后,在其中看到输出

    如果用户在组件的文本启动控制台打开之后又重新将其打开,他们必须按 Enter 键才能看到登录提示或命令提示符。 这是因为启动控制台正在等待用户输入(登录信息或要执行的命令)。

  20. 缺陷 SCR 3107-在备用服务器上重新启动网格控制器时,未启动故障转移组中的组件

    如果网格具有故障转移组中的组件,且该故障转移组在需重新启动其网格控制器的备用服务器上运行,则 CA AppLogic 可能会停止会损坏故障转移组的该组件。

  21. 缺陷 SCR 2134-网格升级导致生成有关网格重新启动原因的不正确警告

    将网格升级到最新版本之后,会发布显示板消息,指出网格由于硬件问题而失败。 该消息可安全忽略并从显示板中删除。

  22. 缺陷 SCR 3499-CA AppLogic APK 不适用于最新的 Ubuntu 9.10 或 10.x 版本

    组件工具包 (APK) 当前不适用于 Ubuntu 9.10 或 10.x,因为该工具包与较新的操作系统之间存在多种不兼容性。 但是,CA AppLogic 论坛中有许多帖子介绍如何将一些较新的操作系统分发与 CA AppLogic 结合使用。

  23. 缺陷 SCR 3709-如果外部 NIC 在网络 HA 配置中出现故障,组件会临时不可访问(5 分钟)

    如果将网络 HA 配置用于 CA AppLogic,并出现外部网络故障,则使用外部接口的应用/组件可能有长达 5 分钟的时间不可访问。 这可能起因于缓存 MAC 地址的外部路由器。 等待路由器刷新其 ARP 缓存,或通过应用还原操作同时发送 ARP 响应和 arping。 这仅影响外部网络(主干网不受影响)。

  24. 缺陷 SCR 4028/SCR 4030-Solaris 10 不受支持

    Solaris 10 不能在适用于 Xen 和 ESX 服务器的 CA AppLogic 3.x 上运行。

  25. 缺陷 SCR 4053-基于 ESX 的服务器不支持 OpenSolaris

    OpenSolaris 仅在基于 XEN 的服务器上工作。

  26. 缺陷 SCR 4159-GUI 恢复不能在基于 ESX 的服务器上运行

    恢复 GUI 仅在基于 XEN 的服务器上工作。

  27. 缺陷 SCR 4273-共享接口的 MON 计数器不能正常运行

    共享接口不支持组件计数器。

  28. 缺陷 SCR 5242-在完成网格重新加电后,不重置系统启动时间

    用户对网格重新加电时,系统启动时间不会重置。 如果重新启动网格,应重置系统启动时间。

  29. 缺陷 SCR 5269-网格 power_cycle 命令可能无法重新启动主服务器

    如果用户使用网格 power_cycle 命令重新加电网格,主服务器则可能无法重新启动。 这仅在新网格安装之后执行该命令且在执行重新加电命令之前,从未重新启动该网格时发生。 在新的网格安装之后在某一时重新启动网格将避免该问题的发生。

  30. 缺陷 SCR 6592-SAN-NFS:CA AppLogic 应当在运行时自动检测 NFS 共享大小的更改。

    如果在网格运行时更改 NFS 共享大小,直到网格重新启动,CA AppLogic 才会检测到该更改。 此问题将在未来的版本中得到解决。

  31. 缺陷 SCR 6378-SAN-NFS:删除正在运行/失败的网格后会保留网格的文件夹(但会删除文件夹的内容)

    在使用 SAN 的网格被销毁时,CA AppLogic 会删除该网格在 SAN 上的文件夹的内容,但保留空文件夹。 此问题将在未来的版本中得到解决。

  32. 缺陷 SCR 6448-将服务器添加到 Xen 网格会失败,且内核会崩溃(Dell H200 RAID 卡)

    使用 H200 RAID 卡的基于 Dell 的服务器无法与 CA AppLogic 一起使用。 此问题将在未来的版本中得到解决。

    解决该问题的方法是在使用 Dell 服务器创建网格之前,在该服务器上启用硬件 RAID。

  33. 缺陷 SCR 6684-RedHat 5.3:将 iso2class 实用工具与 4 个 ISO 映像结合使用来创建组件会失败

    无法使用 iso2class 安装基于 RedHat 5.3 的组件。 此问题将在未来的版本中得到解决。

  34. 缺陷 SCR 6701-从 3.0 或 3.1 升级到 3.5 偶尔会失败

    (非常少)从 3.0 或 3.1 升级到 3.5 可能会失败。 在此特殊的升级失败情况下,使用 BFC 访问的网格状态日志(单击网格状态即可打开日志)中将存在下列消息。

    installing the controller image(正在安装控制器映像)
    ioctl: LOOP_SET_FD: Device or resource busy(ioctl:LOOP_SET_FD: 设备或资源忙碌)
    installing new controller FAILED, aborting(安装新控制器失败,正在中止) 
    

    如果日志中存在这些消息,请重新运行升级,应该会成功。

    注意:此问题实际上是 CA AppLogic 3.0 和 3.1 中的缺陷,并且在 CA AppLogic 3.5 中已得到解决。

  35. 缺陷 SCR 7048-从 3.5 到 3.1 的 ESX 网格回滚不起作用

    对于基于 ESX 的网格,回滚命令对于从 3.5 到 3.1 的回滚不起作用。 但是,作为变通方法,可以使用降级命令(请注意,降级花费的时间比回滚稍微长一些)。 此问题将在未来的版本中得到解决。

  36. 缺陷 SCR 7064-基本 ext3-snapshot 的卷在基于 ESX 的网格上不起作用

    基本 ext3-snapshot 的卷在基于 ESX 的网格上不起作用。 不过,这些卷适用于基于 XEN 的网格。 如果您正在使用基于 ESX 的网格,并且您需要使用 ext3-snapshot 卷,您可以将基于 XEN 的节点添加到网格中,并且使用该节点来创建/管理您的 ext3-snapshot 卷(在运行卷命令时,禁用所有的 ESX 服务器,以使 CA AppLogic filer 在基于 XEN 的节点上运行)。 此问题将在未来的版本中得到解决。

  37. 缺陷 SCR 7397 -“vol migrate”无法迁移来自本地 SAN 的其中一个卷流(错误地试图将流迁移到外部 SAN)

    在配置为使用外部 SAN 的网格上,尝试迁移本地 SAN 上的卷流可能会失败。 CA AppLogic 不是将卷流迁移到本地 SAN,而是错误地试图将其迁移到外部 SAN。 如果遇到此类故障,请对 vol migrate 命令使用 store=local 选项。 此问题将在未来的版本中得到解决。

  38. 缺陷 SCR 7394:将 AppLogic 从 3.0.30 升级到 3.5.x 之后,网格控制器挂起

    将 CA AppLogic 从 3.0.30 升级到 3.5.x 时,网格控制器间歇性挂起,执行的所有 3tshell 命令返回内存不足错误消息。

    要解决此问题,请重新启动网格控制器。 此问题将在未来的版本中得到解决。

  39. 缺陷 SCR 6779:在某些类型的 Broadcom NIC 上,AppLogic 安装失败

    在某些 Broadcom NIC(特别是 NetXterme II BCM5709/5716)上,NIC 驱动程序报告的链路速度为 100Mb/s 或 10Mb/s。 因此,CA AppLogic 安装失败。

    要解决此问题,请尝试重新安装。 此问题将在未来的版本中得到解决。

  40. 缺陷 SCR 6517:Web Service API 中将并发异步作业数限制为 10 个。

    安装在网格控制器上的 OpenSSH 版本将并发多路复用 ssh 会话数限制为 10。 因此,如果执行的异步请求超过 10 个,API 会放弃这些请求。

    要解决此问题,请确保同时向 API 发送的异步请求不超过 10 个。 此问题将在未来的版本中得到解决。

  41. 缺陷 SCR 7059:使用多个外部接口时,重命名组件集或组件接口之后应用编辑器无法加载。

    如果重命名组件集或组件接口,应用编辑器将无法完整加载。 此问题将在未来的版本中得到解决。

  42. 缺陷 SCR 7516:向 ServerEngines Corp 报告的 Nic 状态为“活动-关闭”。 Emulex OneConnect 10Gb Nic (be3) (rev 01)。

    在具有这些 Nic 的服务器上,创建网格之后,srv info srvX –extended 的输出显示的 Nic 状态为“活动-关闭”。 已将此问题确定为硬件引起的问题。 要解决此问题,请登录到各个交换机,关闭并再次启用 srvX 上 Nic 的端口。 此时显示的状态应该是“开启”。 此问题将在未来的版本中得到解决。

  43. 缺陷 SCR 7507:当使用具有 Broadcom NetXtreme II 57711 Nic 的 Dell R710 服务器时,网格安装失败。

    据观察,在具有 Broadcom NetXtreme II 57711 (bnx2x) 10Gbe nic 的 Dell PE R710 服务器上,因 BFC 未能发现服务器而导致安装失败。 这是硬件引起的问题,将在未来的版本中解决。

特定于基于 Windows 的组件的已知问题

下面是该版本中与 Windows 组件相关的主要已知问题: 此外,有关其他过程和注意事项,请参见“Windows 组件安装参考”。

  1. 缺陷 SCR 6515-APK(新原始格式):WIN0364DC 组件偶尔无法在 XEN 网格上启动

    在使用 CA AppLogic 3.5 附带的新 Windows APK 时,64 位 Windows Server 2003 DataCenter 版本可能偶尔无法在基于 Xen 的网格上启动。 如果遇到此问题,重新启动组件可解决问题。 此问题将在未来的版本中得到解决。

  2. 缺陷 SCR 2751-在含有损坏文件系统的卷上无法执行 Windows filer 卷调整大小操作

    如果源卷包含损坏的目录条目/文件,Windows filer 可导致卷调整大小操作失败。 该问题的主要来源是一些 Microsoft 软件安装特意包含无效目录条目(我们不确定其原因;在用户在其组件中安装 Microsoft SQL Server 版本时,已发现该问题)。 另外,由于自然磨损也会导致源卷损坏。 在调整卷的大小之前,可通过在卷上运行文件系统修复 (vol fsrepair) 来解决该问题。

  3. 缺陷 SCR 3078-由于 Windows filer 启动失败而导致 NTFS 卷的大小调整失败

    CA 已发现在 NTFS 卷调整大小的 100 次操作中大约有 2 次会失败。 这两次失败发生的原因是 Windows filer 无法在网格上正确启动。 如果发现该问题,再次重复执行调整大小操作应当成功。 但是,该问题在该版本中应当已解决;如果发现该问题,请通知 CA 技术支持。

  4. 缺陷 SCR 2750-Windows filer 无法创建 ntfs 卷(极少出现 diskpart 错误)

    Windows filer 使用名为 diskpart 的 Microsoft 实用工具来处理 Windows NTFS 卷。 有时,diskpart 无法获得卷信息或可能无法挂接卷。 这是非常罕见的故障,并导致执行卷创建或卷调整大小命令以故障转移 NTFS 卷。

  5. 缺陷 SCR 2748-有时,Windows 组件在其内部网络上检测到重复的 IP

    如果用户具有一个包含 Windows 组件的应用,且将一个或多个 Windows 组件添加到该应用或向/从 Windows 组件中添加/删除终端,则在首次启动该应用期间,其中一个 Windows 组件可能在内部网络上检测到重复的 IP(仅在修改应用后首次启动该应用期间才发生该问题)。 该问题不应导致应用的任何操作失败或需要用户干预;重复的 IP 地址纯粹是临时的。 最坏的情况是一些涉及任何 Windows 组件的网络通信可能会最多延迟 30-60 秒。

  6. 缺陷 SCR 3021-在 Windows 应用停止进度达到 99% 时,该应用被卡住

    在尝试停止 Windows 应用的进度达到 99% 时挂起;该操作在 15 分钟之后超时。 应用包含 2 个 Windows 2003 Server DataCenter Edition 组件实例 (WIN03DC)。 停止其中一个 Windows 组件,另一个组件会在执行 comp stop 期间挂起。 该问题仅出现过一次且不会再现。

  7. 缺陷 SCR 2504-有时,磁盘读取/写入计数器值报告为零(Windows perfmon API 缺陷)

    有时,Windows 组件的以下磁盘 I/O 计数器值会报告为零(即使生成持续的 I/O):写入/读取的总字节数、写入/读取的卷数和写入/读取花费的时间。 这是由 Windows perfmon API 中的缺陷所致-零值是由 Windows perfmon API 报告的。

  8. 缺陷 SCR 2821-Windows filer MSI 在本地化为日语版本的 Windows 下不起作用

    除 filer MSI 之外,本地化为日语版本的 Windows 应适用于 CA AppLogic。

  9. 缺陷 SCR 2862-如果安装虚拟 DVD-ROM 设备,Windows 组件会无法启动

    如果安装 MagicISO 虚拟 DVD-ROM 设备,则 Windows 组件会无法启动。 对于 CA AppLogic 中基于 Windows 的组件,当前不支持虚拟 DVD-ROM 设备。

  10. 缺陷 SCR 2499-在 Windows 组件中发现新 NIC 可能花费几分钟,这会导致启动超时

    有时,Windows 在组件内检测新 NIC 会花费几分钟。 当用户为 Windows 组件单例添加/删除终端时,会发生该问题。 在检测这些新的 NIC 时所用的额外时间会导致组件启动超时。 要解决该问题,请增加 Windows 组件的启动超时时间。

  11. 缺陷 SCR 2505-将 Windows 组件迁移到其他网格可能会触发 Windows 组件的重新激活

    如果用户在其网格上具有 Windows 组件,并且他们将该组件迁移到具有不同硬件的其他网格,Windows 组件可能需要重新激活(Microsoft 的 Windows 重新激活)。 在更改特定量的硬件时会触发重新激活(CA 尚未准确了解哪些硬件更改会触发重新激活)。 请注意,执行重新激活可能需要从 Windows 组件内部访问 Internet。 在调整 Windows 组件启动卷的大小和将组件迁移到不同网格之后会出现这个特殊问题。

  12. 缺陷 SCR 3814-Windows 2008 filer 根访问权限通过 SSH 进行限制

    该问题仅影响 Windows 2008 Server 32/64 位(Windows 2003 Server 运行正常)。 在通过 filer 或 SSH 访问 Windows 2008 卷的组件时,用户可能由于权限问题而不能访问/修改文件。 要通过命令 shell 访问/修改文件,请通过图形控制台登录到 Windows 桌面并打开命令 shell。 命令 shell 可用于访问/修改文件。

  13. 缺陷 SCR 4593-Windows 2003 VDS/基类无法启动(启动时超时)

    Windows 2003 Server 在安装期间首次启动时超时。 确保按照 Windows 提供的说明解决该问题。

  14. 基于 Windows 2003 的组件-安装 Turbogate PV 驱动程序需要用户干预

    在安装 Turbogate PV 驱动程序时,运行在基于 Xen 的网格服务器上的组件第一次启动时,用户必须手动单击硬件安装向导,为该组件中配置的所有终端安装 Turbogate PV 驱动程序。 否则,该组件将无法启动。

  15. 缺陷 SCR 5737-基于 Windows 2003 Server 32/64 位的组件;仅在最初创建该组件的 Hypervisor 上工作

    在创建新的 32/64 位 Windows 2003 服务器组件时,该组件将仅在网格服务器(使用最初创建该组件的相同 Hypervisor)上工作。 否则,该组件在启动过程中崩溃。 例如,如果该组件最初在基于 ESX 的网格服务器上创建,那么该组件仅可以在基于 ESX 的网格服务器上使用(使用基于 XEN 的网格服务器上的组件将不会起作用,该组件将在启动过程中崩溃)。

  16. 缺陷 SCR 5960-当使用 MON 时,Windows 2003 组件的计数器不显示

    这是 Microsoft Windows 2003 服务器的已知问题。 Microsoft 有解决方案来解决您的 Windows 2003 组件的这个问题。

不能再现的问题

以下问题列表已在 CA AppLogic 版本 2.4-3.x 中出现,但很难再现,仅出现一次或两次。 如果其中任何问题在网格上出现,请将缺陷报告发送给 CA 并描述发生了什么问题,执行了哪些 CA AppLogic 命令导致的此故障。

  1. 缺陷 SCR 2842-服务器由于 Linux 内核崩溃而重新启动(在 2.7/2.8 中出现该问题)

    网格中的服务器由于处于其 dom0 中的 Linux 内核崩溃而自行重新启动。 这不会像先前的 CA AppLogic 版本那样导致整个网格失败;但会导致应用停机。 在此情况下,CA AppLogic 会在网格中的其他服务器上重新启动在出现故障的服务器上运行的组件。 如果您的网格中出现该问题,请联系 CA Support

  2. 缺陷 SCR 2834-服务器失去与网格控制器的连接

    在 CA AppLogic 2.4 中,有几种情况会出现服务器失去与网格控制器的连接并重新启动的现象。 这可导致该服务器上运行的所有组件将在网格中的其他服务器上进行重新排定,还可导致应用停机。 尚不了解服务器失去与网格控制器的连接的原因。 在 CA AppLogic 2.7-3.x 中,如果服务器失去与网格控制器的连接,服务器会试图重新连接到网格控制器,如果成功,服务器仍保持运行状态,且不会发生应用停机。 如果服务器在 1 分钟内无法重新连接到网格控制器,服务器会重新启动,且会发生应用停机。 在服务器失去与网格控制器的连接时,会在显示板中记录一条消息。 如果出现该问题,请立即联系 CA Support

  3. SCR 2903-同时执行 4 个 NTFS 卷的卷调整大小操作失败

    在 CA AppLogic 2.7/2.8 上,同时调整 4 个 NTFS 卷的大小会导致所有 4 个卷的调整大小操作都失败。 该问题仅出现过一次。

  4. SCR 3289-在磁盘空间接近不足时出现 NASR 复制故障

    当 NASR 在 1 GB 的卷上复制 800 MB 的文件时,NASR 组件没有响应。 CA 无法再现该问题。 如果您在网格上遇到该问题,请通知 CA 支持。

  5. SCR 3711-在网格中打开多个图形控制台会导致服务器崩溃

    用户对网格上运行的不同 Windows 组件打开 6 个以上图形控制台(同时打开)。 在打开第 7 个图形控制台时,其中一个服务器会重新启动并重新加入网格。 在出现故障的服务器上运行的组件会在网格中的其他服务器上重新启动。 该问题仅出现过一次。

BFC 的已知问题

我们已在此版本中发现 Backbone Fabric Controller (BFC) 的下列已知问题:

  1. 如果您正在硬挂接 NFS 的文件系统上运行 BFC 数据库副本(NFS 硬挂接为默认;不使用可选的软挂接功能),那么该挂接 NFS 的文件系统会失败,且 BFC 将挂起。 此问题是 NFS 自身的特征,不是 BFC 可以直接控制的。 如果出现此状态,且您无法还原 NFS 文件系统,可以使用下列步骤删除 BFC 对该副本的依存关系来还原正常操作:
    1. 以根用户身份登录到 BFC 系统。
    2. 通过键入以下命令更改为 bfcadmin 用户:
        su - bfcadmin
      
    3. 运行 <BFC 安装位置>/bin/stop_replication(默认情况下为 /opt/bfc/bin/stop_replication

    重要信息! 打破该依存关系之后,系统将在没有副本的情况下运行。请返回到 UI,并在同一位置或其他位置创建另一个副本。

  2. 缺陷 SCR 6990-无法通过 BFC API 取消网格的默认 VLAN 设置
  3. 缺陷 SCR 6027-从 BFC UI 启动的网格在使用“3t grid shutdown”命令关闭之后出现故障

    请不要对网格使用“3t grid shutdown”命令。

  4. 缺陷 SCR 7036-由于 nfs 挂接错误导致 ESX 网格出现故障

    发生这种情况时,在 BFC 上执行“service nfs restart”应该可以解决该问题。

  5. 缺陷 SCR 7058-出现故障的 ESX 网格节点在重新启动后进入无限循环的重启
  6. 缺陷 SCR 6424-DL360g4p 上出现驱动程序磁盘的 BMI 安装提示

    如果显示此消息,只需按“Esc”键继续安装即可。

  7. 缺陷 SCR 6779-已知具备 GigE 接口的服务器有时报告/发生故障,指出它们不是以 GigE 速度运行

    在 CA AppLogic 3.5 中,某些 Broadcom Corporation NetXtreme II NIC 误报为速度太慢。 如果遇到此错误,可以尝试重新发现服务器。

  8. 缺陷 SCR 7296-BFC:在清单显示“副本数据库空间错误”时,无法创建新网格。

    如果 BFC 在关闭之前将空间用完,在为其释放空间之后,需要重新启动 BFC 才能使其正常运行。

  9. 缺陷 SCR 7312-使用密码 !"$%&/()=?' 执行无人值守的安装失败

    如果对此版本的产品执行无人值守安装,密码中不能包含“=”

  10. 缺陷 SCR 7363-BFC 3.5 中不允许使用 VLAN ID 0

    如果在 AppLogic 3.1 的 BFC 中使用了 VLAN 0,则可以继续使用该 VLAN ID,但是自 3.5 版起,无法在 UI 中分配该 VLAN。

  11. 缺陷 SCR 7376-如果将服务器的公共端口配置为 Trunk,在网络检测过程中会跳过 STP 检查

    此缺陷偶尔允许服务器进入本应阻塞的网格。 如果端口配置正确,便不会遇到此问题。

  12. 缺陷 SCR 7401-当“编辑网格参数”文本框中的字符总数超过 256 个时,BFC 会抛出“System_limit”错误。

    如果需要使用 256 个以上的字符,只需将这些参数分散到多个网格更新中即可。

  13. 缺陷 SCR 7411-BMI:BMI 期间对 NFS 副本数据库路径的所有权权限的检查无效

    使用裸机安装并尝试在挂接 NFS 的文件系统上定义副本时,如果目录不归 bfcadmin 所有,便会出现问题。 一种简单方法是在安装之后通过 UI 添加副本。 另一种方法是执行以下操作:

    1. 在 NFS 服务器上,使用以下命令创建用户“bfcadmin”和组“ bfc”:
      groupadd -g 64869 bfc
      useradd –u 64870 -g 64869 bfcadmin
      
    2. 在 NFS 共享上运行 chown 和 chgrp 命令
      chown bfcadmin /mnt/replica
      chgrp bfc /mnt/replica
      

      (其中,/mnt/replica 是副本目录的路径)

  14. 缺陷 SCR 7413-禁用超线程时,BFC UI 显示错误的 CPU 核心数。

    在某些服务器上,禁用超线程和启用超线程时,系统报告的 CPU 数相同。 已在某些 Dell R610 上发现此问题。

  15. 缺陷 SCR 7470-当通过 API 调用传递多个参数时,BFC 无法应用网格参数。

    此问题与将参数写入要传递到 aldo 集的配置文件的方式有关。 如果用户在 UI 中输入数据时使用逗号分割条目,也会出现此问题。 BFC API 的解决方法是仅传递单个字符串,并在条目之间使用换行符。

    例如:

    \"additional_config\":[\"ext_dns1=155.35.34.108\next_dns2=141.202.1.108\"]
    

    而非:

    \"additional_config\":[\"ext_dns1=155.35.34.108\",\"ext_dns2=141.202.1.108\"]
    
  16. 缺陷 SCR 7526-由于未在外部接口上正确检测到边缘端口模式,BFC 可能会错误隔离正在发现的节点。

    当在外部交换机上启用生成树协议 (STP),并且连接到外部服务器接口的交换机端口上的未标记 VLAN 与连接到 BFC 服务器外部接口的交换机端口的未标记 VLAN 不相同时,会出现此问题。 将外部服务器接口上的 stp_port 设置为未知并隔离服务器。 解决方法是,在外部交换机上完全禁用 STP,或将连接到服务器外部接口的交换机端口的未标记 VLAN 配置为与连接到 BFC 服务器外部接口的端口的未标记 VLAN 相同。 然后,取消服务器隔离以重新启动发现过程。

  17. 缺陷 SCR 7523-如果网格包含从随后删除的子网中选择的应用 IP 地址范围,将 BFC 从 3.1 升级到 3.5 时将失败。

    出现此问题的原因是,如果网格具有位于某个子网中的应用 IP 地址范围,则在 3.1 中删除该子网会失败。 升级时会查找缺失的子网,但由于该子网已经不存在,所以升级会失败。 解决方法是,根据失败的升级提供的说明还原之前安装的 BFC 3.1。 然后,转到各个网格,从不属于当前配置的子网的网格中删除所有应用 IP 地址范围。 在某些情况下(例如随后使用新 CIDR 前缀长度参数重新添加了相同的子网时),范围可能位于当前子网的边界内,但是基础子网组件不正确,仍会导致升级失败。 您应在网格控制器 UI 中验证并确认 BFC 中的子网与应用 IP 地址范围的参数是否匹配。

  18. 缺陷 SCR 7047 - isotool -o 命令的已知问题。

    isotool -o 参数不正确显示附加在计算机上的 USB 设备(CentOS 5.5 框)。 这是 CentOS 5.5 的已知问题。 要解决该问题,您必须以根用户身份执行以下 shell 命令:

    service haldaemon restart