上一主题: 产品特征下一主题: 重要缺陷修复


已知问题

此部分包含以下主题:

重要说明

已知问题和限制

重要说明

  1. ALD 不再用于安装/升级网格并导入目录和应用。 代替 ALD 的是 Backbone Fabric Controller (BFC)。 BFC 是一种简单易用且基于 Web 的 GUI 应用,用于在单个主干内创建和管理所有 CA AppLogic® 网格。 有关如何下载/安装 BFC 以及如何使用它来管理 CA AppLogic® 网格的信息,请参阅 BFC 文档。 要将目录和应用导入您的网格(例如,CA AppLogic® 附带的 system_ms),请将目录/应用复制到您的网格的 impex 卷,并使用 cat 导入和 app 应用导入 CA AppLogic® 命令。
  2. 除 Xen 之外,CA AppLogic® 3.x 现在还支持 VMware ESX 管理程序。 CA AppLogic® 3.x 保留这两个管理程序的所有特性和功能,同时,在将 VMware 与 CA AppLogic® 结合使用时,存在一些特定于 VMware ESX 的重要使用事项:
  3. CA AppLogic® 3.x 引入了基于角色的访问控制 (RBAC)。 RBAC 提供向对象(应用模板、应用实例、目录或网格)授予权限(或控制对象)的功能。 默认情况下,在网格上创建新用户时,该用户对网格的对象具有有限的访问权限。 例如:默认情况下,用户对网格没有登录权限。 您需要配置适当访问权限 (用户和组管理, RBAC 概述)以让用户访问网格。
  4. 在 CA AppLogic® 3.x 中,对组件的操作系统支持没有先前的 CA AppLogic® 版本广泛。 自 3.7 起,将不再支持 Solaris 和 OpenSolaris。 自 3.7 起,也将不再支持 Microsoft Windows 2003 服务器组件(但如果从较旧的网格迁移这些组件,它们仍会正常运行)。

    注意:自 CA AppLogic® 3.7 开始,已删除所有基于 Solaris 的组件。

  5. CA AppLogic® 与操作系统无关,旨在与不同的操作系统配合使用。 作为其设计的一部分,所有卷操作(创建/格式化、复制、调整大小、文件系统检查/修复和管理)都在名为 filer 的 CA AppLogic® 应用内执行;它们不再与先前版本的 CA AppLogic® 一样由 CA AppLogic® 网格控制器执行。 这样,这些新的 filer 应用就像任何其它的常规 CA AppLogic® 应用一样在网格上使用资源。 因此,在网格上必须有足够可利用资源才能执行所有的 CA AppLogic® 卷操作。 请注意,filer 应用不适用于原始卷或块级卷副本。
  6. 自基于 Xen 的网格的 3.7 GA 起,网格控制器将分配有一整个 CPU 内核可供独占使用(CA AppLogic® 不会将任何组件分配在与网格控制器相同的 CPU 内核上运行)。 对于基于 ESX 的网格,网格控制器仍使用 10% 的内核(与所有早期版本一样)。
  7. 因为所有卷操作现在均使用 filer 应用来执行,与先前的 CA AppLogic® 版本相比,所有卷操作的速度较慢,因为 filer 应用必须作为卷操作的一部分来启动/停止。 通常,基于 Linux 的卷操作大约花费 20 秒,基于 Windows 的卷操作则需要几分钟。
  8. 网络带宽资源用法已在所有组件上实施。 组件使用的带宽将不能多于为其所有终端配置的带宽(分配的带宽将所有终端都考虑在内)。 确保为组件和应用配置的带宽满足带宽使用情况需求(否则在应用中可能会出现非常差的网络性能)。 每台 CA AppLogic® 服务器的最大带宽是 2 Gb(除非使用 10GE 主干网,在这种情况下的最大带宽是 20 Gb)。
  9. 经历网络流量传送后的组件(如网关、负载均衡器和端口交换机)的带宽实际上减少了一半。 例如:分配了 100M 带宽的负载均衡器实际上只有 50M(由于网络流量传入和传出组件)。
  10. 在新安装或升级的 CA AppLogic® 网格上访问 CA AppLogic® GUI 之前,用户应清除浏览器的缓存。 如果不清除浏览器的缓存,CA AppLogic® GUI 可能不能正常运行。
  11. 可通过 Web 浏览器或使用 ssh 客户端访问网格 shell。 为了加强安全,除网格安装期间外,不再支持基于密码的 ssh 登录。

    重要信息! 强烈建议您使用随 CA AppLogic® GUI 提供的 Web shell。

  12. 在通过 ssh 访问网格时,登录用户名始终是 root,与 CA AppLogic® 用户名无关。 为了 ssh 登录,用户及其角色由公共 ssh 密钥唯一标识。
  13. 必须启用 Web 浏览器的 Javascript 和弹出式菜单才能使用基于 Web 的图形用户界面(显示板、编辑器、文档)
  14. 用户负责分配、指定和使用应用的外部可见 IP 地址;CA AppLogic® 负责处理所有内部网络分配情况
  15. 尽管 Backbone Fabric Controller 使用预先仔细配置的防火墙设置所有网格服务器和控制器并禁用不必要的网络服务,我们还是鼓励用户和维护人员验证其系统的安全设置。
  16. 专用网络上服务器之间用于卷和组件间通信的网络性能测定大约为 900 Mbps。 位于不同服务器上的组件之间的 TCP 网络性能测定为 720-900 Mbps。 在运行 Windows 时,TCP 网络性能大约为 700 Mbps,UDP 网络性能大约为 500-700 Mbps。
  17. 对于不同类型的资源(CPU、内存、带宽),组件硬件资源的资源限制实施的方式不同。 CPU 是“不少于”,内存是“精确达到”(包括 VM 开销),带宽是“精确达到”。 启动应用时,可能使用 new --cap_cpu 选项以“精确达到”方式实施 CPU 资源。
  18. 以指定的最小 CPU 量启动应用时,不保证应用能确切获得指定的 CPU 量。 例如:如果应用在启动时 cpu=2,在将所有分配的 CPU 添加到该应用的所有组件后,可能会看到该应用获得 1.97 CPU。 这可能是由于在尝试将 CPU 分配给各个组件时发生了舍入误差。
  19. 在应用启动失败时,可能不会在 shell 中显示与此失败相关的所有消息。 使用 list log n=20 命令查看网格日志的其他信息。
  20. 在构建性能线性扩展占重要地位的网格时,应使用 CPU 类型/速度、内存大小和磁盘容量方面都尽可能一致的服务器。 CA AppLogic® 可在由具有不同硬件资源数量的服务器组成的网格中正常运行,但在此类网格中,性能可能会不够线性。
  21. 在由于网格控制器 VM 故障而重新启动网格控制器期间,不具有用户可见性。 如果网格控制器 VM 出现故障且 CA AppLogic® 重新启动了网格控制器 VM,则在控制器重新启动期间,不具有用户可见性。 通常,网格控制器会在 1 到 2 分钟内自行重新启动。 如果网格控制器超过 5 分钟不可用,请联系 CA 支持
  22. 创建 NTFS03 卷时总生成 NTFS08 卷。 NTFS08 卷可与 Windows 2003 Server 配合使用。
  23. 基于 ESX 的网格/服务器不支持网格和服务器的 net_discover 命令。
  24. 在将 SAN 与您的 CA AppLogic® 网格配合使用时,请确保对于使用配置的 NFS 共享的每个网格,至少有 500 GB 可用空间。 例如,如果要将 NFS 共享用于五个不同的网格,共享应当有 2.5 TB 的可用磁盘空间。
  25. 在将 SAN 与您的 CA AppLogic® 网格配合使用时,如果 SAN 或 NFS 共享在任何时间段内脱机,在使用中的一些卷可能会损坏。 如果此损坏使网格控制器无法运行,或导致应用无法启动(或任何其他网格或应用不稳定),请立即联系 CA 支持
  26. 要基于最新的操作系统分发(如 Fedora Core、Ubuntu、Debian、RedHat 和 CentOS)使用 CA AppLogic® 组件,请使用随 CA AppLogic® 3.7 或更高版本一起分发的最新 APK 版本。 如果未使用 3.7 版本中的最新 APK 版本,则必须在组件边界上配置现场工程代码 128。 该现场工程代码指示 CA AppLogic® 为专用于这些新分发的组件卷使用新的设备名称样式。 如果未指定现场工程代码 128,基于这些新分发的组件将无法启动,除非使用的是最新 APK 版本。 建议将所有组件更新为最新 APK 版本。
  27. Windows 2003 Server 模板不再随 CA AppLogic® 一起分发。 将继续支持 Windows 2003 Server 操作系统,但不再维护其模板。 建议使用 Windows 2008 或 2012 Server,而非 Windows 2003 Server。
  28. 不再支持 Solaris 和 OpenSolaris 组件(并且后续版本中也不再提供支持)。
  29. 自 CA AppLogic® 3.7 起,WEB5 组件将继续保留在系统目录中以保持向后兼容。 但是,在后续版本中可将此组件从系统目录中删除。
  30. 自 CA AppLogic® 3.7 起,LampCluster 模板应用不再随此版本一起分发,也不再维护。
  31. 现已将语言包即时修正集成到 CA AppLogic® 中。 因此,没有必要安装即时修正来获取对特定语言的支持(默认情况下安装所有语言)。
  32. 如果主数据库或副本 BFC 数据库丢失或损坏,那么从 3.1 版本的 BFC 开始,您可以从总是正在运行的自动备份来进行恢复。 这些备份实际上位于主数据库的子目录,因此它们是用于配置副本的代替者。 (如果配置了一个,那么这些备份也被写入副本的子目录。)从最新的备份还原:

已知问题和限制

本节介绍当前的已知问题和限制。

CA AppLogic® 限制
  1. 3.7 的新内容:包含的 HalSign TurboGate PV 驱动程序 3.0.1 未安装在 Windows 8(32 位)上, 但正确地安装在 Windows 8(64 位)上。
  2. 3.7 的新内容:由于对系统中组件和动态目录的新资源要求(因为这些组件重新基于 CentOS 6.3),旧版本中的示例应用将无法在 3.7 网格上启动。 请使用 3.7 版本中提供的已更新示例应用(旧示例应用中的数据卷可以迁移到较新的示例应用实例)。
  3. 3.7 的新内容:为了在基于 ESX 的网格上使用基于 Windows 的组件,维护人员必须将 system_ms-ESX-1.1.9.tar 目录导入网格。 请注意,默认的 system_ms-1.1.10.tar 目录仅适用于 Xen,在 ESX 上将无法运行。 这是由于增加的新 Windows 只读卷支持仅适用于基于 Xen 的网格,而在基于 ESX 的网格上不受支持。
  4. 3.7 的新内容:对于基于 ESX 的网格,不支持 Windows 8 和 2012 Server。 这是由于 CA AppLogic® 使用的 ESX 4.x 存在限制。 但是,基于 ESX 的网格支持 Windows 7。 对于基于 Xen 的网格,支持所有 Windows 类别(Windows 2003/2008/2012 Server、Windows 7 和 8)。
  5. 3.7 的新内容:INSSLR2 不支持备用 IP 地址(所有早期版本也不支持)。 未来版本中可能会包含此增强功能。
  6. 网格大小局限于每个 Xen 网格有 128 个服务器,每个 ESX 有 80 个服务器
    这是 CA AppLogic® 当前版本的限制。 该版本已证实最多可使用 30 个服务器;然而,也支持多达 128(Xen)和多达 80(ESX)个服务器的配置。
  7. CA AppLogic® 当前无法安装在带有 3 TB 或更大驱动器的服务器上。
  8. 为使用户界面正常运行,请为网格控制器的主机启用 JavaScript、弹出式菜单和 cookie。 确保您的浏览器已更新为最新的可用版本,以修正影响 AJAX 应用的缺陷。
  9. 未对组件终端实施协议,仅实施了端点。

    这意味着组件只能与所连接的组件(及其自身的服务器和网格控制器)进行交互。 不过,应在新组件上指定相应的协议,以确保 CA AppLogic® 的未来版本中应用设计的完整性和兼容性。

  10. 总可用磁盘空间不将卷镜像考虑在内

    grid info 命令所报告的总可用磁盘空间是一个原始估算值,未将卷镜像考虑在内。 实际的可用磁盘空间是报告的可用空间量除以镜像数(默认情况下为 2)所得到的值。 例如:如果有 1000 GB 的可用磁盘空间,网格配置为 2 个镜像,则可用的磁盘空间为 500 GB。 此外,为了成功镜像卷,必须至少在 X 个服务器上有足够的磁盘空间,其中 X 是镜像数(即使 CA AppLogic® 无法创建其中任何一个镜像,但仍会创建卷,并显示无法镜像卷的警告)。

  11. 如果某个服务器在应用启动期间出现故障,可能会导致应用无法启动

    如果启动了某个应用,且网格的其中一个服务器出现故障,则当该应用的一个或多个组件排定在出现故障的服务器上运行时,该应用将无法启动。 如果发生此情况,只需重新启动应用即可。

  12. 可通过 filer 使用的卷管理 GUI 具有每个文件 10 MB 的上载限制

    要将更大的文件上载到卷,请使用 vol manage shell 命令;请不要忘记为此命令指定外部 IP 设置,以便从卷管理器内部进行远程访问。 有关详细信息,请参阅 vol manage 命令参考。

  13. 组件配置的属性标记仅受 volfix 配置模式支持

    新的 dhcp 配置模式不支持组件配置的属性标记。 在将组件从 volfix 配置模式转换为 dhcp 配置模式时,APK 文档介绍了如何处理依赖组件配置属性标记的组件。 有关详细信息,请参阅组件工具包 (APK)。

  14. 如果应用以只读模式打开,将不会出现验证标记

    要看到应用的验证标记,请以编辑模式打开应用。 验证标记用于标记未正确配置所有强制性属性/终端/卷的组件。

  15. 随 CA AppLogic® 分发的所有组件缺少 GUI/桌面程序包/支持(X11、Gnome 桌面等)

    因此,图形控制台不能与这些组件一起使用。 这是有意设计的,是为了使组件尽可能地紧凑。 使用新的 iso2class 实用工具,用户可以自己创建具有完全桌面支持的组件。

  16. 如果同时运行其组件具有相同实例名的多个 Windows 应用,会在 Windows 中导致重复的计算机名称错误

    此错误是由于 CA AppLogic® 将组件的计算机名称设置为实例名称而导致的。 因此,如果在网格上运行的多个组件具有相同的实例名称,则在 Windows 的图形控制台中会显示重复的名称错误。 此错误只是个警告,并不影响网格或其操作。 但是,如果需要使用 Windows 作为域控制器,则需要为每个组件将计算机名称设置为唯一的名称。 您可以使用 wincfg 实用工具在您的组件中设置计算机名称。

  17. 图形控制台需要在 IE/FF 浏览器中使用最新的 Java 版本

    如果未使用最新的 Java 版本,图形控制台可能无法正常运行(将在试图加载时挂起)。 在将图形控制台错误报告给 CA 之前,请务必确认您使用的是最新的 Java 版本(如果您需要在浏览器中升级 java,随后一定要重新打开浏览器,以使图形控制台正常工作)。

  18. 在控制器恢复时可能无法满足故障转移组

    在备用服务器成为新的主服务器时,如果该服务器上没有足够的资源来启动网格控制器,则 CA AppLogic® 会在网格中的其他服务器上重新启动新主服务器上运行的组件,这样即可从新主服务器上启动网格控制器。 请注意,这可能会中断组件故障转移组。 如果 CA AppLogic® 停止这些组件之一,则可能无法在其他服务器上重新启动该组件,因为可能没有足够的资源来满足故障转移组。

  19. 基于 Xen-HVM 的组件所使用的内存大于所配置的内存

    所有基于 HVM 的组件(Windows 等)所使用的服务器内存大于所配置使用的内存。 通常,根据分配给基于 HVM 的组件的内存量,组件会使用组件运行所在的服务器的附加内存(此附加内存是服务器上运行的虚拟 Hypervisor 所需的内存,称为影子内存)。 因此,尽管与分配给组件的内存相比,服务器可能有足够的内存,但组件可能无法在该服务器上运行,因为服务器上可能没有基于 HVM 的组件所需附加影子内存。 在应用启动期间,CA AppLogic® 排定程序在排定组件时会将此附加卷子内存考虑在内。

  20. Internet Explorer 无法用于访问基于 Ubuntu 的组件的图形控制台。

    可以使用任何其他浏览器。

  21. CA AppLogic® 3.x 中的共享接口支持不适用于基于 Windows 的组件。

    共享接口应与所有其他操作系统一起使用。

  22. 如果网格的任何服务器有 4 TB 以上的本地存储区,整个网格的 dom0 内存必须设成 1 GB。 可在您安装网格时,通过 BFC 使用参数 dom0_vm_mb=1024 来指定该设置。
已知问题

下面是此版本中的已知问题:

严重性级别 1
严重性级别 2
严重性级别 3
  1. 缺陷 SCR 8243-网格和网格控制器处于重负载条件下时出现卷调整/应用配给/GUI 网络错误

    当网格和网格控制器本身处于重负载条件下时,各个网格控制器命令(例如,app provision/vol resize)可能失败,GUI 中可能出现网络错误。 如果遇到此问题,请将网格控制器 CPU 增加到 1,内存增加到至少 2GB,这应该可以解决此问题。

  2. 缺陷 SCR 8258-在处于重负载条件下的基于 ESX 的网格上,vol resize 操作有时会失败或挂起。 如果遇到此问题,请再次执行卷操作。

    此问题将在后续版本中得到解决。

  3. 缺陷 SCR 8178-达到最大 VM/服务器限制(组件固定在其上的服务器)后,固定组件无法在其他可用服务器上启动。

    要解决此问题,请取消固定组件并重新启动应用。 此问题将在后续版本中得到解决。

  4. 缺陷 SCR 8158-vol manage:无法管理两个 ext3-snapshot 卷

    Filer 当前不支持同时管理两个 ext3-snapshot 卷。 此问题将在未来的版本中得到解决。

  5. 在没有写缓存的情况下使用 HP Smart Array RAID 控制器时减少性能

    在没有启用写缓存的情况下,使用 HP Smart Array RAID 控制器时,会减少 50% 的性能。 此问题已经在带有 Smart Array P410i 256mb 的 HP DL 580 G7 服务器上经过检验。 这些卡需要安装启用写缓存的电池或电容器。

  6. 确保在 Emulex 10G NIC 上的 SR-IOV BIOS 设置为禁用

    在使用 ServerEngines Corp. Emulex OneConnect 10Gb NIC (be3) (rev 01) NIC 和 CA AppLogic® 时,如果启用“SR-IOV BIOS”选项,那么这些 NIC 会不正确地退回数据包。 这些退回的数据包改变桥的转发缓存,导致桥丢弃数据包,而不是将他们转发给正确的目标。 这在 CA AppLogic® 中引起不稳定性,导致间歇的应用启动失败。 因此,请确保对于网格中所有服务器上的所有 Emulex 10G NIC, SR-IOV BIOS 设置为禁用。

  7. 缺陷 SCR 2203-卷挂接阻塞导致无法启动应用(很少见,且无法重现)

    应用极少会由于其中一个服务器上的卷挂接阻塞而无法启动。 CA AppLogic® 会检测阻塞的卷挂接并通过网格显示板将其报告给用户。 如果您的网格上发生此问题,请通知 CA 支持。 或者,可以通过禁用或重新启动发生挂接阻塞的服务器来解决此问题。

  8. 缺陷 SCR 3416-如果主服务器无法响应,网格控制器将不会自动恢复

    如果发生这种情况,重新启动主服务器会将网格还原为操作状态。 请注意,此问题在 CA AppLogic® 3.5 或 3.7 中尚未出现。

  9. 缺陷 SCR 2239-CAT:VDS:安全漏洞:初始用户/密码设置
  10. 缺陷 SCR 1471-当网格控制器上存在负载时,GUI 会超时并注销用户

    当网格控制器上的负载较重时,GUI 不再自动注销用户。 相反,用户会收到一条消息,指出发生网络错误。 但是,在这种情况下,GUI 仍正常运行。 仅当控制器上存在较重负载时(时启动 4 个应用和复制大型卷),才会收到网络错误消息。 在大型网格中,请尝试将多达整个 CPU 核心和 1 GB RAM 的内存分配给控制器。

  11. 缺陷 SCR 857-网格重新启动可能会将一个或多个系统卷降级

    如果使用 grid reboot 命令来重新启动网格,则网格在重新启动之后恢复正常时,一个或多个系统卷可能会降级。 CA AppLogic® 会首先自动修复这些卷。

  12. 缺陷 SCR 1199-无法迁移数据流均位于禁用的服务器上的卷

    在迁移卷时,请确认其中至少一个数据流位于启用的服务器上,否则无法执行迁移命令。 可通过操作两次将卷从其原始服务器组中完全迁移出来。

  13. 缺陷 SCR 1496-由于重新启动服务器花费的时间太长,网格自动应用恢复 (HA) 可能会失败

    一些物理服务器在重新启动时可能会花费很长时间-这可能导致 CA AppLogic® 的网格自动恢复失败。 此问题的最终结果是在网格从故障状态恢复后,有些应用可能无法自动重新启动。 这是因为,网格控制器最多留出 10 分钟来等待所有服务器重新启动并重新连接到网格控制器(这些时间对于重新启动所有服务器来说是不够的)。 解决方法是,在所有服务器均已重新连接到网格控制器之后手工重新启动应用-执行“list srv”可帮助确保所有服务器均连接到了网格控制器,它们应处于 UP 状态。 在 CA AppLogic® 2.1 中,服务器启动超时为 10 分钟,如果由于硬件或 BIOS 故障导致服务器无法启动,通常会发生此问题。

  14. 缺陷 SCR 1234-在操作员有意重新启动网格时,网格振荡文件有时不会重置

    在操作员重新启动网格时,网格振荡状态理应重置,并且会在显示板上应显示一条消息,指出操作员有意重新启动网格(“操作员已重新启动网格...”)。 有时,在重新启动网格时,既不重置网格文件,也不显示显示板消息。 这可能引起的唯一问题是,下一个网格失败时应用可能不自动重新启动(取决于出现该缺陷时,网格已失败的次数)。 解决该问题的方法是,如果在有意重新启动网格之后,没有显示显示板消息,请联系 CA 支持以重置网格上的网格振荡状态。

  15. 缺陷 SCR 1360-组件显示的内存和磁盘大小要稍小于分配的大小

    资源稍微减少的原因与服务区域的分配有关。 对于内存,可能是由于与虚拟机的内存映射表相关的 Xen 所致。 对于磁盘,是由于常规文件系统服务区域所致(这与在常规 Linux 服务器上一样)。

  16. 缺陷 SCR 2293-有时,在编辑器中打开应用会出现这样的消息:应用已锁定进行编辑

    在这种情况下,该应用未由任何其他用户打开进行编辑,但是 CA AppLogic® 编辑器会错误地认为有其他用户打开该应用进行编辑。 如果发生该问题,只需在编辑器打开应用出现提示时直接覆盖该应用锁。

  17. 缺陷 SCR 2313-在使用 CA AppLogic® GUI 时,IE 要比 FireFox/Chrome/Safari 大约慢 2 倍

    速度减慢主要发生于在 CA AppLogic® 基础架构编辑器中打开应用时。

  18. 缺陷 SCR 2497-在打开图形控制台时客户端计算机崩溃之后,重新打开图形控制台需要 15 分钟

    如果客户端使图形控制台打开并且它们断开与 Internet 的连接(客户端网卡故障、客户端计算机崩溃、Internet 访问不可用等),则重新打开图形控制台将需要 15 分钟。

  19. 缺陷 SCR 2548/SCR 2549-在将 CA AppLogic® 图形控制台用于 Ubuntu 时出现问题

    在使用 CA AppLogic® 图形控制台时,鼠标很难在 Ubuntu 中使用。 这是由于 Xen VNC 支持的限制(不支持鼠标加速)所致。 一些用户报道称,调整 Ubuntu 中的鼠标设置可解决该问题。 此外,在文本中通过键盘键入内容时,很少会重复多次键击操作(在此情况下,只需删除显示的额外字符)。

  20. 缺陷 SCR 2498-用户在文本启动控制台中输入的所有文本都回显到控制台

    这包括登录到组件时输入的密码。 文本启动控制台应仅用于调试目的。 可使用 SSH 控制台来实现所有其他目的。

  21. 缺陷 SCR 2501-用户必须按 Enter 键才能在第二次打开文本启动控制台之后,在其中看到输出

    如果用户在组件的文本启动控制台打开之后又重新将其打开,他们必须按 Enter 键才能看到登录提示或命令提示符。 这是因为启动控制台正在等待用户输入(登录信息或要执行的命令)。

  22. 缺陷 SCR 3107-在备用服务器上重新启动网格控制器时,未启动故障转移组中的组件

    如果网格具有故障转移组中的组件,且该故障转移组在需重新启动其网格控制器的备用服务器上运行,则 CA AppLogic® 可能会停止会损坏故障转移组的该组件。

  23. 缺陷 SCR 2134-网格升级导致生成有关网格重新启动原因的不正确警告

    将网格升级到最新版本之后,会发布显示板消息,指出网格由于硬件问题而失败。 该消息可安全忽略并从显示板中删除。

  24. 缺陷 SCR 3709-如果外部 NIC 在网络 HA 配置中出现故障,组件会临时不可访问(5 分钟)

    如果将网络 HA 配置用于 CA AppLogic®,并出现外部网络故障,则使用外部接口的应用/组件可能有长达 5 分钟的时间不可访问。 这可能起因于缓存 MAC 地址的外部路由器。 等待路由器刷新其 ARP 缓存,或通过应用还原操作同时发送 ARP 响应和 arping。 这仅影响外部网络(主干网不受影响)。

  25. 缺陷 SCR 4159-GUI 恢复不能在基于 ESX 的服务器上运行

    恢复 GUI 仅在基于 Xen 的服务器上工作。

  26. 缺陷 SCR 4273-共享接口的 MON 计数器不能正常运行

    共享接口不支持组件计数器。

  27. 缺陷 SCR 5242-在完成网格重新加电后,不重置系统启动时间

    用户对网格重新加电时,系统启动时间不会重置。 如果重新启动网格,应重置系统启动时间。

  28. 缺陷 SCR 5269-网格 power_cycle 命令可能无法重新启动主服务器

    如果用户使用网格 power_cycle 命令重新加电网格,主服务器则可能无法重新启动。 这仅在新网格安装之后执行该命令且在执行重新加电命令之前,从未重新启动该网格时发生。 在新的网格安装之后在某一时重新启动网格将避免该问题的发生。

  29. 缺陷 SCR 6378-SAN-NFS:删除正在运行/失败的网格后会保留网格的文件夹(但会删除文件夹的内容)

    在使用 SAN 的网格被销毁时,CA AppLogic® 会删除该网格在 SAN 上的文件夹的内容,但保留空文件夹。 此问题将在未来的版本中得到解决。

  30. 缺陷 SCR 6701-从 3.0 或 3.1 升级到 3.5 偶尔会失败

    (非常少)从 3.0 或 3.1 升级到 3.7 可能会失败。 在此特殊的升级失败情况下,使用 BFC 访问的网格状态日志(单击网格状态即可打开日志)中将存在下列消息。

    installing the controller image(正在安装控制器映像)
    ioctl: LOOP_SET_FD: Device or resource busy(ioctl:LOOP_SET_FD: 设备或资源忙碌)
    installing new controller FAILED, aborting(安装新控制器失败,正在中止) 
    

    如果日志中存在这些消息,请重新运行升级,应该会成功。

    注意:此问题实际上是 CA AppLogic® 3.0 和 3.1 中的缺陷,并且在 CA AppLogic® 3.7 中已得到解决。

  31. 缺陷 SCR 7048-从 3.5 到 3.1 的 ESX 网格回滚不起作用

    对于基于 ESX 的网格,回滚命令对于从 3.5 到 3.1 的回滚不起作用。 但是,作为变通方法,可以使用降级命令(请注意,降级花费的时间比回滚稍微长一些)。 此问题将在未来的版本中得到解决。

  32. 缺陷 SCR 7064-基本 ext3-snapshot 的卷在基于 ESX 的网格上不起作用

    基本 ext3-snapshot 的卷在基于 ESX 的网格上不起作用。 不过,这些卷适用于基于 Xen 的网格。 如果您正在使用基于 ESX 的网格,并且您需要使用 ext3-snapshot 卷,则可以将基于 Xen 的节点添加到网格中,并使用该节点来创建/管理您的 ext3-snapshot 卷(在运行卷命令时,禁用所有的 ESX 服务器,以使 CA AppLogic® filer 在基于 Xen 的节点上运行)。 此问题将在未来的版本中得到解决。

  33. 缺陷 SCR 7397 -“vol migrate”无法迁移来自本地 SAN 的其中一个卷流(错误地试图将流迁移到外部 SAN)

    在配置为使用外部 SAN 的网格上,尝试迁移本地 SAN 上的卷流可能会失败。 CA AppLogic® 不是将卷流迁移到本地 SAN,而是错误地试图将其迁移到外部 SAN。 如果遇到此类故障,请对 vol migrate 命令使用 store=local 选项。 此问题将在未来的版本中得到解决。

  34. 缺陷 SCR 7394:将 CA AppLogic® 从 3.0.30 升级到 3.5.x 之后,网格控制器挂起

    将 CA AppLogic® 从 3.0.30 升级到 3.5.x 时,网格控制器间歇性挂起,执行的所有 3tshell 命令返回内存不足错误消息。

    要解决此问题,请重新启动网格控制器。 此问题将在未来的版本中得到解决。

    注意:这可能也会影响 3.7 版本。

  35. 缺陷 SCR 8845:调整 NTFS 卷的大小可能会花费很长时间,且看起来像是被卡住。

    重新调整超大型基于 NTFS 的卷(大小达到很多 GB)的大小时,调整大小操作可能会停止报告进度,且看起来像是被卡住。 但实际上调整大小操作仍在进行中,且将成功完成。 此报告问题将在未来的版本中得到解决。

  36. 缺陷 SCR 8751:Applogic 3.1+ 中 megaraid_sas 驱动程序的性能问题。

    自 CA AppLogic® 3.1+ 起,megaraid SAS 驱动程序的性能已降级,与物理服务器相比,性能降低了约 75%。 CA 当前一直致力于解决此问题,并将在确定并解决此问题后立即发布即时修正。 在此问题解决之前,强烈建议使用其他类型的磁盘控制器。

  37. 缺陷 SCR 8907:无法启动具有 8 个以上 CPU 的 Windows 2008 DataCenter 组件(仅基于 Xen 的网格)。

    如果当前 Windows 2008 DataCenter 版本组件配置为使用 8 个以上 CPU,该组件将无法启动(仅基于 Xen 的网格)。 此问题将在未来的版本中得到解决。

  38. 缺陷 SCR 8908:将 Windows 2008 Enterprise 组件升级为最新的 Windows APK 会失败。

    如果在尝试升级到随 CA AppLogic® 3.7 一起发布的最新版本的 Windows APK 的同时升级 Cygwin,会出现问题。 在解决此问题之前,建议构建新的 Windows 组件,而不是升级。 此问题将在未来的版本中得到解决。

  39. 缺陷 SCR 8468:在通过 ssh 调用 3tshell 时,其属性值中不允许有空格。

    在通过 ssh 执行 3t 命令时,参数使用空格或反撇号 (`) 进行分隔,具体取决于命令的调用方式。 如果 3t 命令的属性值中包含空格,该空格后的字符将被错误地视作单独的参数。 此问题将在未来的版本中得到解决。

  40. 缺陷 SCR 8714:ORACLE 组件忽略了 http_port 属性。

    http_port 属性被忽略,这样,端口将始终为 8080。 此问题将在未来的版本中得到解决。

  41. 缺陷 SCR 8888:对于基于 Xen 的网格,基于 HVM 的组件限制为最多 90 个。

    尝试在基于 Xen 的网格上启动超过 90 个基于 HVM 的组件时,可能会挂接失败或出现组件启动错误。 这是一个已知问题,并将在未来版本中得到修复。

  42. 缺陷 SCR 8914:图形控制台不能在具有 JAVA 7 Update21(64 位)的 Mac Safari 6.0.4 上运行。

    请使用较旧版本的 Safari,或参阅以下链接,获得解决此问题可能的方法。

特定于基于 Windows 的组件的已知问题

下面是该版本中与 Windows 组件相关的主要已知问题: 此外,有关其他过程和注意事项,请参阅“Windows 组件安装参考”。

  1. 缺陷 SCR 8051-无法在 Microsoft Windows 8(32 位)组件上安装 Halsign Turbogate 驱动程序。

    Halsign Turbogate 驱动程序当前不支持 32 位 Windows 8,但支持 64 位版本的 Windows 8。 此问题将在后续版本中得到解决。

  2. 缺陷 SCR 7899-启动多个分配有相同公共 IP 地址的基于 Windows 的应用时,未发现错误。 此外,没有一个应用可使用配置的公共 IP 地址进行访问。

    Windows APK 当前无法正确检测重复的 IP 地址分配。 因此,用户应确定他们是否意外地分配了重复的 IP 地址。 此问题将在后续版本中得到解决。

  3. 缺陷 SCR 2751-在含有损坏文件系统的卷上无法执行 Windows filer 卷调整大小操作

    如果源卷包含损坏的目录条目/文件,Windows filer 可导致卷调整大小操作失败。 该问题的主要来源是一些 Microsoft 软件安装特意包含无效目录条目(我们不确定其原因;在用户在其组件中安装 Microsoft SQL Server 版本时,已发现该问题)。 另外,由于自然磨损也会导致源卷损坏。 在调整卷的大小之前,可通过在卷上运行文件系统修复 (vol fsrepair) 来解决该问题。

  4. 缺陷 SCR 3078-由于 Windows filer 启动失败而导致 NTFS 卷的大小调整失败

    CA 已发现在 NTFS 卷调整大小的 100 次操作中大约有 2 次会失败。 这两次失败发生的原因是 Windows filer 无法在网格上正确启动。 如果发现该问题,再次重复执行调整大小操作应当成功。 但是,该问题在该版本中应当已解决;如果发现该问题,请通知 CA 技术支持。

  5. 缺陷 SCR 2750-Windows filer 无法创建 ntfs 卷(极少出现 diskpart 错误)

    Windows filer 使用名为 diskpart 的 Microsoft 实用工具来处理 Windows NTFS 卷。 有时,diskpart 无法获得卷信息或可能无法挂接卷。 这是非常罕见的故障,并导致执行卷创建或卷调整大小命令以故障转移 NTFS 卷。

  6. 缺陷 SCR 2748-有时,Windows 组件在其内部网络上检测到重复的 IP

    如果用户具有一个包含 Windows 组件的应用,且将一个或多个 Windows 组件添加到该应用或向/从 Windows 组件中添加/删除终端,则在首次启动该应用期间,其中一个 Windows 组件可能在内部网络上检测到重复的 IP(仅在修改应用后首次启动该应用期间才发生该问题)。 该问题不应导致应用的任何操作失败或需要用户干预;重复的 IP 地址纯粹是临时的。 最坏的情况是一些涉及任何 Windows 组件的网络通信可能会最多延迟 30-60 秒。

  7. 缺陷 SCR 3021-在 Windows 应用停止进度达到 99% 时,该应用被卡住

    在尝试停止 Windows 应用的进度达到 99% 时挂起;该操作在 15 分钟之后超时。 应用包含 2 个 Windows 2003 Server DataCenter Edition 组件实例 (WIN03DC)。 停止其中一个 Windows 组件,另一个组件会在执行 comp stop 期间挂起。 该问题仅出现过一次且不会再现。

  8. 缺陷 SCR 2504-有时,磁盘读取/写入计数器值报告为零(Windows perfmon API 缺陷)

    有时,Windows 组件的以下磁盘 I/O 计数器值会报告为零(即使生成持续的 I/O):写入/读取的总字节数、写入/读取的卷数和写入/读取花费的时间。 这是由 Windows perfmon API 中的缺陷所致-零值是由 Windows perfmon API 报告的。

  9. 缺陷 SCR 2821-Windows filer MSI 在本地化为日语版本的 Windows 下不起作用

    除 filer MSI 之外,本地化为日语版本的 Windows 应适用于 CA AppLogic®。

  10. 缺陷 SCR 2862-如果安装虚拟 DVD-ROM 设备,Windows 组件会无法启动

    如果安装 MagicISO 虚拟 DVD-ROM 设备,则 Windows 组件会无法启动。 对于 CA AppLogic® 中基于 Windows 的组件,当前不支持虚拟 DVD-ROM 设备。

  11. 缺陷 SCR 2499-在 Windows 组件中发现新 NIC 可能花费几分钟,这会导致启动超时

    有时,Windows 在组件内检测新 NIC 会花费几分钟。 当用户为 Windows 组件单例添加/删除终端时,会发生该问题。 在检测这些新的 NIC 时所用的额外时间会导致组件启动超时。 要解决该问题,请增加 Windows 组件的启动超时时间。

  12. 缺陷 SCR 2505-将 Windows 组件迁移到其他网格可能会触发 Windows 组件的重新激活

    如果用户在其网格上具有 Windows 组件,并且他们将该组件迁移到具有不同硬件的其他网格,Windows 组件可能需要重新激活(Microsoft 的 Windows 重新激活)。 在更改特定量的硬件时会触发重新激活(CA 尚未准确了解哪些硬件更改会触发重新激活)。 请注意,执行重新激活可能需要从 Windows 组件内部访问 Internet。 在调整 Windows 组件启动卷的大小和将组件迁移到不同网格之后会出现这个特殊问题。

  13. 缺陷 SCR 3814-Windows 2008 filer 根访问权限通过 SSH 进行限制

    该问题仅影响 Windows 2008 Server 32/64 位(Windows 2003 Server 运行正常)。 在通过 filer 或 SSH 访问 Windows 2008 卷的组件时,用户可能由于权限问题而不能访问/修改文件。 要通过命令 shell 访问/修改文件,请通过图形控制台登录到 Windows 桌面并打开命令 shell。 命令 shell 可用于访问/修改文件。

  14. 缺陷 SCR 4593-Windows 2003 VDS/基类无法启动(启动时超时)

    Windows 2003 Server 在安装期间首次启动时超时。 确保按照 Windows 提供的说明解决该问题。

  15. 基于 Windows 2003 的组件-安装 Turbogate PV 驱动程序需要用户干预

    在安装 Turbogate PV 驱动程序时,运行在基于 Xen 的网格服务器上的组件第一次启动时,用户必须手工单击硬件安装向导,为该组件中配置的所有终端安装 Turbogate PV 驱动程序。 否则,该组件将无法启动。

  16. 缺陷 SCR 5737-基于 Windows 2003 Server 32/64 位的组件;仅在最初创建该组件的 Hypervisor 上工作

    在创建新的 32/64 位 Windows 2003 服务器组件时,该组件将仅在网格服务器(使用最初创建该组件的相同 Hypervisor)上工作。 否则,该组件在启动过程中崩溃。 例如,如果该组件最初在基于 ESX 的网格服务器上创建,那么该组件只能在基于 ESX 的网格服务器上使用(使用基于 Xen 的网格服务器上的组件将不起作用,该组件将在启动过程中崩溃)。

  17. 缺陷 SCR 5960-当使用 MON 时,Windows 2003 组件的计数器不显示

    这是 Microsoft Windows 2003 服务器的已知问题。 Microsoft 有解决方案来解决您的 Windows 2003 组件的这个问题。

不能再现的问题

以下问题列表已在 CA AppLogic® 版本中出现,但很难再现,仅出现一次或两次。 如果其中任何问题在网格上出现,请将缺陷报告发送给 CA 并描述发生了什么问题,执行了哪些 CA AppLogic® 命令导致的此故障。

  1. 缺陷 SCR 2842-服务器由于 Linux 内核崩溃而重新启动(在各版本中均出现该问题)

    网格中的服务器由于处于其 dom0 中的 Linux 内核崩溃而自行重新启动。 这不会像先前的 CA AppLogic® 版本那样导致整个网格失败;但会导致应用停机。 在此情况下,CA AppLogic® 会在网格中的其他服务器上重新启动在出现故障的服务器上运行的组件。 如果您的网格中出现该问题,请联系 CA 支持

  2. 缺陷 SCR 2834-服务器失去与网格控制器的连接

    在 CA AppLogic® 2.4 中,有几种情况会出现服务器失去与网格控制器的连接并重新启动的现象。 这可导致该服务器上运行的所有组件将在网格中的其他服务器上进行重新排定,还可导致应用停机。 尚不了解服务器失去与网格控制器的连接的原因。 在 CA AppLogic® 中,如果服务器失去与网格控制器的连接,服务器会尝试重新连接到网格控制器,如果成功,服务器仍保持运行状态,且不会发生应用停机。 如果服务器在 1 分钟内无法重新连接到网格控制器,服务器会重新启动,且会发生应用停机。 在服务器失去与网格控制器的连接时,会在显示板中记录一条消息。 如果出现该问题,请立即联系 CA 支持

  3. SCR 2903-同时执行 4 个 NTFS 卷的卷调整大小操作失败

    在 CA AppLogic® 上,同时调整 4 个 NTFS 卷的大小会导致所有 4 个卷的调整大小操作都失败。 该问题仅出现过一次。

  4. SCR 3289-在磁盘空间接近不足时出现 NASR 复制故障

    当 NASR 在 1 GB 的卷上复制 800 MB 的文件时,NASR 组件没有响应。 CA 无法再现该问题。 如果您在网格上遇到该问题,请通知 CA 支持。

  5. SCR 3711-在网格中打开多个图形控制台会导致服务器崩溃

    用户对网格上运行的不同 Windows 组件打开 6 个以上图形控制台(同时打开)。 在打开第 7 个图形控制台时,其中一个服务器会重新启动并重新加入网格。 在出现故障的服务器上运行的组件会在网格中的其他服务器上重新启动。 该问题仅出现过一次。

BFC 的已知问题

我们已在此版本中发现 Backbone Fabric Controller (BFC) 的下列已知问题:

  1. 如果您正在硬挂接 NFS 的文件系统上运行 BFC 数据库副本(NFS 硬挂接为默认;不使用可选的软挂接功能),那么该挂接 NFS 的文件系统会失败,且 BFC 将挂起。 此问题是 NFS 自身的特征,不是 BFC 可以直接控制的。 如果出现此状态,且您无法还原 NFS 文件系统,可以使用下列步骤删除 BFC 对该副本的依存关系来还原正常操作:
    1. 以根用户身份登录到 BFC 系统。
    2. 通过键入以下命令更改为 bfcadmin 用户:
        su - bfcadmin
      
    3. 运行 <BFC 安装位置>/bin/stop_replication(默认情况下为 /opt/bfc/bin/stop_replication

    重要信息! 打破该依存关系之后,系统将在没有副本的情况下运行。请返回到 UI,并在同一位置或其他位置创建另一个副本。

  2. 不要将 /home/bfcadmin 文件夹用于副本数据库,也不要将其用作版本、即时修正和更新的下载目录。 这是因为,如果卸载 BFC,此文件夹将被删除,这会导致您的副本数据库和站点拥有的其他数据丢失。
  3. 缺陷 SCR 6990-无法通过 BFC API 取消网格的默认 VLAN 设置
  4. 缺陷 SCR 6027-从 BFC UI 启动的网格在使用“3t grid shutdown”命令关闭之后出现故障

    请不要对网格使用“3t grid shutdown”命令。

  5. 缺陷 SCR 7036-由于 nfs 挂接错误导致 ESX 网格出现故障

    发生这种情况时,在 BFC 上执行“service nfs restart”应该可以解决该问题。

  6. 缺陷 SCR 7058-出现故障的 ESX 网格节点在重新启动后进入无限循环的重启
  7. 缺陷 SCR 6424-DL360g4p 上出现驱动程序磁盘的 BMI 安装提示

    如果显示此消息,只需按“Esc”键继续安装即可。

  8. 缺陷 SCR 7312-使用密码 !"$%&/()=?' 执行无人值守的安装失败

    如果对此版本的产品执行无人值守安装,密码中不能包含“=”

  9. 缺陷 SCR 7376-如果将服务器的公共端口配置为 Trunk,在网络检测过程中会跳过 STP 检查

    此缺陷偶尔允许服务器进入本应阻塞的网格。 如果端口配置正确,便不会遇到此问题。

  10. 缺陷 SCR 7401-当“编辑网格参数”文本框中的字符总数超过 256 个时,BFC 会抛出“System_limit”错误。

    如果需要使用 256 个以上的字符,只需将这些参数分散到多个网格更新中即可。

  11. 缺陷 SCR 7818-Internet Explorer 9 中 Fusion 图的已知问题。

    如果未在 Internet Explorer 9 中正确设置图表渲染选项,BFC 中的图表将无法正确显示。 受影响的图表将显示在 BFC 显示板、网格和服务器页面中。

    要修复此问题,请在 Internet Explorer 9 中,单击“工具”菜单上的“Internet 选项”。 单击“高级”选项卡并找到“加速的图形”部分。 选中“使用软件渲染”复选框。 保存更改并重新启动 IE。

  12. 缺陷 SCR 7724-1000 个 MAC 设为自动发现(黑名单)模式的系统使 BFC 停机

    如果您需要将这些 MAC 设置为自动发现(黑名单)模式,建议在 3.5 中使用手工配置(白名单)模式。

  13. 缺陷 SCR 7765-没有可用的外部 IP 地址时,清单失败

    请确保您在将服务器添加到 BFC 时有可用的外部 IP 地址。

  14. 缺陷 SCR 7984-按“重置”按钮后,应用 IP 和控制器 IP 的更新出现问题

    由于此缺陷,您无法一步直接交换控制器 IP 和应用 IP。 如果您必须这样做,请首先将其设置为其他值,然后再次将其设置为预期的值。

  15. 缺陷 SCR 8005-API:通过 API 将 VLAN 添加到现有的未标记网格中时出现问题

    如果您尝试通过 API 将标记的网络添加到未标记网格中,调用将成功,而不是返回“400 错误请求”。

  16. 缺陷 SCR 8064:尝试删除已下载但未导入的版本不会向用户提供它为什么不这样做的任何信息

    如果没有配置下载服务器(本地下载目录),我们会将版本显示为“已下载”并接受删除操作,但实际上并未执行删除操作。 未来版本将生成说明此操作为什么不执行任何操作的错误。

  17. 缺陷 SCR 8231:选择下载已经下载的版本时,下载错误消息不清除

    这不是真正的错误,只是令人混淆的消息。

  18. 缺陷 SCR 7815:BFC API 允许将 vlan 多次添加到网格

    您可以使用 API 多次添加相同的范围,也可以使用 UI 删除重复的范围。 (但是,保留重复范围也不会造成任何问题。)

  19. BFC 3.7.0 中缺少本地化字符串

    由于 3.7.0 尚未本地化,应用的新部分将仅显示英语字符串。 之前已本地化的应用部分(3.5 中已存在的部分)仍跟以前一样显示非英语字符串。

  20. 缺陷 SCR 8452:如果 DRAC 中启用了虚拟媒体选项,一些 Dell 计算机将不会启动到网格中。

    在一些 Dell 硬件上,您可以启用 DRAC 虚拟媒体 BIOS 选项。 此功能允许您通过网络从虚拟媒体设备启动。 但是,CA AppLogic® 内核可能会将虚拟媒体设备标识为 SCSI 设备,混淆启动设备名称(“sda”变成“sdb”)。

    要避免此问题,请在您的 Dell 硬件的 DRAC BIOS 中,禁用 DRAC 虚拟媒体选项。

  21. 缺陷 SCR 8400:在将超大型 MAC 地址列表添加到发现白名单或黑名单时,BFC 服务崩溃。

    当您将地址添加到 BFC 中的 MAC 地址列表或从中删除地址时,将最大数目限制为 500。 MAC 列表在发现模式中使用以包括服务器(设置为手动配置时)或排除服务器(设置为自动发现模式时)。

    您可以使用“发现”选项卡的 BFC“管理”页面上的 MAC 列表。 可以编辑服务器列表,或导入具有服务器列表的文件。 也可以使用 BFC API 设置 MAC 地址列表。

  22. 缺陷 SCR 8036:ESX 网格服务器不支持 3TB 磁盘。

    虽然 AppLogic Xen 网格服务器支持 3TB 磁盘,但 AppLogic ESX 网格服务器最多支持 2TB 磁盘。 不应选择具有 3TB 磁盘的服务器运行 ESX 管理程序,否则网格创建将失败。

  23. 缺陷 SCR 8883:如果之前导入的 AppLogic 版本在配置的下载服务器上不可用,BFC 恢复将挂起。

    如果您参与了 CA AppLogic® 3.7 Beta 计划,则在您因升级失败必须执行回滚过程的情况下,必须确保 BFC 下载目录中存在 Beta 版的 CA AppLogic®。