有两种类型的报警:简单报警和摘要报警。
这两种类型的报警均出现在“调查器”树中“报警”节点下。
简单报警将通过比较生成的状态信息作为输入,将其与用户定义的阈值进行比较,然后输出一种状态。 简单报警有以下四种状态之一:
可以定义“警告”或“危险”状态时要触发的操作。 简单报警可以使用“危险”和“警告”操作延迟(SmartTrigger 功能)来确定何时启动指定操作。
简单报警是 Introscope 中的基础报警。 简单报警可以触发操作和通知,或者为摘要报警提供输入。 要创建简单报警,请参阅创建简单报警。
示例显示板上的每个报警指示符均基于 Introscope 标准关键性能指标的自动化启发式模型,如应用程序概览中所述。 每个关键性能指标均有一个匹配的启发式度量标准。
启发式度量标准的值是 1、2 或 3:
例如,如果应用程序总响应时间经常在 600 毫秒到 1000 毫秒之间变化且当前值是 835 毫秒,则响应时间启发式度量标准报告 1。
例如,如果应用程序 CPU 的使用率经常在 30% 到 60% 之间且当前值是 75%,则启发式值可能是 2。
例如,如果某个应用程序在正常情况下无停顿或偶尔突然有一次停顿,该应用程序的数据库停止响应请求。 停顿次数可能增加到一个比较高的数字,如 10。 在这情况下,应用程序的停顿启发式将报告 3。
通过以启发式度量标准而不是固定阈值的形式定义报警,确定关键性能指标正常值的工作便从 APM 管理员转移到了 APM 本身。
定义报警的方法是使用“最后 M 个周期中的至少 N 个”属性,该属性定义了“危险”状态会触发报警的实例的数目。
在生产环境中,关键性能指示器可能会在短时间内突增。 例如,CPU 利用率可能在 15 秒期间内突增,然后在下一个 15 秒期间内又恢复正常。
不希望 Introscope 针对此类图增进行报警。 通过指示 Introscope 仅在某个条件持续 8 个多周期超出最后 8 个周期(每个周期 15 秒钟,因此持续 2 分钟以上超出最后 2 分钟)时才报警,仅对产生真正问题的条件生成报警,而不对随机突增生成报警。
代理断开连接是一种重要事件,因为如果代理断开了与企业管理器的连接,则不再能收集或监控代理数据。 您可以设置一个报警,在发生此情况时触发通知来通知您。
为代理断开连接设置报警:
此度量标准包括下列值:
已断开表示已手工断开代理的连接。
未安装表示在特定一段时间(取决于管理员配置)后代理已断开连接,在这段时间内代理未向企业管理器报告任何数据。
阈值设置取决于要求什么程度的报警敏感度。
|
版权所有 © 2013 CA。
保留所有权利。
|
|