代码之家  ›  专栏  ›  技术社区  ›  Phil Huhn

Nagios 4.4.2被动服务重置为正常

  •  0
  • Phil Huhn  · 技术社区  · 6 年前

    我的被动服务没有如我所希望/期望的那样工作。这是一个异步服务。它在状态改变时发送一个NRDP被动消息。因此,如果警报响起,它会发出一条警告消息,当警报被纠正时,状态会发生变化并发出一条OK消息。一旦出现警报,负责人就会接到问题通知。

    问题是,在3分钟的freshness_阈值之后,nagios将其重置为OK状态,并向负责人发送OK通知(根据Notifications页面)。根据我读到的一篇文章,我认为它会变成批判性的(但这可能是主动的)。

    我的服务缓存配置如下:

    define service {
            host_name       sensorshost
            service_description     sensor-116
            display_name    sensor-116
            check_period    24x7
            check_command   check_dummy!0
            contact_groups  sensor-116-contact-group
            notification_period     24x7
            initial_state   o
            importance      0
            check_interval  5.000000
            retry_interval  1.000000
            max_check_attempts      1
            is_volatile     0
            parallelize_check       1
            active_checks_enabled   0
            passive_checks_enabled  1
            obsess  1
            event_handler_enabled   1
            low_flap_threshold      0.000000
            high_flap_threshold     0.000000
            flap_detection_enabled  0
            flap_detection_options  a
            freshness_threshold     180
            check_freshness 1
            notification_options    r,w,u,c
            notifications_enabled   1
            notification_interval   60.000000
            first_notification_delay        0.000000
            stalking_options        n
            process_perf_data       1
            retain_status_information       1
            retain_nonstatus_information    1
            }
    
    1 回复  |  直到 6 年前
        1
  •  1
  •   pzkpfw    6 年前

    Nagios documentation

    新鲜度检查是如何工作的?

    启用了新鲜度检查的服务。

    • 为每个主机或服务计算新鲜度阈值。
    • 如果最后一个检查结果的年龄大于新鲜度阈值,则检查结果被视为“过时”。
    • 在主机或服务定义中。

    提示: 即使在程序范围或主机或服务特定的基础上禁用了活动检查,也会执行活动检查。

    在您的情况下,如果被动检查结果早于 180 时间单位(通常是秒,但这是可配置的),然后是“活动检查”(表示 check_command )会跑去试图纠正这种情况。

    check_dummy!0 带代码退出 0

    推荐文章