]> arthur.barton.de Git - netdata.git/blob - conf.d/health.d/memory.conf
detect ECC memory correctable and uncorrectable errors; fixes #1508
[netdata.git] / conf.d / health.d / memory.conf
1
2    alarm: 1hour_ecc_memory_correctable
3       on: mem.ecc_ce
4   lookup: sum -10m unaligned
5    units: errors
6    every: 1m
7     warn: $this > 0
8    delay: down 1h multiplier 1.5 max 1h
9     info: number of ECC correctable errors during the last hour
10       to: sysadmin
11
12    alarm: 1hour_ecc_memory_uncorrectable
13       on: mem.ecc_ue
14   lookup: sum -10m unaligned
15    units: errors
16    every: 1m
17     crit: $this > 0
18    delay: down 1h multiplier 1.5 max 1h
19     info: number of ECC uncorrectable errors during the last hour
20       to: sysadmin
21
22    alarm: 1hour_memory_hw_corrupted
23       on: mem.hwcorrupt
24     calc: $HardwareCorrupted
25    units: MB
26    every: 10s
27     warn: $this > 0
28    delay: down 1h multiplier 1.5 max 1h
29     info: amount of memory corrupted due to a hardware failure
30       to: sysadmin