check_ganglia_metric

Phần mềm chụp màn hình:
check_ganglia_metric
Các chi tiết về phần mềm:
Phiên bản: 2012.02.28
Ngày tải lên: 15 Apr 15
Nhà phát triển: Michael T. Conigliaro
Giấy phép: Miễn phí
Phổ biến: 34

Rating: 2.0/5 (Total Votes: 2)

check_ganglia_metric là một plugin Nagios cho phép bạn kích hoạt cảnh báo về bất kỳ hạch metric.
check_ganglia_metric được lấy cảm hứng từ check_ganglia_metric.php Vladimir Vuksan, nhưng nó đi kèm với một số cải tiến.

Cài đặt

# Pips cài đặt check_ganglia_metric
... Hay:
# Easy_install check_ganglia_metric
hạch Cấu hình
Trừ khi máy chủ Nagios và hạch Meta Daemon đang chạy trên cùng một máy chủ, bạn có thể cần phải sửa gmetad.conf của bạn để cho phép các kết nối từ xa từ máy chủ Nagios của bạn.
Để cho phép các kết nối từ nagios-server.example.com:
trusted_hosts nagios-server.example.com
Để cho phép các kết nối từ tất cả các host (có thể là một nguy cơ bảo mật):
all_trusted trên
Thử nghiệm trên các dòng lệnh
Đầu tiên, chúng ta hãy xem nếu check_ganglia_metric có thể giao tiếp với các hạch Meta Daemon:
check_ganglia_metric.py --gmetad_host = gmetad-server.example.com
& Nbsp; - metric_host = host.example.com --metric_name = cpu_idle
Status Ok, CPU nhàn rỗi = 99,3% | cpu_idle = 99,3% ;;;;
"Trạng thái Ok" tin nhắn chỉ ra rằng check_ganglia_metric đang làm việc. Nếu bạn đang gặp khó khăn này để làm việc, hãy thử lại với tiết đăng nhập được kích hoạt (verbose) để hiểu rõ hơn những gì đang xảy ra sai.
Bây giờ chúng ta hãy cố gắng thiết lập một ngưỡng cảnh báo:
check_ganglia_metric.py --gmetad_host = gmetad-server.example.com
& Nbsp; - metric_host = host.example.com --metric_name = cpu_idle --critical = 99
Tình trạng quan trọng, CPU nhàn rỗi = 99,6% | cpu_idle = 99,6% ;; 99 ;;
Chúng tôi nói với check_ganglia_metric để trả về một "Critical" tình trạng nếu CPU nhàn rỗi lớn hơn 99. "Trạng thái Critical" tin nhắn chỉ ra rằng nó làm việc. Lưu ý check_ganglia_metric mà phân tích các phạm vi và ngưỡng theo hướng dẫn chính thức phát triển plugin Nagios.
Để xem danh sách đầy đủ các tùy chọn dòng lệnh với lời giải thích ngắn gọn, chạy check_ganglia_metric với tùy chọn --help.
Cấu hình Nagios
Đầu tiên, tạo ra một định nghĩa lệnh:
xác định lệnh {
& Nbsp; command_name check_ganglia_metric
& Nbsp; command_line /usr/bin/check_ganglia_metric.py --gmetad_host = gmetad-server.example.com --metric_host = $ HOSTADDRESS $ --metric_name = $ ARG1 $ --warning = $ ARG2 $ --critical = $ arg3 $
}
Bây giờ bạn có thể sử dụng lệnh trên trong định nghĩa dịch vụ của bạn:
xác định dịch vụ {
& Nbsp; service_description CPU nhàn rỗi - hạch
& Nbsp; sử dụng some_template
! & Nbsp; check_command check_ganglia_metric cpu_idle 0: 20 0: 0!
& Nbsp; host_name host.example.com
}
Điều này sẽ làm việc tốt cho đến khi có điều gì sai trái với check_ganglia_metric (ví dụ như các tập tin bộ nhớ cache không thể đọc / ghi vào, các hạch Meta Daemon có thể không đạt được, vv). Vào thời điểm đó, mọi dịch vụ dựa trên check_ganglia_metric sẽ thất bại, có thể bạn tràn ngập với các cảnh báo. Chúng ta có thể ngăn chặn điều này thông qua việc sử dụng các dịch vụ phụ thuộc.
Điều đầu tiên chúng ta cần là một định nghĩa lệnh để kiểm tra tuổi của một tập tin:
xác định lệnh {
& Nbsp; command_name check_file_age
& Nbsp; command_line / usr / lib / nagios / plugins / check_file_age -f $ ARG1 $ -w $ ARG2 $ -c $ arg3 $
}
Tiếp theo, chúng ta định nghĩa một dịch vụ mà kiểm tra tuổi của file cache của check_ganglia_metric. Lưu ý rằng để có thực sự hiệu quả, dịch vụ này cần phải được kiểm tra ít nhất là (tốt hơn) thường xuyên hơn so với tất cả các kiểm tra khác mà dựa vào check_ganglia_metric:
xác định dịch vụ {
& Nbsp; service_description Cache cho check_ganglia_metric
& Nbsp; sử dụng some_template
120 check_command check_file_age /var/lib/nagios/.check_ganglia_metric.cache 60; & nbsp!!!
& Nbsp; host_name localhost
& Nbsp; check_interval 1
& Nbsp; max_check_attempts 1
}
Và cuối cùng, chúng tôi thiết lập sự phụ thuộc dịch vụ thực tế. Lưu ý rằng tôi đã kích hoạt use_regexp_matching trong Nagios, cho phép tôi sử dụng biểu thức thông thường trong các chỉ thị của tôi. Bằng cách gắn bó "- hạch" ở cuối của mỗi dịch vụ dựa trên check_ganglia_metric, tôi có thể tự cứu lấy mình rất nhiều nỗ lực:
xác định servicedependency {
& Nbsp; host_name localhost
& Nbsp; service_description Cache cho check_ganglia_metric
& Nbsp; dependent_host_name *.
& Nbsp;. Dependent_service_description * - hạch $
& Nbsp; execution_failure_criteria c, p
}
Bây giờ nếu có điều gì sai trái với check_ganglia_metric, chỉ có một cảnh báo sẽ được gửi ra về các tập tin bộ nhớ cache, và tất cả các dịch vụ kiểm tra phụ thuộc sẽ được tạm dừng cho đến khi bạn sửa chữa các vấn đề gây ra check_ganglia_metric thất bại. Một khi vấn đề được cố định, bạn sẽ cần phải cập nhật các dấu thời gian trên các tập tin bộ nhớ cache để đưa các "Cache cho check_ganglia_metric" dịch vụ trở thành một nhà nước OK (mà sẽ cho phép dịch vụ kiểm tra phụ thuộc để tiếp tục):
& Nbsp; touch /var/lib/nagios/.check_ganglia_metric.cache
Mẹo và Tricks
Nó có thể làm cho một danh sách đầy đủ của máy tính hiện có và số liệu bằng cách cho phép "dài hơn" khai thác gỗ (-vv). Kể từ khi các tùy chọn metric_host và METRIC_NAME được yêu cầu, bạn có một chút của một "con gà và quả trứng" vấn đề ở đây, nhưng đó là OK. Chỉ cần cung cấp một số dữ liệu giả. Các plugin sẽ lỗi ở cuối với một "host / số liệu không tìm thấy" lỗi, nhưng không phải trước khi nó bãi cache của nó:
& Nbsp; check_ganglia_metric.py --gmetad_host = gmetad-server.example.com
& Nbsp; - metric_host = giả --metric_name = giả -vv

là gì mới trong phiên bản này:

  • Add - tùy chọn -metrics_max_age
  • Merge CHANGELOG.rst vào README.rst

Yêu cầu :

  • Python
  • Nagios

Hạn chế :

  • Không làm việc với Python 2.4

Phần mềm tương tự

Psensor
Psensor

20 Feb 15

Xplico
Xplico

17 Feb 15

GLBOX
GLBOX

3 Jun 15

Ý kiến ​​để check_ganglia_metric

Bình luận không
Nhập bình luận
Bật hình ảnh!