yahi là một bộ phân tích log linh hoạt cung cấp nhổ mặc định cho apache / lighttpd.
sử dụng dòng lệnh
Ví dụ dữ liệu được phân tích bằng yahi: http://wwwstat.julbox.fr/
Sử dụng đơn giản nhất là:
speed_shoot -g / usr / local / data / geoIP / var / www / apache / truy cập * log
nó sẽ trả về một json trong các hình thức:
{
& Nbsp; "by_date": {
& Nbsp; "2012/05/03": 11
& Nbsp;},
& Nbsp; "total_line": 11,
& Nbsp; "ip_by_url": {
& Nbsp; "/ favicon.ico": {
& Nbsp; "192.168.0.254": 2,
& Nbsp; "192.168.0.35": 2
& Nbsp;},
& Nbsp; "/": {
& Nbsp; "74.125.18.162": 1,
& Nbsp; "192.168.0.254": 1,
& Nbsp; "192.168.0.35": 5
& Nbsp;}
& Nbsp;},
& Nbsp; "by_status": {
& Nbsp; "200": 7,
& Nbsp; "404": 4
& Nbsp;},
& Nbsp; "by_dist": {
& Nbsp; "không rõ": 11
& Nbsp;},
& Nbsp; "bytes_by_ip": {
& Nbsp; "74.125.18.162": 151,
& Nbsp; "192.168.0.254": 489,
& Nbsp; "192.168.0.35": 1093
& Nbsp;},
& Nbsp; "by_url": {
& Nbsp; "/ favicon.ico": 4,
& Nbsp; "/": 7
& Nbsp;},
& Nbsp; "by_os": {
& Nbsp; "không rõ": 11
& Nbsp;},
& Nbsp; "week_browser": {
& Nbsp; "3": {
& Nbsp; "không rõ": 11
& Nbsp;}
& Nbsp;},
& Nbsp; "by_referer": {
& Nbsp; "-": 11
& Nbsp;},
& Nbsp; "by_browser": {
& Nbsp; "không rõ": 11
& Nbsp;},
& Nbsp; "by_ip": {
& Nbsp; "74.125.18.162": 1,
& Nbsp; "192.168.0.254": 3,
& Nbsp; "192.168.0.35": 7
& Nbsp;},
& Nbsp; "by_agent": {
& Nbsp; "Mozilla / 5.0 (X11; Ubuntu; Linux x86_64; rv: 12.0) Gecko / 20100101 Firefox / 12.0, gzip (GFE) (thông qua translate.google.com)": 1,
& Nbsp; "Mozilla / 5.0 (X11; Ubuntu; Linux x86_64; rv: 12.0) Gecko / 20100101 Firefox / 12.0": 10
& Nbsp;},
& Nbsp; "by_hour": {
& Nbsp; "9": 3,
& Nbsp; "10": 4,
& Nbsp; "11": 1,
& Nbsp; "12": 3
& Nbsp;},
& Nbsp; "by_country": {
& Nbsp; "": 10,
& Nbsp; "Mỹ": 1
& Nbsp;}
}
Nếu bạn sử dụng:
speed_shoot -f csv -g / usr / local / data / geoIP / var / www / apache / truy cập * log
Kết quả của bạn là:
by_date, 2012-5-3,11
total_line, 11
ip_by_url, / favicon.ico, 192.168.0.254,2
ip_by_url, / favicon.ico, 192.168.0.35,2
ip_by_url, /, 74.125.18.162,1
ip_by_url, /, 192.168.0.254,1
ip_by_url, /, 192.168.0.35,5
by_status, 200,7
by_status, 404,4
by_dist, không rõ, 11
bytes_by_ip, 74.125.18.162,151
bytes_by_ip, 192.168.0.254,489
bytes_by_ip, 192.168.0.35,1093
by_url, / favicon.ico, 4
by_url, /, 7
by_os, không rõ, 11
week_browser, 3, chưa biết, 11
by_referer, -, 11
by_browser, không rõ, 11
by_ip, 74.125.18.162,1
by_ip, 192.168.0.254,3
by_ip, 192.168.0.35,7
by_agent, "Mozilla / 5.0 (X11; Ubuntu; Linux x86_64; rv: 12.0) Gecko / 20100101 Firefox / 12.0, gzip (GFE) (thông qua translate.google.com)", 1
by_agent, Mozilla / 5.0 (X11; Ubuntu; Linux x86_64; rv: 12.0) Gecko / 20100101 Firefox / 12.0,10
by_hour, 9,3
by_hour, 10,4
by_hour, 11,1
by_hour, 12,3
by_country ,, 10
by_country, Mỹ, 1
Vâng, tôi đoán, nó không hoạt động vì lần đầu tiên bạn cần phải tìm nạp geoIP tập tin dữ liệu:
wget -O "http://www.maxmind.com/download/geoip/database/GeoLiteCountry/GeoIP.dat.gz" | zcat> /usr/local/data/GeoIP.dat
Tất nhiên, đây là cơ sở dữ liệu geoLite, tôi không bao gồm các dữ liệu trong các gói từ geoIP phải được cập nhật thường xuyên để ở lại chính xác.
Mặc định đường dẫn geoIP là dữ liệu / GeoIP.dat
Sử dụng như một kịch bản
chụp tốc độ là trong thực tế, một mẫu về cách sử dụng yahi như một module:
#! / Usr / bin / env python
từ nhập khẩu archery.bow Hankyu như _dict
từ yahi nhập notch, bắn
từ nhập khẩu datetime datetime
context = notch ()
date_formater = lambda dt: "% s-% s-% s"% (dt.year, dt.month, dt.day)
context.output (
& Nbsp; bắn (
& Nbsp; bối cảnh,
& Nbsp; dữ liệu lambda: _dict ({
& Nbsp; 'by_country': _dict ({data ['_ nước']: 1}),
& Nbsp; 'by_date': _dict ({date_formater (dữ liệu ['_ datetime']): 1}),
& Nbsp; 'by_hour': _dict ({. Dữ liệu ['_ datetime'] giờ: 1}),
& Nbsp; 'by_os': _dict ({data ['_ os_name']: 1}),
& Nbsp; 'by_dist': _dict ({data ['_ dist_name']: 1}),
& Nbsp; 'by_browser': _dict ({data ['_ BROWSER_NAME']: 1}),
& Nbsp; 'by_ip': _dict ({data ['ip']: 1}),
& Nbsp; 'by_status': _dict ({data ['status']: 1}),
& Nbsp; 'by_url': _dict ({data ['uri']: 1}),
& Nbsp; 'by_agent': _dict ({data ['đại lý']: 1}),
& Nbsp; 'by_referer': _dict ({data ['referer']: 1}),
& Nbsp; 'ip_by_url': _dict ({data ['uri']: _dict ({data ['ip']: 1})}),
& Nbsp; 'bytes_by_ip': _dict ({data ['ip']: int (dữ liệu ['byte'])}),
& Nbsp; 'week_browser':. _dict ({Data ['_ datetime'] trong tuần (từ):
& Nbsp; _dict ({dữ liệu ["_ BROWSER_NAME"]: 1})}),
& Nbsp; 'total_line': 1,
& Nbsp;}),
& Nbsp;),
)
Cài đặt
dễ dàng như:
pips cài đặt yahi
hoặc:
easy_install yahi
sử dụng recommanded
- Cho tập hợp đăng nhập cơ bản, tôi recommand sử dụng dòng lệnh;
- Cho một số liệu bắn tôi khuyên bạn nên một giao diện điều khiển tương tác (bpython hoặc ipython);
. - Cho các số liệu cụ thể hoặc các bộ lọc phức tạp Tôi recommand sử dụng các API
Yêu cầu :
- Python
Bình luận không