WebExtractor360 là một nguồn dữ liệu web vắt mở và miễn phí. Nó cho phép bạn trích xuất hình ảnh, những cụm từ, HTML Headers, Bàn HTML, URL (Liên kết), URL (Keywords), email, điện thoại, fax và bất kỳ thông tin khác trên trang web bằng cách xác định một biểu hiện thường xuyên.
Các phần mềm web vắt bắt đầu bằng cách thu thập dữ liệu URL web được chỉ định hoặc bất kỳ tập tin tài nguyên địa phương. Tất cả các dữ liệu mà các bản đồ đến (Regular Expression) lĩnh vực trận đấu sẽ được trả lại như một kết quả. Sau khi hoàn tất quá trình kết hợp cho các URL được chỉ định, thu thập thông tin sẽ tiếp tục xử lý các URL khác mà các liên kết URL được chỉ định để. Toàn bộ quá trình được lặp đi lặp lại cho đến khi các URL maximun đã đạt tới hoặc không có nhiều URL để xử lý.
Yêu cầu :
Microsoft .Net Framework 2.0
Bình luận không