speedparser là một reimplementation hộp đen của Feed Parser Universal. Nó sử dụng lxml cho phân tích thức ăn và cho tùy chọn HTML sạch & nbsp;. Speedparser tương thích với feedparser là rất tốt cho một tập hợp con nghiêm ngặt của các lĩnh vực, nhưng người nghèo đối với các trường bên ngoài tập hợp con đó. Xem xét nghiệm / speedparsertests.py để biết thêm thông tin về các lĩnh vực mà là nhiều hơn hoặc ít tương thích và không được.
Trên lý Intel Core i5 750, chỉ chạy trên một lõi, feedparser quản lý thức ăn 2,5 / giây trên bộ nguồn cấp dữ liệu thử nghiệm (khoảng 4200 "ăn" trong các bài kiểm tra / feeds.tar.bz2), trong khi speedparser quản lý khoảng 65 loại thức ăn / giây với HTML . làm sạch vào và 200 thức ăn / giây với làm sạch tắt
Yêu cầu :
- Python
- lxml
Bình luận không