Full-Text RSS hoạt động bằng cách lấy một URL đầu vào, phân tích các nội dung, và tạo ra một nguồn cấp dữ liệu toàn văn ra khỏi nó.
Các nguồn cấp dữ liệu sau đó có thể được theo sau để thay đổi thông qua công cụ đọc RSS hay máy tính để bàn, làm việc giống như bất kỳ loại thức ăn khác, cập nhật bất cứ khi nào một sự thay đổi được phát hiện trên trang gốc.
Full-Text RSS trong vinh quang đầy đủ của nó được phát hành theo hai giấy phép thương mại. Một phiên bản miễn phí có sẵn, nhưng các phiên bản thương mại mang lại kết quả khai thác tốt hơn
là gì mới trong phiên bản này:.
- Open tính chất đồ thị og: title, og: type, og: url, og: image, và og: Mô tả bây giờ trở về, nếu thấy trong trang đang được xử lý
- Bug fix: biểu thức XPath nhất định không được đánh giá một cách chính xác khi phân tích cú pháp HTML5 đã được kích hoạt
- xử lý Cookie bây giờ chỉ vào chuyển hướng - bản sửa lỗi vấn đề với các trang web nhất định (nhờ Dave Vasilevsky)
- test tương thích sẽ không còn hiển thị HHVM như không tương thích - Full-Text RSS làm việc với HHVM 3.7.1 trong các thử nghiệm của chúng tôi (nhưng không hỗ trợ Tidy và không có bản cập nhật cấu hình trang web tự động)
- Agent HTTP Humble cập nhật để hỗ trợ phiên bản 2 của phần mở rộng của PHP HTTP
- HTML5-PHP cập nhật
- tập tin cấu hình trang web của doanh nghiệp có thể bao gồm HTTP header (user-agent, cookie, referer), ví dụ: http_header (user-agent): PHP / 5.6
- tùy chọn Config loại bỏ:. tùy chọn $ - & # x3e; user_agents - tập tin trang web sử dụng cấu hình
- Site cấu hình mà sử dụng single_page_link bây giờ có thể làm theo nó với if_page_contains: XPath để làm cho nó có điều kiện .
- tối thiểu hỗ trợ phiên bản PHP tại là 5.3. Nếu bạn phải sử dụng PHP 5.2, xin vui lòng tải Full-Text RSS 3.4
- tập tin cấu hình trang web được cập nhật để khai thác tốt hơn
- sửa chữa nhỏ khác / cải tiến
thư viện
file
là gì mới trong phiên bản 3.4:
- New tham số yêu cầu: siteconfig cho phép bạn gửi các quy định khai thác trực tiếp yêu cầu
- New paramter yêu cầu: chấp nhận = (tự động | thức ăn | html) xác định những gì chúng tôi sẽ chấp nhận như là một phản ứng (deprecates html = 1 tham số)
- New tham số yêu cầu: key_redirect = 0 để ngăn chặn chuyển hướng HTTP để ẩn API key
- Site bây giờ có thể native_ad_clue: [xpath] để kiểm tra các yếu tố biểu thị rằng bài báo là một quảng cáo có nguồn gốc
- tùy chọn cấu hình mới: remove_native_ads - thiết lập là đúng và khi chúng tôi nhận thấy quảng cáo có nguồn gốc (xem ở trên), chúng tôi sẽ loại bỏ chúng khỏi đầu ra (chỉ khi chế biến thức ăn, không ảnh hưởng đến đầu ra khi điểm đầu vào URL đến một trang HTML) .
- nguồn cấp dữ liệu đầu ra sẽ bao gồm tin rao Native cho các bài viết mà xuất hiện để được quảng cáo có nguồn gốc.
- tùy chọn cấu hình mới: user_submitted_config để xác định xem tham số siteconfig được kích hoạt hay không
- nguồn cấp dữ liệu đầu ra hiện nay bao gồm với URL của nguồn cấp dữ liệu được tạo ra
- nguồn cấp dữ liệu đầu ra hiện nay bao gồm với URL của bản gốc (đầu vào) URL
- nguồn cấp dữ liệu đầu ra hiện nay bao gồm với URL để đăng ký vào nguồn cấp dữ liệu được tạo ra (sử dụng subtome.com)
- Thức ăn preview stylesheet (feed.xsl) sẽ thể hiện một đăng ký vào nguồn cấp dữ liệu liên kết
- Cố định vấn đề mã hóa ký tự cho văn bản nhất định
- Cố định vấn đề mã hóa ký tự cho một số nhân vật trong chế độ HTML5 phân tích cú pháp
tập tin cấu hình
là gì mới trong phiên bản 3.3:
- New HTML5 phân tích cú pháp: HTML5Lib đã được thay thế bởi HTML5-PHP (một tuổi đã có quá nhiều vấn đề)
- tùy chọn cấu hình mới: thời gian cache ($ tùy chọn- & gt; cache_time)
- New tùy chọn cấu hình: cho phép / vô hiệu hóa một trang hồi ($ tùy chọn- & gt; singlepage)
- New tùy chọn cấu hình: cho phép phân tích cú pháp HTML override thông qua chuỗi truy vấn ($ tùy chọn- & gt; allow_parser_override)
- New tham số yêu cầu: phân tích cú pháp - sử dụng nó để buộc phân tích cú pháp HTML5 mới được sử dụng, & amp; phân tích cú pháp = html5php (cách này sẽ chậm)
- Mở rộng tham số yêu cầu gỡ lỗi: & amp; debug = rawhtml (hiển thị tiêu đề ban đầu phản ứng và cơ thể), & amp; debug = parsedhtml (cho thấy cơ thể phản ứng sau khi phân tích cú pháp)
- stats APC bây giờ mong muốn APCu (phiên bản cũ của APC vẫn được hỗ trợ, nhưng chỉ số trong khu vực quản trị sẽ không thể xem được)
- Tự động cập nhật các quy tắc khai thác trang web cụ thể cố định
- tiêu đề HTTP bảo mật nội dung đang được sử dụng cho các bản xem trước thức ăn
- thông số yêu cầu và ví dụ phản ứng hiện nay được liệt kê trong một bảng trên các trang chỉ mục (Request mới Thông số tab)
- tập tin thử nghiệm tương thích cập nhật để hiển thị nếu HTML5-PHP phân tích cú pháp được hỗ trợ (PHP 5.3 phụ thuộc), và để kiểm tra HHVM (chưa hỗ trợ)
- tùy chọn Config loại bỏ: $ tùy chọn- & gt; registration_key
- Bảo tồn nguyên tố TTL trong RSS nguồn cấp dữ liệu 2.0
- sửa chữa nhỏ khác / cải tiến
Trang
là gì mới trong phiên bản 3.2:
- nội dung Full bây giờ có thể được loại trừ từ đầu ra (pass & amp; nội dung = 0 trong chuỗi truy vấn, xem $ tùy chọn- & gt; nội dung trong tập tin cấu hình để biết thêm)
- tập tin cấu hình trang web có thể được tự động cập nhật từ các kho lưu trữ của chúng tôi GitHub (URL để gọi được nhìn thấy trong khu vực admin)
- tập tin cấu hình trang web được cập nhật để khai thác tốt hơn
- PHP Dễ đọc cập nhật để được khoan dung hơn khi cắt tỉa HTML
- Thư viện Phát hiện ngôn ngữ được cập nhật
- HTML meta refresh chuyển hướng bây giờ cũng theo sau
- stats APC (APC nếu có sẵn trên máy chủ của bạn) bây giờ có thể nhìn thấy trong khu vực admin
- Sửa lỗi: Duplicate find_string và replace_string giá trị trong tập tin cấu hình trang web không còn bị loại bỏ (! cảm ơn Fabrizio)
- Sửa lỗi: kiểu MIME hành động bây giờ áp dụng khi sau URL trang duy nhất
- sửa chữa nhỏ khác / cải tiến
là gì mới trong phiên bản 3.1:
- Cho phép nhiều thành phần (trước đây chỉ có một được bảo quản)
- Sửa lỗi: Không có nhiều yếu tố iframe tự đóng
- Sửa lỗi: Cố định manifest.yml để ngăn chặn thông báo lỗi khi triển khai để AppFog
- sửa chữa nhỏ khác / cải tiến
là gì mới trong phiên bản 3.0:
- Multi-page supportnext_page_link doanh nghiệp hỗ trợ trong trang cấu hình (kích hoạt / vô hiệu hóa với $ tùy chọn- & gt; nhiều trang)
- HTML5 parser availableuse phân tích cú pháp: html5lib trong trang cấu hình, cũng thấy $ tùy chọn- & gt; allowed_parsers
- Cập nhật các mẫu trang web để khai thác tốt hơn
- New trang web toàn cầu cấu hình để được áp dụng cho tất cả các trang web (global.txt)
- Strip 'http: //' tiền tố khi khóa API được cung cấp
- cấu hình Site sáp nhập (tùy chỉnh + chuẩn + vân tay + toàn cầu)
- Site lệnh cấu hình replace_string (tìm): thay thế bây giờ có thể được chia hơn hai dòng: find_string: tìm, replace_string: thay
- YouTube và Vimeo nay trở về mã nhúng iframe
- Bây giờ chúng ta tìm kiếm OpenGraph tiêu đề và ngày yếu tố
- Cải thiện chiết xuất từ AJAX pageswe bây giờ nhìn cho AJAX gây nên nhúng trong HTML, mỗi Google thông số
- JSONP supportuse & amp; format = json & amp; callback = functionName trong chuỗi truy vấn
- tùy chọn cấu hình mới để cho phép Cross-Origin Resource Sharing (CORS): $ tùy chọn- & gt; CORS
- tùy chọn cấu hình mới để cho phép lọc XSS, nếu có yêu cầu: tùy chọn- $ & gt; xss_filter
- Zend_Cache cập nhật
- Tính năng cachingexperimental thông minh để lưu trữ trong bộ nhớ cache ID APC đầu tiên, và ghi ra đĩa theo yêu cầu tiếp theo (xem $ tùy chọn- & gt; smart_cache)
- dễ dàng hơn đám mây deploymanifest.yml thêm cho AppFog
- APC bộ nhớ đệm của các tập tin cấu hình trang web để cải thiện hiệu suất, nếu APC availablesee $ tùy chọn- & gt; APC
- biên tập cấu hình trang web trong admin / dễ dàng tìm kiếm, chỉnh sửa, kiểm tra, và kiểm tra trang web của tập tin cấu hình, hoặc thêm những cái mới
- chế độ Debug để xem những gì đang xảy ra đằng sau scenessee $ tùy chọn- & gt; debug
- Bỏ tùy chọn phản config: hạn chế, message_to_prepend_with_key, message_to_append_with_key, error_message_with_key
- khai thác Removed với CSS thông qua querystring
- Gỡ bỏ tùy chọn cấu hình: $ tùy chọn- & gt; alternative_url
- Sửa lỗi: cho phép khai thác của một yếu tố duy nhất
- Sửa lỗi: xử lý chuyển hướng cải thiện
URL
Yêu cầu :
- PHP 5.2 hoặc cao hơn
Bình luận không