lxml

Phần mềm chụp màn hình:
lxml
Các chi tiết về phần mềm:
Phiên bản: 3.4.1
Ngày tải lên: 17 Feb 15
Nhà phát triển: Martijn Faassen
Giấy phép: Miễn phí
Phổ biến: 72

Rating: nan/5 (Total Votes: 0)

lxml là một mô-đun Python tinh vi, mạnh mẽ, tự do và độc đáo mà gắn bó với các libxml2 và libxslt thư viện, cho phép các nhà phát triển Python để làm việc với cả hai tập tin XML và HTML nội Python code.An xử lý XML librarylxml của họ là một XML (Extensible Markup Language ) thư viện xử lý bằng văn bản trong các ngôn ngữ lập trình Python, được thiết kế đặc biệt để thực hiện theo các đặc điểm kỹ thuật API ElementTree càng nhiều càng tốt.
Nó có thể mở rộng các API ElementTree để lộ các chức năng cụ thể của libxslt và libxml2 thư viện, như Relax NG (Next-Generation), XPath, XML Schema, c14n, XSLT (Extensible Stylesheet Language), etc.Use lxml gọi Python mã từ stylesheetsDevelopers XSLT sẽ có thể sử dụng chương trình lxml gọi Python mã từ stylesheets XSLT và XPath biểu thức thông qua các chức năng mở rộng. Một loạt các hướng dẫn có sẵn trên các dự án & rsquo; s trang chủ (xem các liên kết ở cuối bài viết).
Các phần mềm có mã nguồn mở do thiết kế và kết hợp đầy đủ tính năng và tốc độ của các thư viện nói trên với sự đơn giản của Python & rsquo; s API (Application Programming Interface) .Getting bắt đầu với lxmlIt là khá dễ dàng để cài đặt lxml trên một phân phối GNU / Linux bằng cách sử dụng kho lưu trữ nguồn được phát hành trên Softoware và các dự án & rsquo; s trang web chính thức. Đơn giản chỉ cần tải về các gói nguồn, lưu nó vào thư mục Home của bạn, giải nén nó, mở ứng dụng Terminal và tìm đến vị trí của các tập tin lưu trữ trích xuất (ví dụ: cd /home/softoware/lxml-3.4.1).
Chạy & lsquo; làm & rsquo; lệnh để biên dịch chương trình, mà phải mất khoảng 1-2 phút trên một máy tính hiện đại. Sau một biên dịch thành công, chạy & lsquo; thực hiện cài đặt & rsquo; lệnh như là người chủ hoặc & lsquo; sudo make install & rsquo; lệnh như một người sử dụng đặc quyền để cài đặt hệ thống wide.Supports lxml GNU / Linux và Microsoft Windows hoạt động systemsThe phần mềm được hỗ trợ chính thức trên GNU / Linux và Microsoft Windows hệ điều hành. Nó đã được thử nghiệm thành công trên các máy tính 32-bit và 64-bit

là gì mới trong phiên bản này:.

  • Tính năng thêm vào:
  • New phát htmlfile HTML để đi cùng với sự gia tăng xmlFile serialization API. Patch của Burak Arslan.
  • Lỗi cố định:
  • lxml.sax.ElementTreeContentHandler không khởi lớp cha của nó.

là gì mới trong phiên bản 3.3.1:

  • Lỗi cố định:
  • LP # 1014290: tài liệu HTML được phân tích bằng parser.feed () không tìm thấy yếu tố trong quá trình lặp đi lặp lại tag
  • .
  • LP # 1273709: Xây dựng trong PyPy thất bại do thiếu hỗ trợ cho PyUnicode_Compare () và PyByteArray _ * () trong C-API PyPy của
  • .
  • LP # 1274413: Compilation trong MSVC thất bại do thiếu & quot; stdint.h & quot; tập tin tiêu đề chuẩn.
  • LP # 1274118: iterparse () không phân tích BOM tiền tố file
  • .

là gì mới trong phiên bản 3.0 Alpha 2:

  • Các tính năng bổ sung:
  • Các .iter () phương pháp của các yếu tố bây giờ chấp nhận đối số tag như & quot; {*} tên & quot; để tìm kiếm các phần tử với một tên địa phương đưa ra trong bất kỳ không gian tên. Với sự bổ sung này, tất cả các kết hợp của các ký tự đại diện doanh nghiệp làm việc như mong đợi: & quot; {ns} tên & quot ;, & quot; {} tên & quot ;, & quot; {*} tên & quot ;, & quot; {ns} * & quot ;, & quot; {} * & quot; và & quot; {*} * & quot ;. Lưu ý rằng & quot; tên & quot; tương đương với & quot; {} tên & quot ;, nhưng & quot; * & quot; là & quot; {*} * & quot ;. Sự thay đổi này cũng áp dụng cho các .getiterator (), .itersiblings (), .iterancestors (), .iterdescendants (), .iterchildren () và .itertext () phương pháp, các strip_attributes (), strip_elements () và strip_tags () chức năng cũng như các) lớp (iterparse.
  • C14N cho phép xác định các tiền tố toàn diện để được lên cấp cao nhất trong quá trình tuần tự độc quyền.
  • Lỗi cố định:
  • Đi qua chuỗi Unicode dài vào thức ăn chăn nuôi () giao diện phân tích cú pháp không thể đọc toàn bộ chuỗi.

là gì mới trong phiên bản 2.3.5:

  • Crash khi sáp nhập các nút văn bản trong element.remove ( ).
  • Crash trong sax / mục tiêu phân tích báo cáo khi tài liệu được sản phẩm nào.

là gì mới trong phiên bản 2.3.4:

  • Crash khi xây dựng một nsmap (Element tài sản) với URI không gian tên sản phẩm nào.
  • Tai nạn do điều kiện chủng tộc khi lỗi (hoặc thông điệp người dùng) xảy ra trong quá trình xử lý XSLT ren.
  • XSLT stylesheet biên dịch có thể bỏ qua các lỗi biên dịch.

là gì mới trong phiên bản 2.3.2:

  • Các tính năng bổ sung:
  • lxml.objectify.deannotate () có một tùy chọn mới cleanup_namespaces boolean để loại bỏ các khai báo không gian tên làm thành khách quan (và nói chung là làm sạch các tờ khai không gian tên) sau khi gỡ bỏ các chú thích loại.
  • lxml.objectify đạt SubElement riêng () chức năng của nó như là một bản sao của etree.SubElement để tránh nhập khẩu nếu không dư thừa của lxml.etree về phía người sử dụng.
  • Lỗi cố định:
  • Cố định các & quot; hậu duệ & quot; lỗi trong cssselect một lần thứ hai (sau khi sửa chữa đầu tiên trong lxml 2.3.1). Sự thay đổi trước đó dẫn đến một hồi quy hiệu suất nghiêm trọng cho việc đánh giá XPath dựa trên các biểu hiện dịch. Lưu ý rằng điều này phá vỡ việc sử dụng một số các biểu thức XPath tạo ra như XSLT đường dẫn vị trí mà trước đây từng làm việc trong 2.3.1.
  • Cố định phân tích của một số bộ chọn trong cssselect. Khoảng trắng sau combinators & quot; & Gt; & quot ;, & quot; + & quot; và & quot; ~ & quot; bây giờ được bỏ qua một cách chính xác. Trước đây được đã được phân tích như một combinator hậu duệ. Ví dụ: & quot; div & gt; .foo & quot; được phân tích cú pháp tương tự như & quot; div & gt; * .foo & quot; thay vì & quot; div & gt; .foo & quot;.

là gì mới trong phiên bản 2.3.1:

  • Các tính năng bổ sung:
  • chọn New kill_tags trong lxml.html.clean để loại bỏ các thẻ cụ thể và nội dung của họ (tức là toàn bộ cây con của họ).
  • pi.get () và pi.attrib về hướng dẫn xử lý để phân tích pseudo-thuộc tính từ các nội dung văn bản hướng dẫn xử lý.
  • lxml.get_include () trả về một danh sách gồm các đường dẫn có thể được sử dụng để biên dịch mã C bên ngoài chống lại lxml.etree. Đây là yêu cầu đặc biệt cho lxml liên kết tĩnh xây dựng khi mã cần phải biên dịch so với cùng phiên bản tập tin tiêu đề chính xác như lxml chính nó.
  • Resolver.resolve_file () có một tùy chọn close_file thêm rằng cấu hình nếu các tập tin (-like) đối tượng sẽ được đóng lại sau khi đọc hay không. Theo mặc định, các tập tin sẽ được đóng, là người dùng không được dự kiến ​​sẽ giữ một tham chiếu đến nó.
  • Lỗi cố định:
  • làm sạch HTML đã không loại bỏ 'data:'. Liên kết
  • Việc tích hợp html5lib phân tích cú pháp bây giờ sử dụng thực hiện 'chính thức' trong html5lib chính nó, mà làm cho nó làm việc với các phiên bản mới hơn của thư viện.
  • Trong lxml.sax, endElementNS () không đúng có thể từ chối một tên thẻ đồng bằng khi sự kiện bắt đầu tương ứng suy ra cùng tên thẻ đồng bằng được trong không gian tên mặc định.
  • Khi một đối tượng tập tin giống như mở được thông qua vào phân tích cú pháp () hoặc iterparse (), phân tích cú pháp sẽ không còn gần gũi sau khi sử dụng. Điều này trở lại trạng một sự thay đổi trong lxml 2.3, nơi tất cả các tập tin sẽ được đóng lại. Đó là những người sử dụng có trách nhiệm đúng đóng file (-like) đối tượng, còn trong trường hợp lỗi.
  • lỗi Assertion trong khi loại bỏ các yếu tố lxml.html.cleaner cấp cao nhất.
  • Trong lxml.cssselect, sử dụng xpath 'A // B' (viết tắt của 'A / descendant-or-self :: node () / B') thay vì 'A / descendant :: B' cho css selector hậu duệ ('A B'). Điều này làm cho một số ít trường hợp cạnh để phù hợp với các hành vi chọn trong WebKit và Firefox, và làm cho biểu thức css nhiều đường dẫn vị trí hợp lệ (để sử dụng trong xsl: template match).
  • Trong lxml.html, thẻ không được chọn không còn xuất hiện trong các giá trị dưới hình thức thu thập được.
  • Thêm / gỡ bỏ các giá trị đến / từ một chọn trường mẫu nhiều lựa chọn đúng họ và unselects họ.
  • Các thay đổi khác:
  • Static xây dựng có thể chỉ định thư mục tải về với các tùy chọn --download-dir.

là gì mới trong phiên bản 2.3:

  • Các tính năng bổ sung:
  • Khi tìm kiếm trẻ em, lxml.objectify mất '{} tag' như có nghĩa là một không gian trống rỗng, như trái ngược với các không gian tên cha mẹ.
  • Lỗi cố định:
  • Khi đọc từ một đối tượng tập tin giống như hoàn thành, phân tích cú pháp ngay lập tức gọi .close phương pháp của nó ().
  • Khi hoàn tất phân tích cú pháp, iterparse () ngay lập tức đóng cửa các tập tin đầu vào.
  • Work-chữa lỗi libxml2 rằng có thể để phân tích cú pháp HTML trong một trạng thái không hoạt động sau khi phân tích một tài liệu bị hỏng severly (cố định trong libxml2 2.7.8).
  • marque tag trong mã HTML sạch được đặt tên chính xác vùng chọn.
  • Các thay đổi khác:
  • Một số chức năng công cộng trong Cython cấp C-API có loại trở lại rõ ràng hơn.

là gì mới trong phiên bản 2.2.8 / 2.3 Beta 1:

  • Crash trong các phiên bản mới hơn khi libxml2 di chuyển các yếu tố giữa các tài liệu mà có thuộc tính trên các nút XInclude thay thế.
  • XMLID () chức năng đã thiếu phân tích cú pháp và BASE_URL thông số tùy chọn.
  • Tìm kiếm các ký tự đại diện trong thẻ iterparse () đã bị phá vỡ trong Py3.
  • lxml.html.open_in_browser () không làm việc trong Python 3 do việc sử dụng các os.tempnam. Nó bây giờ có một tham số 'mã hóa' tùy chọn.

Yêu cầu :

  • Python

Phần mềm tương tự

GenNenga
GenNenga

20 Feb 15

Hover
Hover

11 May 15

XRNS-PHP
XRNS-PHP

14 Apr 15

UberWriter
UberWriter

17 Feb 15

Phần mềm khác của nhà phát triển Martijn Faassen

z3c.relationfield
z3c.relationfield

14 Apr 15

hurry.resource
hurry.resource

11 May 15

Ý kiến ​​để lxml

Bình luận không
Nhập bình luận
Bật hình ảnh!