WordTabulator dành cho phân tích văn bản. Với sự giúp đỡ của wordTabulator bạn có thể tạo ra chỉ số của các yếu tố từ chiết xuất từ bộ được xác định văn bản. Các yếu tố từ có thể là từ ngữ, N-gram (kích thước được xác định) hoặc cụm từ (syntagmes). Chương trình có thể xử lý các văn bản như bình thường trong 2-byte mã hóa (ANSI), như trong nhiều byte mã hóa UTF-8. Văn bản nguồn được định nghĩa là một tập hợp các tập tin văn bản bằng phẳng hoặc HTML / XML tài liệu / SGML. Trong trường hợp cuối cùng của chương trình có thể lọc nội dung từ dấu. Hơn nữa, bạn có thể xử lý chỉ định nội dung trong thẻ cặp chọn. Hoặc bạn có thể bỏ nội dung từ chế biến. Nó bao gồm các mô-đun hình thái cho Nga, ba định dạng khác nhau của các chỉ số đầu ra, có ba loại khác nhau của các yếu tố từ (words, N-Grams và cụm từ), trình duyệt của bối cảnh, và đúng thứ tự bảng chữ cái.
Các chi tiết về phần mềm:
Phiên bản: 3.5
Ngày tải lên: 15 Apr 15
Giấy phép: Miễn phí
Phổ biến: 370
Kích thước: 2708 Kb
Bình luận không