dkpro TC là một mã nguồn mở và hoàn toàn miễn phí khung phân loại văn bản viết bằng các ngôn ngữ lập trình Java, dựa trên UIMA Khung Apache, và được xây dựng trên đầu trang của Weka Machine Learning Toolkit, dkpro Core, và dkpro Lab. Nó được thiết kế đặc biệt để giảm thiểu các thí nghiệm học máy có giám sát mà đối trẻ bất kỳ loại dữ liệu văn bản.
Dkpro TC có mã ví dụ fetting-bắt đầu có thể được sử dụng cho các bộ sưu tập văn bản chuẩn, như Reuters-21578 Tiêu đề Phân loại corpus, trong Groovy và Java; nhiều tính năng vắt chung chung, chẳng hạn như POS-tag và n-gram; thuận lợi chức năng tối ưu hóa các thông số; báo cáo rộng rãi, hỗ trợ rất nhiều các biện pháp thực hiện tiêu chuẩn; hỗ trợ cho từng đôi phân loại tài liệu; . hỗ trợ cho đơn nhãn và phân loại đa nhãn
Yêu cầu :
- Java 2 Standard Edition Runtime Environment
Bình luận không