Apache UIMA là viết tắt của U nstructured I thông tin chảy M anagement pplications.
UIMA là một dự án thú vị từ Apache Foundation mà cố gắng để phân tích và phát hiện các khối thông tin và mô hình dữ liệu bên trong không có tổ chức lớn.
Như một ví dụ để những gì UIMA hiện một tình huống mà các nhà phát triển có đầu vào lớn từ người dùng của họ là, hãy nói rằng văn bản, mà chúng ăn để UIMA và hệ thống có thể phát hiện người và nơi tên bên trong nó, bất kể vị trí của họ và định dạng bên trong dữ liệu.
Điều này được thực hiện thông qua một loạt các thành phần dễ uốn và các luồng dữ liệu được tổ chức cho phép UIMA để phát hiện thông tin với tốc độ nhanh chóng trong bất kỳ loại cấu trúc.
UIMA có thể được sử dụng để phân tích dữ liệu trong cơ sở dữ liệu lớn và hỗ trợ cho các cấu trúc khả năng mở rộng cho phép các nhà phát triển để chạy nó ngay cả trong các đám mây
là gì mới trong phiên bản này:.
- Các UIMA Framework đã có nhiều cải tiến để hỗ trợ việc sử dụng hiệu quả của máy bộ nhớ lớn có nhiều đa lõi.
- Embedders bây giờ có thể chạy các thiết lập khuôn khổ song song trên máy đa lõi, sử dụng một đối tượng quản lý tài nguyên chung được chia sẻ và được chia sẻ UIMA đối tượng Context.
là gì mới trong phiên bản 2.7.0:
- Các UIMA Framework đã có nhiều cải tiến để hỗ trợ sử dụng hiệu quả máy bộ nhớ lớn có nhiều đa lõi.
- Embedders bây giờ có thể chạy các thiết lập khuôn khổ song song trên máy đa lõi, sử dụng một đối tượng quản lý tài nguyên chung được chia sẻ và được chia sẻ UIMA đối tượng Context.
là gì mới trong phiên bản 2.5.0:
- Phiên bản này chủ yếu là một phiên bản lỗi, sửa chữa.
là gì mới trong phiên bản 2.4.1:.
- Tài liệu của serialization nhị phân
- loại mới của nén serialization nhị phân mà nén dữ liệu đáng kể và một dạng để hỗ trợ hệ thống loại bất bình đẳng nguồn / đích
- Một cơ sở mới được gọi là tham số Overrides ngoài để xác định thông số cài đặt cho annotators có sử dụng tập tin thuộc tính và độc lập của hệ thống phân cấp Annotator
- cải tiến CasCopier để cho phép sao chép một điểm đến một cái nhìn khác nhau.
- tùy chọn bổ sung để hạn chế hoạt động JCasGen để tạo ra chỉ là những loại được định nghĩa trong một dự án, trừ các loại được nhập khẩu từ các dự án khác
- Một plugin Maven mới chạy JCasGen (xem công cụ tài liệu cho cách cấu hình và sử dụng này)
- Một khả năng mới để bảo tồn không gian trắng (indentation) khi phân tích mô tả XML; này hiện nay được sử dụng trong các phần Descriptor Editor (CDE), để bảo tồn indentation khi chỉnh sửa một mô tả hiện.
- Hiệu suất và không gian cải tiến, trong đó có một số phương pháp số lượng lớn để loại bỏ hiệu quả các cấu trúc Feature từ chỉ số
là gì mới trong phiên bản 2.4.0:
- Đây là một phiên bản sửa chữa lỗi, cộng với một số dụng cụ cải tiến.
Bình luận không