Các chi tiết về phần mềm:
Phiên bản: 0.11.1 Cập nhật
Ngày tải lên: 6 Mar 16
Giấy phép: Miễn phí
Phổ biến: 239
Apache Mahout được tạo ra để giúp các nhà phát triển Java viết được nhân rộng thuật toán máy học.
Mahout là có nghĩa là để xử lý tải dữ liệu khổng lồ, cùng với mã số kinh doanh cấp, tất cả theo một giấy phép mã nguồn mở, nhưng kết quả cấp thương mại.
Hiện nay quá trình Mahout là như sau: dữ liệu của tôi để có được nó, cụm nó để tổ chức dữ liệu và phân loại nó để tìm hiểu nó
Điều gì là mới trong phiên bản này:
- Phiên bản này sửa lỗi bộ nhớ sử dụng chủ yếu trong phân tích đồng xảy ra được sử dụng bởi các trình điều khiển bằng tia itemsimilarity quản tượng-1707. Điều này bây giờ sẽ đòi hỏi ít bộ nhớ trong thực thi.
- Hỗ trợ Spark 1.2.2 hoặc ít hơn - do một lỗi trong Spark 1.2+ trong JavaSerializer (SPARK-6069), chúng tôi loại bỏ việc sử dụng ổi từ bất kỳ mã thực thi trong Chấp hành Spark. Để làm điều này, chúng tôi đã tạo ra một bộ sưu tập Scala dựa BiMap vì vậy bất kỳ mã ví dụ cho thấy làm thế nào để sử dụng các bộ sưu tập ổi cũ đã lỗi thời.
- Một số sửa chữa nhỏ để Mahout-Luân Hồi QR phân hủy và ops ma trận.
- Cắt giảm kích thước gói để & # x3c; 200MB -. Mahout-1704
- thử nghiệm nhỏ cho thấy khả năng tương thích nhị phân với Spark 1.3 ngoại trừ các Mahout Shell, mà không chạy.
Điều gì là mới trong phiên bản 0.10.1:
- Phiên bản này sửa lỗi sử dụng bộ nhớ lớn trong hợp tác phân tích -occurrence được sử dụng bởi các trình điều khiển bằng tia itemsimilarity quản tượng-1707. Điều này bây giờ sẽ đòi hỏi ít bộ nhớ trong thực thi.
- Hỗ trợ Spark 1.2.2 hoặc ít hơn - do một lỗi trong Spark 1.2+ trong JavaSerializer (SPARK-6069), chúng tôi loại bỏ việc sử dụng ổi từ bất kỳ mã thực thi trong Chấp hành Spark. Để làm điều này, chúng tôi đã tạo ra một bộ sưu tập Scala dựa BiMap vì vậy bất kỳ mã ví dụ cho thấy làm thế nào để sử dụng các bộ sưu tập ổi cũ đã lỗi thời.
- Một số sửa chữa nhỏ để Mahout-Luân Hồi QR phân hủy và ops ma trận.
- Cắt giảm kích thước gói để & # x3c; 200MB -. Mahout-1704
- thử nghiệm nhỏ cho thấy khả năng tương thích nhị phân với Spark 1.3 ngoại trừ các Mahout Shell, mà không chạy.
Điều gì là mới trong phiên bản 0.10.0:.
- Scala DSL Bindings cho Mahout Toán Đại số tuyến tính
- người giới thiệu như một tìm kiếm.
- Hỗ trợ cho quan điểm Matrix chức năng dễ dàng và các dẫn xuất
- định dạng đầu ra JSON cho ClusterDumper
- Kích hoạt thử nghiệm ngẫu nhiên cho tất cả các mô-đun Quản tượng sử dụng Carrot RandomizedRunner.
- Online Thuật toán để tính quantiles chính xác sử dụng Clustering 1 chiều.
- Nâng cấp Mahout để Lucene 4.6.1
Điều gì là mới trong phiên bản 0.8:
- Hỗ trợ kiến recommender dựa trên item
- ma trận SGD thừa để dự báo giá với người dùng và mục sai số
- Hỗ trợ cho SVD ++
- Hỗ trợ chuyển đổi một hoặc nhiều chỉ số lưu trữ Lucene để SequenceFiles cũng như một bản nâng cấp của phiên bản Lucene hỗ trợ để Lucene 4.3.1.
- New luồng k-means thực hiện cung cấp trên mạng (và nhanh chóng) phân nhóm
- Thực hiện chuyển đổi để SequenceFiles Map-Giảm, 'seqdirectory' có thể được chạy như là một công việc MapReduce.
- Thêm tùy chọn để MinHashDriver mà xác định kích thước của vector để băm (chỉ số hoặc giá trị).
- Matrix Concat tiện ích, hiện nay chỉ được nối hai ma trận.
- nâng cấp để CommonsLang3
- Tăng tốc các Mahout xây dựng bằng cách làm các bài kiểm tra chạy song song.
Bình luận không