DataFu được phát triển tại LinkedIn và được viết hoàn toàn bằng Java.
DataFu bao gồm các chức năng / thư viện để làm việc với:
- Thống kê
- Dự toán
- Lấy mẫu
- Sessions
- Liên kết Phân tích
- Set hoạt động
- Túi Xách
DataFu là hoàn hảo cho khai thác dữ liệu và các ứng dụng thống kê làm việc trên cơ sở dữ liệu Hadoop hoặc lợn.
Các chức năng này cho phép các nhà phát triển để tận dụng lợi thế đầy đủ của tất cả các dữ liệu được lưu trữ bên trong một Hadoop hoặc Heo cơ sở dữ liệu mà không cần phải đối phó với các yêu cầu hệ thống lớn để làm như vậy.
Điều gì là mới trong phiên bản này:.
- Cặp UDFs cho lấy mẫu ngẫu nhiên đơn giản với sự thay thế
- Thêm phụ thuộc hiện đóng gói trong DataFu rất ít JAR phụ thuộc yêu cầu.
- SetDifference UDF để tính toán thiết lập khác nhau (ví dụ A-B hoặc A-B-C).
Điều gì là mới trong phiên bản 1.2.0:
- Cặp UDFs cho lấy mẫu ngẫu nhiên đơn giản với sự thay thế.
- Thêm phụ thuộc hiện đóng gói trong DataFu rất ít JAR phụ thuộc yêu cầu.
- SetDifference UDF để tính toán thiết lập khác nhau (ví dụ A-B hoặc A-B-C).
Điều gì là mới trong phiên bản 1.1.0:.
- Added SHA hash UDF
- InUDF và AssertUDF thêm cho lợn 0.12 tương thích. Đây là những giống như In và Khẳng định.
- SimpleRandomSample, mà thực hiện một thuật toán lấy mẫu ngẫu nhiên đơn giản mở rộng.
Bình luận không