Apache Hive lần đầu tiên được phát triển như là một Apache Hadoop tiểu dự án để cung cấp các quản trị viên Hadoop với một dễ sử dụng, thành thạo ngôn ngữ truy vấn cho dữ liệu của họ.
Bởi vì điều này, Hive được phát triển từ đầu đến làm việc với một lượng thông tin khổng lồ cho mỗi truy vấn và được hoàn toàn thích nghi cho cơ sở dữ liệu quy mô lớn và môi trường kinh doanh.
Cụ được bao gồm cho dễ dàng tải, giải nén và chuyển đổi dữ liệu, trong khi cấu trúc dữ liệu tùy chỉnh có thể được buộc vào một tập lớn các định dạng dữ liệu.
Vì nó là một dự án Hadoop liên quan đến các HDFS và HBase dự án cũng sẽ tự động được hỗ trợ.
HiveQL có lẽ là phần tốt nhất của dự án, cung cấp một ngôn ngữ truy vấn đơn giản, sáng tạo và hiệu quả, trong khi cũng có thể xử lý người vẽ bản đồ và gia giảm trong những tình huống mà các cú pháp SQL bản địa không thể có được các dữ liệu mong muốn.
là gì mới trong phiên bản này:
- Hỗ trợ các truy vấn con tương quan trong mệnh đề WHERE
- Thêm NULL NGHĨA AS để hàng đặc điểm kỹ thuật FORMAT
- Ccreate / thả cơ sở dữ liệu nên cư đầu vào / đầu ra và kiểm tra đồng thời và cho phép người dùng
- Hỗ trợ quy mô nêu rõ và chính xác với kiểu Hive thập phân
- Hãy có Tez
- Một chức năng bao gồm vị trí của mục trong mảng phát nổ
- Thêm kiểu dữ liệu char
- Tạo thu UDF và làm cho đánh giá tái sử dụng
- Mở rộng văn bản ghi và ORC đọc / ghi các giao diện để cung cấp số liệu thống kê
- Thực hiện thống kê cung cấp ORC viết và người đọc các giao diện
- Chú thích cây điều hành hive với số liệu thống kê từ metastore
- Cung cấp các số liệu thống kê cột mức sọc trong ORC
- hỗ trợ Subquery: không cho phép làm tổ của các truy vấn con
- hỗ trợ Subquery: cho phép biểu subquery trong việc có khoản
- hỗ trợ Subquery: thêm các xét nghiệm
- Native Ván sàn Support trong Hive
- Hive nên có thể bỏ qua header và footer hàng khi đọc tập tin dữ liệu cho một bảng
- Thêm NGÀY, dấu thời gian, thập phân, CHAR, VARCHAR loại hỗ trợ trong HCat
- Sử dụng bản đồ-gia gợi ý để cache kết quả trung gian
- Thêm UDF để tính toán khoảng cách giữa các tọa độ địa lý
là gì mới trong phiên bản 1.2.0:
- Hỗ trợ các truy vấn con tương quan trong mệnh đề WHERE
- Thêm NULL NGHĨA AS để hàng đặc điểm kỹ thuật FORMAT
- Ccreate / thả cơ sở dữ liệu nên cư đầu vào / đầu ra và kiểm tra đồng thời và cho phép người dùng
- Hỗ trợ quy mô nêu rõ và chính xác với kiểu Hive thập phân
- Hãy có Tez
- Một chức năng bao gồm vị trí của mục trong mảng phát nổ
- Thêm kiểu dữ liệu char
- Tạo thu UDF và làm cho đánh giá tái sử dụng
- Mở rộng văn bản ghi và ORC đọc / ghi các giao diện để cung cấp số liệu thống kê
- Thực hiện thống kê cung cấp ORC viết và người đọc các giao diện
- Chú thích cây điều hành hive với số liệu thống kê từ metastore
- Cung cấp các số liệu thống kê cột mức sọc trong ORC
- hỗ trợ Subquery: không cho phép làm tổ của các truy vấn con
- hỗ trợ Subquery: cho phép biểu subquery trong việc có khoản
- hỗ trợ Subquery: thêm các xét nghiệm
- Native Ván sàn Support trong Hive
- Hive nên có thể bỏ qua header và footer hàng khi đọc tập tin dữ liệu cho một bảng
- Thêm NGÀY, dấu thời gian, thập phân, CHAR, VARCHAR loại hỗ trợ trong HCat
- Sử dụng bản đồ-gia gợi ý để cache kết quả trung gian
- Thêm UDF để tính toán khoảng cách giữa các tọa độ địa lý
là gì mới trong phiên bản 1.1.0:
- Hỗ trợ các truy vấn con tương quan trong mệnh đề WHERE
- Thêm NULL NGHĨA AS để hàng đặc điểm kỹ thuật FORMAT
- Ccreate / thả cơ sở dữ liệu nên cư đầu vào / đầu ra và kiểm tra đồng thời và cho phép người dùng
- Hỗ trợ quy mô nêu rõ và chính xác với kiểu Hive thập phân
- Hãy có Tez
- Một chức năng bao gồm vị trí của mục trong mảng phát nổ
- Thêm kiểu dữ liệu char
- Tạo thu UDF và làm cho đánh giá tái sử dụng
- Mở rộng văn bản ghi và ORC đọc / ghi các giao diện để cung cấp số liệu thống kê
- Thực hiện thống kê cung cấp ORC viết và người đọc các giao diện
- Chú thích cây điều hành hive với số liệu thống kê từ metastore
- Cung cấp các số liệu thống kê cột mức sọc trong ORC
- hỗ trợ Subquery: không cho phép làm tổ của các truy vấn con
- hỗ trợ Subquery: cho phép biểu subquery trong việc có khoản
- hỗ trợ Subquery: thêm các xét nghiệm
- Native Ván sàn Support trong Hive
- Hive nên có thể bỏ qua header và footer hàng khi đọc tập tin dữ liệu cho một bảng
- Thêm NGÀY, dấu thời gian, thập phân, CHAR, VARCHAR loại hỗ trợ trong HCat
- Sử dụng bản đồ-gia gợi ý để cache kết quả trung gian
- Thêm UDF để tính toán khoảng cách giữa các tọa độ địa lý
là gì mới trong phiên bản 1.0.0:
- Hỗ trợ các truy vấn con tương quan trong mệnh đề WHERE
- Thêm NULL NGHĨA AS để hàng đặc điểm kỹ thuật FORMAT
- Ccreate / thả cơ sở dữ liệu nên cư đầu vào / đầu ra và kiểm tra đồng thời và cho phép người dùng
- Hỗ trợ quy mô nêu rõ và chính xác với kiểu Hive thập phân
- Hãy có Tez
- Một chức năng bao gồm vị trí của mục trong mảng phát nổ
- Thêm kiểu dữ liệu char
- Tạo thu UDF và làm cho đánh giá tái sử dụng
- Mở rộng văn bản ghi và ORC đọc / ghi các giao diện để cung cấp số liệu thống kê
- Thực hiện thống kê cung cấp ORC viết và người đọc các giao diện
- Chú thích cây điều hành hive với số liệu thống kê từ metastore
- Cung cấp các số liệu thống kê cột mức sọc trong ORC
- hỗ trợ Subquery: không cho phép làm tổ của các truy vấn con
- hỗ trợ Subquery: cho phép biểu subquery trong việc có khoản
- hỗ trợ Subquery: thêm các xét nghiệm
- Native Ván sàn Support trong Hive
- Hive nên có thể bỏ qua header và footer hàng khi đọc tập tin dữ liệu cho một bảng
- Thêm NGÀY, dấu thời gian, thập phân, CHAR, VARCHAR loại hỗ trợ trong HCat
- Sử dụng bản đồ-gia gợi ý để cache kết quả trung gian
- Thêm UDF để tính toán khoảng cách giữa các tọa độ địa lý
là gì mới trong phiên bản 0.8.1:
- Công cụ để cho phép dễ dàng trích xuất dữ liệu / chuyển đổi / load (ETL).
- Một cơ chế để áp đặt các cấu trúc trên một loạt các định dạng dữ liệu.
- Truy cập vào các tập tin được lưu trữ một cách trực tiếp trong Apache HDFS (TM) hoặc trong các hệ thống lưu trữ dữ liệu khác như Apache HBase (TM).
- thực hiện truy vấn thông qua MapReduce.
là gì mới trong phiên bản 0.8.0:
- Công cụ để cho phép dễ dàng trích xuất dữ liệu / chuyển đổi / load (ETL)
- Một cơ chế để áp đặt các cấu trúc trên một loạt các định dạng dữ liệu
- Truy cập vào các tập tin được lưu trữ một cách trực tiếp trong Apache HDFS (TM) hoặc trong các hệ thống lưu trữ dữ liệu khác như Apache HBase (TM)
- thực hiện truy vấn thông qua MapReduce
là gì mới trong phiên bản 0.7.1:
- Bugs:
- Exception trên cửa sổ khi sử dụng các trình điều khiển JDBC. & quot; IOException:. Hệ thống không thể tìm thấy con đường quy định & quot;
- kịch bản sáng tạo Schema là không đầy đủ kể từ khi họ rời khỏi bàn cụ thể cho DataNucleus.
- Cải tiến:
- Cải thiện thông báo lỗi linh tinh.
- Quay trở lại đúng chính / số phiên bản nhỏ cho JDBC Hive Driver.
- Add thi HivePreparedStatement dựa trên hiện Hive được hỗ trợ dữ liệu loại.
- Nhiệm vụ:
- Hive trong Maven.
- Cung cấp Metastore kịch bản nâng cấp và lược đồ mặc định cho PostgreSQL.
là gì mới trong phiên bản 0.7.0:
- Tính năng mới:
- cơ sở hạ tầng Authorization cho Hive
- Thực hiện chỉ mục trong Hive
- Thêm phản ánh () UDF cho gọi phản ánh của các phương pháp Java
- Hive TypeInfo / ObjectInspector để hỗ trợ công đoàn (ngoài struct, array, và bản đồ)
- Thực hiện GenericUDF str_to_map
- Patch để hỗ trợ HAVING khoản trong Hive
- Theo dõi các gia đang được chuyển đến map-join tự động
- Gọi tần số và thời gian cho HiveMetaStore qua jmx
- Duy trì lastAccessTime trong metastore
- Cải tiến:
- Cung cấp các tùy chọn để xuất khẩu một HEADER
- Hỗ trợ cho các lựa chọn khác biệt trên hai hoặc nhiều cột
- Mô tả mở rộng đầu ra bảng / phân vùng là khó hiểu
- Thiếu một số chức năng như JDBC getTables, getColumns và HiveResultSet.get * phương pháp dựa trên tên cột.
- Khai thác các bản ghi từ các tiến trình con
- Hỗ trợ bộ lọc đẩy xuống chống lại các bảng không bản địa
- Thay thế phụ thuộc vào HBase phản API
- Thêm queryid khi khóa
- Update transident_lastDdlTime chỉ nếu không quy định
- Thêm thông tin debug hơn cho khóa hive
- HiveInputFormat hoặc CombineHiveInputFormat luôn đồng bộ khối RCFile hai lần
- Hiển thị thời gian công tác tại địa phương mất
- Tạo một thể hiện Zookeeper mới khi khóa thử lại, và thêm thông tin cho debug
- Thêm một tùy chọn để chạy nhiệm vụ để kiểm tra bản đồ-gia khả năng ở chế độ không địa phương
- More gỡ lỗi cho các khóa
- Thêm một lựa chọn trong chèn phân vùng động để ném ra một lỗi nếu 0 phân vùng được tạo ra
- Bugs:
- & quot; LOAD DATA LOCAL INPATH & quot; không thành công khi bảng đã chứa một tập tin cùng tên
- NULL không được xử lý một cách chính xác trong gia
- HiveInputFormat.getInputFormatFromCache & quot; nuốt & quot; nguyên nhân gây ra ngoại lệ khi ném IOExcpetion
- Thêm sự tiến bộ trong tham gia và groupby
- UDAFs đơn giản với hơn 1 tham số vụ tai nạn trên truy vấn hàng trống
- Lĩnh vực UDF () không làm việc
- chèn phân vùng động các tập tin còn trống chưa được làm sạch trong Hadoop 0.17 chế độ địa phương
- Bỏ cập nhật truy cập khi RunningJob.getCounters () trả về null
số liệu
là gì mới trong phiên bản 0.5.0:.
- Hãy để người dùng chỉ định serde cho kịch bản tùy chỉnh
- Thêm UDF unhex.
- Remove nhập khẩu lzocodec từ FileSinkOperator.
- Driver NullPointerException khi gọi getResults mà không biên dịch đầu tiên.
- Hiệu suất cải thiện cho RCFile và ColumnarSerDe trong Hive.
Bình luận không