Apache Solr là một máy chủ tìm kiếm mã nguồn mở, miễn phí, độc lập và hiệu suất cao dựa trên dự án Apache Lucene, sử dụng các API XML / HTTP và JSON. Dự án hiện đang được ấp ủ tại Quỹ Phần mềm Apache.
Tính năng trong nháy mắt
Các tính năng chính bao gồm đánh dấu nhấn, tìm kiếm mặt, lưu bộ nhớ đệm, sao chép, giao diện quản trị dựa trên web, khả năng tìm kiếm toàn văn nâng cao, được tối ưu hóa cho lưu lượng truy cập web khối lượng lớn cũng như các giao diện mở dựa trên tiêu chuẩn, chẳng hạn như HTTP , XML và JSON.
Ngoài ra, nó đi kèm với giao diện quản trị HTML toàn diện, thống kê máy chủ, sao chép chỉ mục tự động, khôi phục tự động và chuyển đổi dự phòng, gần lập chỉ mục thời gian thực, thích nghi và linh hoạt với cấu hình XML và kiến trúc plugin mở rộng.
Dự án là sơ đồ, cho phép người dùng nhanh chóng bắt đầu với Apache Solr. Cả hai chế độ lược đồ và giản đồ đều được hỗ trợ tại thời điểm này, nhưng chế độ lược đồ sau sẽ dẫn đến môi trường sản xuất mạnh.
Các loại khác nhau được hỗ trợ bởi Solr, bao gồm các kiểu trường, sẽ giúp bạn trộn và kết hợp các máy phân tích Lucene mà không cần viết bất kỳ đoạn mã nào. Ngoài ra, dự án hỗ trợ các trường động có thể được bật khi đang di chuyển.
Trong số các tính năng thú vị khác, chúng tôi có thể đề cập đến chức năng của trường sao chép cho phép người dùng dễ dàng phân tích cùng một nội dung bằng các phương pháp khác nhau, hỗ trợ cho các loại rõ ràng để loại bỏ nhu cầu đoán loại trường, cấu hình tùy chỉnh dựa trên tệp bên ngoài, cũng như nhiều thành phần phân tích văn bản bổ sung.
Dưới mui xe và sẵn có
Hãy xem qua phần mềm Apache Solr, chúng ta có thể nhận thấy rằng ứng dụng đã được viết hoàn toàn bằng ngôn ngữ lập trình Java và hỗ trợ các bản phân phối 32 bit và 64 bit của Linux, cũng như Microsoft Windows và Mac OS Hệ điều hành X.
Để thuận tiện cho bạn, nó được phân phối dưới dạng nhị phân và lưu trữ nguồn, vì vậy bạn có thể dễ dàng bắt đầu với Apache Solr trong thời gian tối thiểu nhất có thể và không quá phức tạp.
mới trong bản phát hành này:
- Người giám sát không bao giờ có thể xử lý một số thư cuối cùng.
- Đổi tên lõi ở chế độ độc lập solr không được duy trì.
- Phân tích cú pháp tham số rq của QueryComponent không còn xem xét tham số defType nữa.
- Khắc phục NPE trong SolrQueryParser khi các cụm từ truy vấn bên trong một mệnh đề bộ lọc giảm xuống không có gì.
Tính năng mới trong phiên bản:
- Ngoài nhiều cải tiến khác trong khung bảo mật, bây giờ Solr còn bao gồm một AuthenticationPlugin triển khai HTTP Basic Auth lưu trữ thông tin xác thực một cách an toàn trong ZooKeeper. Đây là một cách đơn giản để yêu cầu tên người dùng và mật khẩu cho bất kỳ ai truy cập vào màn hình hoặc API quản trị của Solr.
- Trong AuthorizationPlugin được xây dựng cung cấp quyền kiểm soát chi tiết tốt hơn việc triển khai ACL cho các tài nguyên khác nhau với các quy tắc permisssion được lưu trữ trong ZooKeeper.
- API khuôn mặt JSON giờ đây có thể thay đổi tên miền cho các lệnh facet, về cơ bản thực hiện một phép nối khối và di chuyển từ cha mẹ sang con, hoặc con cho cha mẹ trước khi tính toán dữ liệu khía cạnh.
- Những cải tiến chính về hiệu suất của API Facet Module / JSON Facet mới.
- Truy vấn và Phạm vi Phạm vi trong Pivot Facets. Cũng giống như API Facet của JSON, các khía cạnh trục có thể lồng ghép các loại khía cạnh khác như phạm vi phạm vi và truy vấn.
- Thêm Tùy chọn Truy vấn Phân tích cú pháp này. Các MoreLikeThis QParser bây giờ hỗ trợ tất cả các tùy chọn được cung cấp bởi trình xử lý MLT. Trình phân tích cú pháp truy vấn linh hoạt hơn nhiều so với trình xử lý vì nó hoạt động trong chế độ đám mây cũng như bất kỳ nơi nào có thể chỉ định truy vấn thông thường.
- Đã thêm hỗ trợ API Schema trong SolrJ
- Đã thêm chế độ Ghi điểm để tham gia thời gian truy vấn và tham gia chặn.
- Đã thêm định dạng phản hồi nụ cười
Tính năng mới trong phiên bản 4.10.3:
- Solr 4.10.2 bao gồm 10 bản sửa lỗi, cũng như Lucene 4.10.2 và 2 bản sửa lỗi của nó.
Tính năng mới trong phiên bản 4.6.1:
- Apache Tika 1.4
- Carrot2 3.8.0
- Vận tốc 1,7 và Công cụ Vận tốc 2.0
- Apache UIMA 2.3.1
- Apache ZooKeeper 3.4.5
- Sửa lỗi:
- SOLR-5408: Điểm số thu gọnQParserPlugin không chính xác khi sử dụng nhiều tiêu chí sắp xếp
- (Brandon Chapman, Joel Bernstein)
- SOLR-5416: Thu gọn thông tin CollapsingQParserPlugin Thẻ / Loại trừ Faceting
- (David Boychuck, Joel Bernstein)
- SOLR-5442: Máy khách Python không thể phân tích cú pháp phản hồi proxy khi được phục vụ bởi Tomcat.
- (Patrick Hunt, Gregory Chanan, Vamsee Yarlagadda, Romain Rigaux, Mark Miller)
- SOLR-5445: Các câu trả lời được ủy quyền sẽ truyền bá tất cả các tiêu đề thay vì tiêu đề đầu tiên cho mỗi khóa.
- (Patrick Hunt, Mark Miller)
- SOLR-5479: Logic thử lại SolrCmdDistributor dừng lại nếu không thể tìm thấy người dẫn đầu cho yêu cầu trong 1 giây.
- (Mark Miller)
- SOLR-5532: Xác thực Loại Nội dung SolrJ quá nghiêm ngặt đối với một số nhà cung cấp dịch vụ web / proxy.
- (Jakob Furrer, hossman, Shawn Heisey, Uwe Schindler, Mark Miller)
- SOLR-5547: Tạo bí danh bộ sưu tập bằng Bộ sưu tập của SolrJ CollectionAdminRequest đặt tên bí danh và bộ sưu tập thành bí danh thành cùng một giá trị.
- (Aaron Schram, Mark Miller)
- SOLR-5577: Có khả năng hết hạn ZooKeeper sẽ không làm chậm cập nhật một số tiền nhất định, mà thay vào đó cắt giảm các cập nhật sau một thời gian nhất định.
- (Mark Miller, Christine Poerschke, Ramkumar Aiyengar)
- SOLR-5580: NPE khi tạo lõi với cả phân đoạn rõ ràng và coreNodeName.
- (YouPeng Yang, Mark Miller)
- SOLR-5552: Quá trình khôi phục người lãnh đạo có thể chọn nhà lãnh đạo sai nếu tất cả bản sao cho phân đoạn bị hỏng và cố khôi phục cũng như mất các bản cập nhật cần được khôi phục.
- (Timothy Potter, Mark Miller)
- SOLR-5569 Một bản sao không nên thử và khôi phục từ một nhà lãnh đạo cho đến khi nó đã xuất bản rằng nó là ACTIVE.
- (Mark Miller)
- SOLR-5568 Một SolrCore không thể quyết định trở thành nhà lãnh đạo chỉ vì trạng thái cụm sao nói không có SolrCore nào khác đang hoạt động.
- (Mark Miller)
- SOLR-5496: Chúng tôi nên chia sẻ một trình quản lý kết nối http trên các HttpClients không tìm kiếm và đảm bảo tất cả các trình quản lý kết nối http đều bị tắt.
- (Mark Miller)
- SOLR-5583: ConcurrentUpdateSolrServer # blockUntilĐược hoàn tất có thể đợi mãi nếu dịch vụ thực thi bị tắt.
- (Mark Miller)
- SOLR-5586: Tất cả các ZkCmdExecutor sẽ được khởi tạo với thời gian chờ máy khách zk.
- (Mark Miller)
- SOLR-5587: Triển khai ElectionContext nên sử dụng ZkCmdExecutor # ensureExists để đảm bảo đường dẫn bầu cử của họ được tạo đúng cách.
- (Mark Miller)
- SOLR-5540: HdfsLockFactory nên tạo rõ ràng thư mục cha mẹ khóa nếu cần.
- (Mark Miller)
- SOLR-4709: Tải lại lõi sau khi sao chép nếu các tệp cấu hình đã thay đổi có thể không thành công do điều kiện chủng tộc. (Mark Miller, Hossman))
- SOLR-5503: Thử lại các yêu cầu 'chuyển tiếp tới nhà lãnh đạo' ít tích cực hơn là trên IOException và trạng thái 500, ConnectException.
- (Mark Miller)
- SOLR-5588: PeerSync không tính tất cả các lỗi kết nối thành công.
- (Mark Miller)
- SOLR-5564: hl.maxAlternateFieldLength nên áp dụng cho trường gốc khi dự phòng được thử
- (janhoy)
- SOLR-5608: Không cho phép SolrCore đóng để xuất bản trạng thái lên ZooKeeper.
- (Mark Miller, Shawn Heisey)
- SOLR-5615: Bế tắc trong khi cố khôi phục sau khi hết hạn phiên ZK.
- (Ramkumar Aiyengar, Mark Miller)
- SOLR-5543: Hoán đổi cốt lõi dẫn đến các mục lõi trùng lặp trong tệp solr.xml khi sử dụng sự kiên trì solr.xml.
- (Bill Bell, Alan Woodward)
- SOLR-5618: Sửa lỗi truy cập bộ nhớ cache sai trong queryResultCache khi hashCodes bằng truy vấn bộ lọc bằng và trùng lặp tồn tại trong một trong các yêu cầu
- (hossman)
- SOLR-4260: ConcurrentUpdateSolrServer # blockUntilFinished có thể trở lại trước khi tất cả các bản cập nhật được thêm trước đó đã hoàn tất. Điều này có thể gây ra các bản cập nhật được phân phối có nghĩa là các bản sao bị mất.
- (Markus Jelsma, Timothy Potter, Joel Bernstein, Mark Miller)
- SOLR-5645: Tải lại SolrCore qua CoreContainer sẽ thử và đăng ký lại zk bằng SolrCore mới.
- (Mark Miller)
- SOLR-5636: SolrRequestParsers thực hiện một số tra cứu xpath trên mọi yêu cầu, điều này có thể gây ra các vấn đề tương tranh.
- (Mark Miller)
- SOLR-5658: commitWithin và ghi đè không được phân phối cho các bản sao bây giờ SolrCloud sử dụng javabin để phân phối các bản cập nhật.
- (Mark Miller, Varun Thacker, Elodie Sannier, shalin)
- Tối ưu hoá:
- SOLR-5576: Cải thiện sự tương tranh khi đăng ký và chờ tất cả SolrCore đăng ký trạng thái XUỐNG.
- (Christine Poerschke qua Mark Miller)
Tính năng mới trong phiên bản 4.6.0:
- Nhiều cải tiến và cải tiến cho các tùy chọn tách phân đoạn
- Phân tích MớiInfixLookupNhà máy để tận dụng AnalyzingInfixSuggester
- New CollapsingQParserPlugin cho trường hiệu suất cao bị thu hẹp trên các trường có tỷ lệ thẻ cao
- API SolrJ Mới để quản lý bộ sưu tập
- DocBasedVersionConstraintsProcessorFactory mới cung cấp hỗ trợ cho người dùng định cấu hình quy tắc phiên bản doc-centric
- Định dạng chỉ mục mặc định mới: Lucene46Codec
- Loại EnumField Mới
Tính năng mới trong phiên bản 4.5.1:
- Solr 4.5.1 chứa một số bản sửa lỗi, bao gồm 2 lỗi được coi là khá nghiêm trọng.
Tính năng mới trong phiên bản 4.5.0:
- Hỗ trợ sharding tùy chỉnh, định tuyến được cải thiện và tính năng vuốt đa luồng.
Tính năng mới trong phiên bản 4.2.0:
- API REST bên đọc cho lược đồ. Luôn luôn muốn xem xét sơ đồ trên http? Bây giờ bạn có thể. Có vẻ như bên viết sẽ xuất hiện tiếp theo.
- DocValues đã được tích hợp vào Solr. DocValues có thể được tải lên nhanh hơn rất nhiều so với bộ nhớ cache của trường và cũng có thể sử dụng các thuật toán nén khác nhau cũng như trong RAM hoặc trên các biểu diễn đĩa. Các truy vấn Faceting, sorting và function đều được hưởng lợi. Làm thế nào về việc xử lý hệ điều hành faceting và phân loại lưu trữ ra khỏi đống? Không điều chỉnh hơn 60 gigabyte đống? Làm thế nào về một phương pháp faceting DocValues mới mẻ cho mỗi phân đoạn? Cải thiện khía cạnh số? Ngọt ngào.
- Bí danh bộ sưu tập. Có dữ liệu dựa trên thời gian? Bạn muốn lập chỉ mục lại trong một bộ sưu tập tạm thời và sau đó hoán đổi nó vào sản xuất? Làm xong. Hãy theo dõi Shard Aliasing.
- Phản hồi API thu thập. API các bộ sưu tập vẫn còn rất mới trong 4.0, và trong khi nó được cải thiện một chút công bằng trong 4.1, phản ứng chắc chắn là cần thiết, nhưng bỏ lỡ việc cắt bỏ. Ban đầu, chúng tôi đã đưa ra quyết định khiến API Bộ sưu tập chịu lỗi siêu bền, điều này làm cho các phản hồi trở nên khó khăn hơn. Không ai muốn tìm kiếm thông qua các tệp nhật ký để xem mọi thứ diễn ra như thế nào. Thực hiện trong 4.2.
- Tương tác với bất kỳ bộ sưu tập nào trên bất kỳ nút nào. Cho đến 4.2, bạn chỉ có thể tương tác với một nút trong cụm của bạn nếu nó lưu trữ ít nhất một bản sao của bộ sưu tập mà bạn muốn truy vấn / cập nhật. Không còn truy vấn bất kỳ nút nào, cho dù nút đó có một phần bộ sưu tập dự định của bạn hay không và nhận được phản hồi proxy.
- Cho phép tên phân đoạn tùy chỉnh sao cho địa chỉ máy chủ mới có thể thay thế cho phân đoạn đã nghỉ hưu. Làm việc trên Amazon mà không có ips đàn hồi? Điều này là dành cho bạn.
- Tối ưu hóa Lucene 4.2 chẳng hạn như vectơ thuật ngữ được nén.
Tính năng mới trong phiên bản 3.3.0:
- Thu gọn Nhóm / Trường
- Triển khai đề xuất / tự động hoàn thành dựa trên tự động mới cung cấp thứ tự mức tiêu thụ RAM nhỏ hơn mức độ lớn.
- KStemFilterFactory, việc triển khai tối ưu hóa trình kích hoạt kém tích cực hơn cho tiếng Anh.
- Solr mặc định thành chính sách hợp nhất mới, hiệu quả hơn (TieredMergePolicy). Xem http://s.apache.org/merging để biết thêm thông tin.
- Các sửa lỗi quan trọng, bao gồm việc sử dụng RAM rất cao trong kiểm tra chính tả.
- Sửa lỗi và cải tiến từ Apache Lucene 3.3
Tính năng mới trong phiên bản 3.2.0:
- Khả năng chỉ định ghi đè và cam kếtTrong tham số yêu cầu khi sử dụng định dạng cập nhật JSON
- TermQParserPlugin, hữu ích khi tạo truy vấn bộ lọc từ các cụm từ được trả về từ trường faceting hoặc thành phần điều khoản.
- DebugComponent bây giờ hỗ trợ bằng cách sử dụng một NamedList để mô hình các đối tượng Giải thích trong các câu trả lời của nó thay vì Explanation.toString
- Các cải tiến đối với tích hợp UIMA và Carrot2
- Sửa lỗi và cải tiến từ Apache Lucene 3.2
Tính năng mới trong phiên bản 3.2.0:
- Cải tiến cập nhật JSON đã được thực hiện.
- Nhóm kết quả tìm kiếm và tích hợp UIMA đã được cải thiện.
- Lỗi đã được sửa.
Bình luận không