LanguageTool

Phần mềm chụp màn hình:
LanguageTool
Các chi tiết về phần mềm:
Phiên bản: 2.9 Cập nhật
Ngày tải lên: 14 Apr 15
Nhà phát triển: Daniel Naber
Giấy phép: Miễn phí
Phổ biến: 18

Rating: nan/5 (Total Votes: 0)

LanguageTool là một chương trình mã nguồn mở được thiết kế hiệu đính để tìm lỗi trong công cụ kiểm tra chính tả thông thường không thể phát hiện. Đó là một quy tắc dựa trên phong cách và kiểm tra ngữ pháp mà sẽ tìm thấy lỗi mà một quy tắc được định nghĩa trong file cấu hình XML của nó, chẳng hạn như trộn lên & ldquo; họ & rdquo; với & ldquo;. có & rdquo;


Phát hiện các vấn đề ngữ pháp khác nhau

Chương trình cũng có thể phát hiện các vấn đề ngữ pháp khác nhau và đi kèm với hỗ trợ hơn 20 ngôn ngữ, bao gồm tiếng Anh, Đức, Ba Lan, Pháp, Tây Ban Nha, Thụy Điển, Hy Lạp, Trung Quốc, Đan Mạch, Nhật Bản, Iceland, Bồ Đào Nha và Bồ Đào Nha.
Ngoài ra, nó tự hào có một giao diện người dùng đồ họa dễ sử dụng, đơn giản và dễ hiểu cho phép bất cứ ai để dán văn bản mà cần phải được kiểm tra chính tả. Nó có thể kiểm tra các văn bản trong clipboard, văn bản thẻ, cut / copy / dán văn bản, và cư trú trong khu vực khay hệ thống.


Phát hiện một loạt các vấn đề

Từ hộp thoại Options, bạn có thể cho phép loại của các vấn đề ứng dụng có thể phát hiện, bao gồm cả phong cách xấu, lỗi ngữ pháp, tiếng lóng, lỗi chấm câu, lỗi chính tả có thể, cụm dự phòng, thường từ bối rối, những cụm từ, viết hoa, ngữ nghĩa, cũng là cụm từ không chuẩn.


LanguageTool cho LibreOffice và OpenOffice

Bên cạnh đó là một ứng dụng độc lập, LanguageTool cũng có sẵn như là một phần mở rộng cho hai trong số các phần mềm văn phòng mã nguồn mở phổ biến nhất và mạnh mẽ, LibreOffice và Apache OpenOffice.org, cho phép người sử dụng để đọc lại văn bản của mình bằng cách nhấp chuột phải vào cụm từ được lựa chọn hoặc đoạn văn.


LanguageTool cho Mozilla Firefox

Ngoài ra, ứng dụng cũng có sẵn để tải về như là một add-on cho thế giới về lĩnh của trình duyệt web mã nguồn mở phổ biến nhất trên thế giới, Mozilla Firefox. Nó không yêu cầu phải khởi động lại và đặt một nút nhỏ trên thanh công cụ chính, cho phép bạn đọc lại văn bản được đánh dấu từ các trang web hoặc các hình thức.


Dưới mui xe và tính sẵn sàng

ứng dụng được viết hoàn toàn bằng ngôn ngữ lập trình Java, có nghĩa là nó & rsquo; sa phần mềm đa nền tảng, được thiết kế để làm việc với bất kỳ phân phối GNU / Linux, cũng như BSD, Solaris, Microsoft Windows và Mac OS X điều hành hệ thống, nơi Java Runtime Environment được cài đặt.

là gì mới trong phiên bản này:

  • Catalan:
  • POS cập nhật từ điển tag
  • thêm quy định mới
  • báo động giả cố định
  • Tiếng Anh:
  • Nhập một vài quy tắc và cố định một vài cảnh báo sai
  • Thêm nhiều quy tắc phong cách mới góp của Heikki Lehvaslaiho. Vì chúng có thể gây ra các báo động sai, họ không được kích hoạt theo mặc định. Bạn có thể kích hoạt chúng bằng cách bật tất cả các quy tắc trong hạng mục 'Plain English' mới.
  • Esperanto:
  • thêm một vài quy tắc mới
  • Pháp
  • POS cập nhật từ điển tag và Hunspell từ điển để Dicollecte-5.3
  • Đức:
  • bổ sung thêm một số quy định mới và báo động giả cố định
  • Thêm một quy tắc mới để kiểm tra các thỏa thuận chủ động từ. Đối với doanh nghiệp, các trường hợp có 'ist', 'sind', 'chiến tranh', và 'Waren' được hỗ trợ. Ví dụ cho các lỗi được phát hiện: ". Der Hund sind schA & para; n ',' Die Autos ist Schnell. ' Để thực hiện công việc quy định này, cụm từ được doanh nghiệp thống nhất trong disambiguation.xml: ví dụ, 'Mann' trong cụm từ 'Ein Mann' sẽ chỉ giữ lại đọc nó được bổ nhiệm (SUB: NOM: SIN: MAS), trong khi đó nó được sử dụng để có cũng đọc đối cách và tặng cách (SUB: AKK: SIN: MAS, SUB: DAT: SIN: MAS). (Https://github.com/languagetool-org/languagetool/issues/233)
  • Ý:
  • cải thiện một vài quy tắc
  • Ba Lan:
  • bổ sung một số quy định mới
  • Bồ Đào Nha:
  • tăng / cải thiện một số quy tắc
  • 3695 từ ghép (trước cải cách) - cơ sở dữ liệu miễn phí lớn nhất
  • Nga:
  • tăng và cải thiện các quy tắc
  • Ukraine:
  • lớn cập nhật từ điển
  • quy tắc ngữ pháp mới
  • đơn giản mới thay thế quy tắc cho các đề xuất mềm
  • cải tiến disambiguator
  • tagging hợp chất và chính tả cải tiến

  • Cải tiến
  • tắt gắn thẻ
  • câu và từ những cải tiến tokenizing
  • cải tiến quản lý của stres biểu tượng và dấu nối mềm
  • quy tắc Bitext:
  • thêm một quy tắc đơn giản để kiểm tra xem liệu bản dịch kết thúc với dấu chấm câu giống như bản gốc (bao gồm các chỉ.?! Ký tự).
  • bây giờ có thể để thêm tập tin quy tắc bitext bên ngoài trên dòng lệnh, bằng cách sử dụng
  • tùy chọn -bitextrule. Đường dẫn tập tin phải là tuyệt đối. Lưu ý:. Này cho phép sử dụng quy tắc bitext cũng cho ngôn ngữ mà không có quy tắc bitext bao gồm theo mặc định
  • Spelling:
  • Các tập tin mới tại /hunspell/spelling.txt có thể được sử dụng để thêm các từ được chấp nhận để kiểm tra chính tả mà cũng được xem xét khi tạo ra các đề xuất từ ​​sai. Điều này cũng tương tự như các tập tin /hunspell/ignore.txt, mà danh sách chấp nhận lời được * không * được sử dụng khi tạo ra các đề xuất từ ​​sai.
  • API:
  • JLanguageTool.activateDefaultPatternRules () và JLanguageTool.activateDefaultFalseFriendRules () đã được gỡ bỏ - tất cả các quy tắc mô hình và quy tắc bạn sai (nếu một ngôn ngữ thứ hai được chỉ định) bây giờ sẽ được kích hoạt tự động khi các nhà xây dựng của JLanguageTool được gọi. Nếu bạn cần một kiểm tra mà không có các quy tắc mô hình dựa trên XML, mở rộng lớp ngôn ngữ của bạn (ví dụ: 'Anh') với một trong đó sẽ ghi đè lên các getPatternRules () và trả về một danh sách rỗng đó.
  • ManualTagger.lookup () đã được thay thế bởi ManualTagger.tag () sau khi bị phản đối kể từ khi phiên bản mới nhất
  • Tất cả các phương pháp tĩnh và các lĩnh vực từ lớp 'Ngôn ngữ' đã được chuyển đến lớp mới 'Ngôn ngữ'. Đối với doanh nghiệp, các phương pháp / lĩnh vực trong lớp ngôn ngữ vẫn còn tồn tại nhưng đã bị phản đối.
  • LanguageIdentifierTools đã được gỡ bỏ. Sử dụng LanguageIdentifier thay vì
  • .
  • xóa (Default) ResourceDataBroker.setResourceDir () và setRulesDir () vì chúng có thể được thiết lập với các nhà xây dựng
  • Làm sạch lên lớp Contributor, ví dụ loại bỏ getRemark ()
  • Category.setDefaultOff () đã được gỡ bỏ, điều này có thể được thiết lập thông qua constructor bây giờ
  • Đổi tên lớp: o.lt.rules.patterns.Element = & gt; o.lt.rules.patterns.PatternToken o.lt.rules.patterns.ElementMatcher = & gt; o.lt.rules.patterns.PatternTokenMatcher
  • dọn API nhỏ khác mà không ảnh hưởng đến các trường hợp sử dụng phổ biến, ví dụ như IncorrectExample.getCorrections () trả về và danh sách unmodifiable bây giờ, loại bỏ các phương pháp phản đối.
  • máy chủ nhúng:
  • XML escaping đã được cố định, điều này có thể gây ra các tài liệu XML hợp lệ để được trả lại
  • mới tùy chọn tập tin config 'maxWorkQueueSize' cho phép bạn thiết lập kích thước tối đa của hàng đợi yêu cầu - nếu nó được lớn hơn này, yêu cầu sẽ bị từ chối (503 Dịch vụ không sẵn)
  • Các máy chủ doanh nghiệp trả lời với mã trạng thái HTTP cụ thể hơn đối với các điều kiện lỗi: 413 Request Entity Too Large - nếu văn bản vượt quá kích thước văn bản tối đa 503 Service Unavailable - nếu kiểm tra vượt quá thời gian kiểm tra tối đa
  • GUI:
  • Các giao diện độc lập bây giờ có thể có một tập tin văn bản đơn giản như một tham số, tập tin này sau đó sẽ được nạp khi khởi động (Github vấn đề # 232).
  • Command-line:
  • Bây giờ có thể để thêm một tập tin quy tắc bên ngoài khi gọi LanguageTool từ dòng lệnh. Sử dụng --rulefile để thêm một tập tin. Nếu tên tập tin có định dạng có chứa một tên ngôn ngữ, nó sẽ được sử dụng cùng với các quy định khác; nếu không, nó sẽ thay thế các quy tắc. Bạn cũng có thể tải một tập tin bên ngoài với bạn bè bằng cách sử dụng sai các --falsefriends tùy chọn. Tên tập tin phải là một đường dẫn tập tin tuyệt đối, và các tập tin bạn sai luôn thêm vào những cái mà được nạp cho ngôn ngữ. (Github vấn đề # 192)
  • cú pháp Rule:
  • bây giờ Một nguyên tắc có thể có một câu ví dụ duy nhất miễn là nó có một 'chỉnh' thuộc tính - điều này có thể tiết kiệm một số dự phòng nếu các câu đúng chỉ là giống như câu không đúng với sự điều chỉnh áp dụng. Trước đây, một quy tắc cần thiết ít nhất hai câu ví dụ.
  • 'dụ' yếu tố: type = "không chính xác" bây giờ là tùy chọn nếu có một 'chỉnh' thuộc tính. Các 'chỉnh' thuộc tính ngụ ý rằng bản án là không chính xác.
  • 'dụ' yếu tố: type = "đúng" là doanh nghiệp tùy chọn. Không 'loại' thuộc tính và không có 'điều chỉnh' thuộc tính ngụ ý rằng bản án là đúng.
  • nội bộ:
  • Chúng tôi đã chuyển từ Apache Tika để ngôn ngữ dò (https://github.com/optimaize/language-detector) để tự động nhận diện ngôn ngữ văn bản. Nó cần được nhanh hơn và kết quả nên đáng tin cậy hơn. Phát hiện Asturian và Galicia đã bị vô hiệu vì chất lượng phát hiện là quá thấp và cũng ảnh hưởng đến phát hiện của Tây Ban Nha.
  • Cố định một hồi quy mà làm cho nó không thể tải tập tin quy tắc bên ngoài trong GUI.

là gì mới trong phiên bản 2.8:

  • Asturian:
  • phụ thuộc vào loại bỏ Hunspell, bây giờ sử dụng Morfologik cho kiểm tra chính tả
  • Breton:
  • tăng và cải thiện một số quy tắc
  • Catalan:
  • Từ điển cập nhật
  • tăng và cải thiện các quy tắc
  • báo động giả cố định
  • Hà Lan:
  • bổ sung và cải thiện nhiều quy tắc
  • Tiếng Anh:
  • một số quy định mới (nhờ Nick Hough)
  • cập nhật các tagger và tổng hợp bộ từ điển, sửa chữa vấn đề # 202
  • bộ lọc mới để được sử dụng cho phù hợp với các partofspeech của các phần của từ, ví dụ như:. Trong * Điều này sẽ chỉ giữ cho các trận đấu từ bắt đầu bằng 'trong' và nơi mà các phần sau khi 'trong' là một tính từ (thẻ POS "JJ"). Các 'no: 1' là vị trí token, tức là ở đây
  • đầu tiên (và duy nhất) kết hợp được gọi.
  • Pháp:
  • tăng và cải thiện một số quy tắc
  • Đức:
  • tăng và cải thiện một số quy tắc
  • Ba Lan:
  • tăng và cải thiện một số quy tắc
  • tăng và cải thiện những người bạn giả với Anh
  • Bồ Đào Nha:
  • tăng / cải thiện một số quy tắc
  • Tây Ban Nha:
  • phụ thuộc vào loại bỏ Hunspell, bây giờ sử dụng Morfologik cho kiểm tra chính tả
  • định dạng lại các quy tắc tập tin
  • Thêm nhiều quy tắc
  • Tagalog:
  • phụ thuộc vào loại bỏ Hunspell, bây giờ sử dụng Morfologik cho kiểm tra chính tả
  • nhân vật dấu gạch ngang ("") là một dấu phân cách bây giờ khi tokenizing văn bản
  • Nga:
  • tăng và cải thiện các quy tắc
  • bổ sung thêm một số quy tắc bạn sai (Nga / tiếng Anh)
  • Ukraine:
  • nhiều quy định mới (bao gồm cả thỏa thuận với các danh từ, biểu thời gian vv)
  • cải thiện vùng phủ sóng quy tắc
  • Cập nhật từ điển (cải tiến lớn cho danh từ riêng và trường hợp xưng hô)
  • tag mới và cai trị để cảnh báo về cách viết khác
  • Thông tin về tần số từ được thêm vào để cải thiện các đề xuất chính tả
  • một số quy tắc disambiguator mới
  • Rule Cú pháp:
  • ... bây giờ có thể được thêm vào một rulegroup ảnh hưởng đến tất cả các quy tắc của nhóm
  • Nếu bạn phát triển các quy tắc của riêng bạn mà không phải là một phần của LT bây giờ bạn có thể thêm bên ngoài = "yes" để loại của bạn để ngăn chặn sự liên kết quy tắc để community.languagetool.org xuất hiện trong giao diện độc lập của chúng tôi (liên kết sẽ không làm việc cho các quy tắc mà không phải là một phần của phân phối chính của LT). (Github vấn đề # 223)
  • Nếu một nhóm quy tắc xác định mặc định = "off", các quy tắc bên trong các nhóm quy tắc có thể không còn chỉ định mặc định = "on" / "off"
  • .
  • API:
  • lớp Removed và phương pháp đó đã bị phản đối từ 2.7 trở lên
  • máy chủ nhúng:
  • Các tùy chọn tập tin config 'requestLimit' và 'requestLimitPeriodInSeconds' có thể cũng được sử dụng cho các máy chủ HTTP (không chỉ cho các máy chủ HTTPS)
  • Lựa chọn mới file config 'trustXForwardForHeader': thiết lập này để 'true' nếu bạn chạy các máy chủ phía sau một proxy ngược lại và muốn giới hạn yêu cầu để làm việc trên các địa chỉ IP gốc được cung cấp bởi các tiêu đề 'Xforwardedfor' HTTP, thường được thiết lập bởi các proxy. Nếu bạn chạy đằng sau một proxy nhưng không đặt khách sạn này là đúng sự thật, một người dùng có thể sử dụng tất cả các yêu cầu để người dùng khác cũng sẽ nhận được một thông báo lỗi vì hạn yêu cầu.
  • Fix phản ứng của Sau khi chế độ Hạn chót: ... đôi khi trống rỗng, gây nhầm lẫn việc kiểm tra văn bản trong WordPress
  • quy tắc Bitext đã không vô hiệu hóa đúng cách, ngay cả khi họ đã được xác định với một tham số thích hợp cho các máy chủ; bây giờ nó cố định
  • Cố định vấn đề với vị trí không thích hợp đối với một số quy tắc bitext (vấn đề # 218)
  • GUI:
  • Một thiết lập 'errorColors' mới đã được thêm vào tập tin cấu hình languagetool.cfg. Nó có thể được sử dụng để thiết lập màu nền của lỗi. Ví dụ, errorColors = đánh máy: # b8b8ff, phong cách: # ffb8b8 sẽ hiển thị lỗi "đánh máy" với một nền màu xanh và lỗi "phong cách" với một nền màu đỏ ở phần trên của cửa sổ LT. 'Đánh máy "và" phong cách "là những loại được thiết lập trong grammar.xml là" type = ... ". Không có giao diện người dùng nào để cấu hình các màu sắc. Lưu ý rằng bạn chỉ nên chỉnh sửa các tập tin languagetool.cfg khi LT không chạy.
  • nội bộ:
  • Sửa lỗi: các quy tắc trong một nhóm quy tắc đã không được kích hoạt nếu một quy luật trước đó từ rulegroup cùng được sử dụng mặc định = "off"
  • Từ ngữ không được bỏ qua nữa bởi các kiểm tra chính tả chỉ vì chúng xảy ra trong gợi ý của một quy tắc. Nếu bạn muốn kiểm tra chính tả để bỏ qua các từ toàn cầu, thêm chúng vào Hunspell / ignore.txt. Để bỏ qua họ tùy thuộc vào bối cảnh, thêm một 'ignore_spelling' quy tắc để disambiguation.xml.
  • Một tập tin 'Hunspell / prohibit.txt' bây giờ có thể được sử dụng để đánh dấu các từ như lỗi chính tả ngay cả khi kiểm tra chính tả thông thường sẽ chấp nhận chúng. Điều này rất hữu ích để cải thiện LanguageTool kiểm tra chính tả mà không cần chờ đợi cho các checker thượng nguồn để được cập nhật. Các 'prohibit.txt' file là đối diện của 'ignore.txt', mà nguyên nhân của kiểm tra chính tả để bỏ qua lời nói.
  • Các tagger partofspeech cho hầu hết các ngôn ngữ bây giờ có thể được mở rộng bằng cách thêm các entry vào file org / languagetool / tài nguyên / XX / added.txt (XX là mã ngôn ngữ). Các định dạng là "fullform baseform postag", ba cột cách nhau bằng tab. Điều này làm cho nó dễ dàng hơn cho người sử dụng (và phát triển) để mở rộng các tagger POS, vì họ không cần phải xuất khẩu, chỉnh sửa, và tạo lại từ điển nhị phân cho mỗi thay đổi.

là gì mới trong phiên bản 2.7:

  • Breton:
  • tăng và cải thiện các quy tắc
  • New rule để kiểm tra nếu một ngày trong tuần phù hợp với một ngày, ví dụ như phát hiện "Gwener 28 một Eost viz 2014", như ngày đó không phải là ngày thứ sáu.
  • Catalan:
  • tăng và cải thiện các quy tắc
  • báo động giả cố định
  • Hà Lan:
  • bổ sung và cải thiện nhiều quy tắc
  • chuyển sang Morfologik dựa trên kiểm tra chính tả
  • -Tiếng Anh:
  • Bạn có muốn là một phần của nhóm phát triển công cụ soát lỗi mã nguồn mở mạnh mẽ nhất thế giới? Chúng tôi đang tìm kiếm một nhà bảo trì cho các quy tắc tiếng Anh tại LanguageTool. Xem http://wiki.languagetool.org/tasks-for-language-maintainers để biết chi tiết.
  • Tất cả các từ điển tiếng Anh đã được mở rộng để chứa các lớp học tần số từ để cải thiện những đề nghị kiểm tra chính tả (các tần số dữ liệu được lấy từ https://github.com/mozilla-b2g/gaia/tree/master/apps/keyboard/js / imes / Latin / từ điển, như đối với các ngôn ngữ khác mà đã sử dụng tính năng này).
  • gợi ý tốt hơn cho người học tiếng Anh: Động từ bất quy tắc, danh từ, tính từ bây giờ thường có một đề nghị tốt hơn. Ví dụ, 'thinked' gợi ý 'nghĩ', 'womans' gợi ý 'phụ nữ'.
  • More lỗi chính tả cấp các đề xuất hiện nay, ví dụ như 'Garentee' (bảo lãnh), "biết ơn" (cảm ơn). Điều này có thể làm giảm hiệu suất của ~ 10% (hơn cho văn bản với rất nhiều từ chưa biết).
  • New rule để kiểm tra nếu một ngày trong tuần phù hợp với một ngày, ví dụ như phát hiện "Thứ Hai 7 tháng 10, 2014", như ngày đó không phải là một thứ hai. Quy tắc này sẽ chỉ làm việc nếu nó phát hiện định dạng ngày trong sử dụng. Cho đến nay, các định dạng được hỗ trợ: * "thứ hai 7 tháng 10, năm 2014" * "thứ hai 7 tháng 10, năm 2014" * "Thứ Hai 7 tháng 10, 2014" * "thứ hai 7 tháng 10, năm 2014" * (điều này cũng làm việc với tuần viết tắt ngày như Mo hoặc Mon cho thứ Hai)
  • Esperanto:
  • New rule để kiểm tra nếu một ngày trong tuần phù hợp với một ngày, ví dụ như phát hiện "Vendredon la 28-an de AAgusto 2014", như ngày đó không phải là ngày thứ sáu.
  • Pháp:
  • POS cập nhật từ điển tag và Hunspell từ điển để Dicollecte-5.2
  • thêm vào một tổng hợp - quy tắc thỏa thuận với doanh nghiệp có thể đưa ra đề nghị cho một số lỗi
  • tăng / cải thiện một số quy tắc
  • New rule để kiểm tra nếu một ngày trong tuần phù hợp với một ngày, ví dụ như phát hiện "Vendredi 28/08/2014", như ngày đó không phải là ngày thứ sáu.
  • Đức:
  • Cố định một NullPointerException hiếm và một ArrayIndexOutOfBoundsException
  • Cố định một số báo động sai
  • gia tăng và cải thiện các quy tắc
  • New rule để kiểm tra các câu mà không có một động từ (tắt theo mặc định do nguy cơ báo động sai)
  • New rule để kiểm tra nếu một ngày trong tuần phù hợp với một ngày, ví dụ như phát hiện "Dienstag, 2014/09/29", như ngày đó không phải là một ngày thứ Ba.
  • Hiệu suất cải tiến cho các đề xuất kiểm tra chính tả
  • Ba Tư:
  • thêm hỗ trợ ban đầu cho Ba Tư (Farsi)
  • Ba Lan:
  • tăng và cải thiện một số quy tắc
  • quy tắc mới để kiểm tra nếu một ngày trong tuần phù hợp với một ngày
  • Bồ Đào Nha:
  • tăng / cải thiện một số quy tắc
  • thêm nhiều chục từ ghép
  • Nga:
  • thêm quy định mới
  • sửa chữa SourceForge yêu cầu tính năng # 38 (kiểm tra các dấu ngoặc kép khác nhau)
  • bổ sung thêm một số quy tắc bạn sai (Nga / tiếng Anh)
  • quy tắc mới để kiểm tra nếu một ngày trong tuần phù hợp với một ngày, ví dụ như Phát hiện "ÐонеÐ'еÐ"NŒÐ½Ð¸Ðº, 30 N ?? & ETH; & micro; & ETH; & frac12; N & sbquo; N ?? & ETH; & plusmn; N & euro; N ?? 2014 & ETH; & sup3 ;. ", như ngày đó không phải là một thứ hai
  • .
  • mở rộng quy tắc hợp chất của Nga với các từ mới từ điển postag
  • Tây Ban Nha:
  • Thêm mới loại POS Z (cho số đánh vần, ví dụ như 'uno', 'dos', ...)
  • số đánh vần bây giờ có thể được phát hiện và quản lý cả về định hướng và quy định.
  • Sửa một số bổ đề không chính xác trong từ điển POS.
  • Tương lai chunker-disambiguator.
  • Tamil:
  • Thêm hỗ trợ ban đầu cho Tamil. Nếu font chữ cho Tamil không được hiển thị đúng trên máy tính của bạn và bạn đang sử dụng Windows, bạn có thể cần phải áp dụng các công trình xung quanh mô tả ở đây: https://bugs.openjdk.java.net/browse/JDK-8008572
  • Ukraine:
  • bản cập nhật lớn cho từ điển POS (bản sửa lỗi và từ mới)
  • số thẻ POS đổi tên cho nhất quán; thẻ mới cho chữ viết tắt và từ hiếm
  • nhiều quy định mới và sửa chữa cho các quy định hiện hành
  • quy tắc mới để kiểm tra nếu một ngày trong tuần phù hợp với một ngày, ví dụ như phát hiện "& ETH; & ETH; & frac34; & ETH; & frac12; & ETH; & micro; & ETH; 'N & ETH;" & ETH; & frac34; & ETH; & ordm ;, 7 & ETH; & para; & ETH; & frac34; & ETH; & sup2; 2014 ", như ngày đó không phải là một thứ hai
  • thẻ cải thiện hiệu suất bình thường
  • hội nhập LibreOffice:
  • Đừng lẫn lộn bởi chú thích trong LibreOffice 4.3 và sau đó (nó hiện nay cung cấp cho chúng tôi với các vị trí chú thích như là dữ liệu meta, vì vậy chúng tôi có thể bỏ qua chúng).
  • API:
  • cải tiến hiệu suất lớn cho các trường hợp sử dụng multi-thread, nơi JLanguageTool được tạo ra cho mỗi thread, nhưng đối tượng ngôn ngữ (ví dụ: 'Đức') được tạo ra chỉ một lần. Máy chiếu hắt để tạo JLanguageTool bây giờ sẽ thấp hơn nhiều.
  • Gỡ bỏ một số lớp học và phương pháp đó đã bị phản đối kể từ phiên bản 2.6
  • DutchSpellerRule Removed - sử dụng MorfologikDutchSpellerRule thay vì
  • Chữ ký của Language.getRelevantRules () đã thay đổi
  • Các JLanguageTool và MultiThreadedJLanguageTool nhà xây dựng không khai báo để ném một IOException nữa
  • WhitespaceRule đã được đổi tên thành MultipleWhitespaceRule (WhitespaceRule vẫn còn tồn tại nhưng đã bị phản đối)
  • tán thành một số phương pháp có khả năng hiển thị sẽ được giảm (ví dụ từ công chúng để bảo vệ)
  • MorfologikSpellerRule.getRuleMatch (String, int) đã được đổi tên thành MorfologikSpellerRule.getRuleMatches (String, int)
  • Các constructor RuleMatch giờ ném một ngoại lệ nếu toPosition là không lớn hơn fromPosition
  • Giới thiệu một trừu tượng TextLevelRule lớp mới kéo dài Rule và có thể được sử dụng cho các quy tắc đó bao gồm hơn câu duy nhất.
  • dòng Command:
  • Kích hoạt và vô hiệu hóa các quy định cụ thể tại cùng một thời điểm doanh nghiệp được phép. Để kiểm tra chỉ có một số quy tắc (vô hiệu hóa tất cả các phần còn lại), mà trước đó đã được thực hiện với "LIST_OF_RULES --enable", bây giờ sử dụng "LIST_OF_RULES --enabledonly --enable" (hoặc "-eo -e LIST_OF_RULES").
  • máy chủ nhúng:
  • Hai lựa chọn mới có thể được thiết lập trong các thuộc tính tập tin để làm cho LanguageTool trở về định dạng XML như Sau Deadline (ATD). Bằng cách này, nó có thể được sử dụng như một thả thay thế cho ATD: * Chế độ - 'LanguageTool' hoặc 'AfterTheDeadline' * afterTheDeadlineLanguage - mã của ngôn ngữ mặc định, nếu chế độ được thiết lập để 'AfterTheDeadline' Chú ý: các chế độ 'AfterTheDeadline' cần được xem xét thử nghiệm cho doanh nghiệp.
  • Các tùy chọn mới 'maxCheckThreads' cho phép thiết lập số lượng tối đa của đề tài làm việc trên yêu cầu song song. Giá trị mặc định là 10, vì nó được sử dụng để được.
  • Internals:
  • New trừu tượng tắc AbstractDateCheckFilter cho phép để kiểm tra nếu một ngày trong tuần và ngày trận đấu. Ví dụ "Thứ 3 29 Tháng Chín, 2014" có thể được phát hiện, như 29 tháng 9 năm 2014 là không thực sự là một thứ ba. Này sử dụng giao diện RuleFilter thử nghiệm mới có thể được gọi từ XML với 'lọc' tố mới. 'Lọc' mất các thuộc tính: 'lớp': tên đầy đủ của một lớp Java mà thực hiện RuleFilter, ví dụ: "Org.languagetool.rules.de.DateCheckFilter" 'args': một chuỗi như "năm: 1 tháng: 2 ngày: 3 ngày trong tuần: 4", tức là một danh sách không gian tách các cặp khóa / giá trị, trong đó x được giải quyết để giá trị thẻ của mô hình (như trong 'thông báo' phần tử)
  • Các quy tắc hợp doanh nghiệp bỏ qua các thẻ đổi đã được chủng ngừa trong disambiguation.xml
  • Các "bộ lọc" hành động trong các disambiguator hiện nay chỉ áp dụng cho thẻ POS phù hợp với thẻ POS nhất định. Nếu họ không phù hợp, các quy tắc không được áp dụng.
  • Nếu bạn đang mở rộng quy tắc XML như mô tả ở http://wiki.languagetool.org/tips-and-tricks#toc2, nguyên tắc và định hướng tập tin bên ngoài bây giờ có thể được lưu trữ trên một máy chủ bảo vệ mật khẩu bằng cách xác định một URL như sau: http: // user: password@example.org/path/user-rules.xml
  • Các gạch đầu dòng ("a & euro;" ") bây giờ là một nhân vật tokenizing cho tất cả các ngôn ngữ
  • Tính năng mới:
  • Sử dụng các mô hình ngôn ngữ
  • LanguageTool bây giờ có thể sử dụng các dữ liệu ngram. ngram dữ liệu thông tin về mức độ thường xuyên xảy ra các cụm từ trong một ngôn ngữ. Hiện nay, điều này sử dụng các cụm từ có độ dài 3.
  • Các dữ liệu được sử dụng bởi một quy tắc tiếng Anh để tìm lỗi đồng âm, giống như pha lập công thô / khóa học hoặc flair / flare. LanguageTool đã có một số quy tắc của loại hình này trước đây, nhưng các quy tắc mới bây giờ hỗ trợ khoảng 900 như vậy từ cặp / bộ.
  • Các dữ liệu cần thiết cho việc này là rất lớn (7GB cho tiếng Anh) và do đó không phải là một phần hoặc LanguageTool.
  • Các dữ liệu (tiếng Anh chỉ cho bây giờ) và tài liệu nhiều hơn là có sẵn tại http://wiki.languagetool.org/finding-errors-using-big-data
  • Sử dụng ngrams làm LanguageTool hơi chậm khi dữ liệu được lưu trữ trên một ổ SSD
  • .
  • Nếu không được lưu trữ trên một ổ SSD, hiệu suất có thể giảm đáng kể.
  • Sử dụng tùy chọn --languagemodel mới với các khách hàng dòng lệnh để kích hoạt các quy tắc sử dụng các dữ liệu. Tùy chọn đó là chưa có sẵn cho các giao diện độc lập.

là gì mới trong phiên bản 2.4.1:

  • Cập nhật thư viện Morfologik để 1.8.3 để sửa chữa các đề xuất chậm trong kiểm tra chính tả, mà ảnh hưởng đến ít nhất là en-US

là gì mới trong phiên bản 2.4:

  • Breton:
  • SRX câu tokenization
  • tăng / cải thiện một vài quy tắc
  • cố định một số báo động sai
  • cố định các đề xuất không chính xác nhờ vào xét nghiệm thêm về cải chính trên
  • Catalan:
  • tăng / cải thiện một số quy tắc
  • báo động giả cố định
  • bổ sung được thực hiện và sửa lỗi cho các từ điển tagger
  • gỡ bỏ một số từ ngữ từ điển tổng hợp (xem filterarchaic.txt)
  • tăng tần số dữ liệu vào từ điển tagger; tần số danh sách từ xuất phát từ các dự án Gaia, với Apache License, phiên bản 2.0 (https://github.com/mozillab2g/gaia/tree/master/keyboard/dictionaries).
  • Tiếng Anh:
  • tăng / cải thiện một vài quy tắc
  • cố định một số báo động sai
  • Pháp:
  • tăng / cải thiện một số quy tắc
  • cố định một số báo động sai
  • Đức:
  • tăng / cải thiện một số quy tắc
  • thêm vào một tổng hợp các nguyên tắc thỏa thuận với doanh nghiệp có thể đưa ra đề nghị cho một số lỗi (không phải tất cả các đề xuất là chính xác, mặc dù)
  • Ba Lan:
  • tăng / cải thiện một số quy tắc, đặc biệt là đối với dấu gạch ngang và sử dụng dấu gạch ngang
  • thêm thông tin tần số cho từ điển kiểm tra chính tả; tần số danh sách từ xuất phát từ các dự án Gaia, với Apache License, phiên bản 2.0 (https://github.com/mozillab2g/gaia/tree/master/keyboard/dictionaries).
  • cố định một số báo động sai
  • Bồ Đào Nha:
  • tăng / cải thiện một số quy tắc (nó hiện nay bao gồm các quy định giới tính "a" / "o")
  • nó bây giờ có 3400+ từ ghép
  • tập tin JAR đã được đổi tên thành languagetool.jar, từ trước đây languagetoolstandalone.jar để tránh nhầm lẫn về những gì 'độc' có nghĩa là trong bối cảnh này (github vấn đề # 29)
  • cho các ngôn ngữ với nhiều quy định (như Pháp hay Đức) thực hiện trên văn bản dài đã được tăng lên khoảng 2030%
  • sửa chữa cho threadsafety (có thể gây treo trong MultiWordChunker)
  • cố định một lỗi nơi các chú thích đoạn đã không được thử nghiệm trong nhóm
  • fix: 1 và đã không được đánh giá trong ...
  • cố định một lỗi trong cơ chế thống nhất rằng loại bỏ một số giải thích hợp sớm
  • thêm hỗ trợ cho các chú thích đoạn trong disambiguator, và cố định một lỗi trong thẻ lọc với các chú thích đoạn
  • cập nhật thư viện Morfologik đến 1.8.2 (sửa lỗi, kiểm tra sự tỉnh táo của đầu vào chặt chẽ hơn, thêm dữ liệu tần số tới các từ điển)
  • thêm các tùy chọn bao gồm dữ liệu tần số để taggging hay đánh vần các từ điển. Các định dạng mong đợi của các wordlists tần số là một trong những dự án Gaia, với Apache License, phiên bản 2.0 (https://github.com/mozillab2g/gaia/tree/master/keyboard/dictionaries)
  • công cụ dòng lệnh mới để xuất khẩu và tạo từ điển nhị phân:
  • org.languagetool.dev.DictionaryExporter
  • org.languagetool.dev.POSDictionaryBuilder
  • LibreOffice / OpenOffice tích hợp:
  • tăng một cách giải quyết cho nhận đúng câu cho các trường hợp đó một chú thích xuất hiện sau một câu đầy đủ stop (Sourceforge lỗi # 191)
  • GUI độc:
  • Hộp thoại mở ra bởi các "More ..." mục trong menu ngữ cảnh của một lỗi lúc này cũng sẽ hiển thị chính xác và không chính xác câu ví dụ
  • API:
  • SentenceTokenizer bây giờ là một giao diện, việc thực hiện đã được chuyển đến RegexSentenceTokenizer, nhưng điều này bị phản đối và SRXSentenceTokenizer nên được sử dụng thay thế
  • Một số phương pháp từ org.languagetool.tools.StringTools đã được chuyển đến lớp org.languagetool.gui.Tools trong dự án languagetoolguicommons
  • LanguageToolListener.languageToolEventOccured () đã được đổi tên thành LanguageToolListener.languageToolEventOccurred ()
  • org.languagetool.tools.SymbolLocator không được công khai nữa (không ảnh hưởng đến bất cứ ai)
  • xóa DanishSentenceTokenizer đó đã bị phản đối trong ba năm
  • Rule.getCorrectExamples () và Rule.getIncorrectExamples () không trả về null nữa mà là một danh sách rỗng nếu không có ví dụ. Do đó, setCorrectExamples () và setIncorrectExamples () không chấp nhận vô nữa.
  • Rule.getId () có thể trả lại bất kỳ chuỗi bây giờ, không chỉ ASCIIonly dây (thực ra đây là trường hợp trước đây, như những hạn chế ASCIIonly không bao giờ được thi hành và chỉ được đề cập trong javadoc)
  • languagetoolwikipedia: các tùy chọn dòng lệnh để kiểm tra một bãi chứa Wikipedia đã được đơn giản hóa. Các lệnh có thể được gọi là như thế này: java jar languagetoolwikipedia.jar checkdata l en f enwiki20130621pagesarticles.xml Gọi chỉ "java jar languagetoolwikipedia.jar checkdata" để có được một thông điệp sử dụng. Hơn một tập tin có thể được xác định với các tùy chọn f. Ngoài ra để bãi XML Wikipedia, các tập tin CSV từ Tatoeba (http://tatoeba.org) bây giờ cũng được hỗ trợ, họ cần phải được lọc đầu tiên chỉ chứa các ngôn ngữ có liên quan.

là gì mới trong phiên bản 2.3:

  • Breton:
  • tăng / cải thiện một vài quy tắc
  • báo động giả cố định
  • cập nhật từ điển POS từ Apertium (svn r47282)
  • Catalan:
  • thêm hỗ trợ cho mã ngôn ngữ ca-ES-valencia (Catalan Valencia), được sử dụng trong LibreOffice 4.2.0
  • thêm một thay thế quy tắc đơn giản với hàng trăm lời đề nghị thay thế
  • tăng / cải thiện một số quy tắc
  • báo động giả cố định
  • Trung Quốc:
  • thêm một việc cho một StringIndexOutOfBoundsException (http://sourceforge.net/p/languagetool/bugs/186/)
  • Tiếng Anh:
  • thêm vào mô hình thay thế cho kiểm tra chính tả để đưa ra đề nghị tốt hơn (hiện nay cung cấp 'dạy' cho 'teached')
  • tăng / cải thiện một vài quy tắc
  • Pháp:
  • tăng / cải thiện một vài quy tắc
  • báo động giả cố định
  • POS cập nhật từ điển tag và Hunspell từ điển để Dicollecte-4.12
  • Đức:
  • tăng / cải thiện một số quy tắc
  • Bồ Đào Nha:
  • tăng / cải thiện một vài quy tắc
  • nó bây giờ có 3300+ từ ghép
  • Ukraine:
  • tăng / cải thiện một số quy tắc
  • mã nguồn đã được chuyển đến github: https://github.com/languagetool-org/languagetool
  • LanguageTool yêu cầu Java 7 bây giờ
  • LanguageTool làm cho việc sử dụng nhiều chủ đề bây giờ cho văn bản kiểm tra trên phần cứng hiện đại, cải thiện hiệu suất (điều này ảnh hưởng đến các phiên bản độc lập, các phiên bản dòng lệnh và các phần mở rộng LibreOffice / OpenOffice)
  • cú pháp Rule:
  • hỗ trợ sơ bộ cho các thuộc tính min / max mới cho phép để phù hợp với một yếu tố mà dường như số lượng nhất định của thời gian. Ví dụ: foo sẽ phù hợp hoặc không có gì "foo", tức là "foo" là tùy chọn foo sẽ phù hợp "foo" hoặc "foo foo" foo sẽ phù hợp với không có gì, "foo", hoặc "foo foo" Sử dụng max = "- 1" để cho phép xuất hiện không giới hạn. Đối với min, chỉ 0 hoặc 1 được hỗ trợ (1 là mặc định).
  • hỗ trợ cho OR-báo cáo. Ví dụ: một nội và trong thời gian chạy, một quy tắc chứa OR-báo cáo được chuyển đổi thành một số quy tắc mà không OR-báo cáo
  • .
  • Tiếng Anh bây giờ có một chunker để phát hiện, trong số những người khác, những phần danh từ số ít và số nhiều. Đây là tài liệu tại http://wiki.languagetool.org/using-chunks
  • phiên bản độc lập:
  • Các phiên bản độc lập với doanh nghiệp nhấn mạnh lỗi với một màu đỏ (lỗi chính tả) hoặc màu xanh (lỗi khác) dòng (Panagiotis Minos)
  • Hãy nhớ rằng các lựa chọn ngôn ngữ để bắt đầu tiếp theo
  • Cải thiện vị trí cửa sổ và hộp thoại trong một thiết lập đa màn hình
  • máy chủ nhúng: sử dụng cổng mặc định (8081) một lần nữa nếu bắt đầu mà không có đối số
  • cập nhật các morfologik-bắt nguồn thư viện với phiên bản 1.7.1 cho phép gợi ý tốt hơn, bao gồm cả xử lý đúng đắn các dấu và các mẫu thay thế (tương đương của MAP và REP tính năng trong các từ điển hunspell)
  • OpenOffice tích hợp / LibreOffice:
  • fix: "Giới thiệu về" hộp thoại không làm việc trong Apache OpenOffice 4.0
  • sửa chữa: các quy tắc quốc gia cụ thể (như cho British English) không làm việc
  • API:
  • Trong lớp học ngôn ngữ, getCountryVariants () đã được đổi tên thành getCountries (), và một phương pháp getVariant mới đã được thêm vào.
  • Một số phương pháp đã được tán
  • Một số phương pháp đã được di chuyển từ Tools lớp (languagetool-core) với lớp CommandLineTools mới (languagetool-commandline)










là gì mới trong phiên bản 2.2:



là gì mới trong phiên bản 2.1:





là gì mới trong phiên bản 2.0:







Yêu cầu :



Phần mềm khác của nhà phát triển Daniel Naber

Jwordsplitter
Jwordsplitter

21 Jan 15

LanguageTool
LanguageTool

21 Jan 15

Ý kiến ​​để LanguageTool

Bình luận không
Nhập bình luận
Bật hình ảnh!