LanguageTool

ソフトウェアのスクリーンショット:
LanguageTool
ソフトウェアの詳細:
バージョン: 2.9 更新
日付のアップロード: 14 Apr 15
開発者: Daniel Naber
ライセンス: 無料
人気: 18

Rating: nan/5 (Total Votes: 0)

LanguageToolは、通常のスペルチェッカーツールは検出できないエラーを検出するように設計されたオープンソースの校正プログラムです。このようなアップ&ldquoミキシングなどのルールは、そのXML設定ファイルで定義されているエラーを検索しますルールベースの​​スタイルと文法チェッカーであり、彼らの”と“そこ”ます。


様々な文法上の問題を検出し、

プログラムはまた、様々な文法の問題を検出し、英語、ドイツ語、ポーランド語、フランス語、スペイン語、スウェーデン語、ギリシャ語、中国語、デンマーク語、日本語、アイスランド語、ポルトガル語、ブラジルポルトガル語など20以上の言語のサポートが付属していすることができます。
さらに、それは誰もがスペルチェックする必要があるテキストを貼り付けることができます簡単に使用できる、シンプルでわかりやすいグラフィカル·ユーザー·インターフェースを提供しています。これは、クリップボード内のテキスト、タグテキスト、カット/コピー/貼り付けテキストをチェックし、システムトレイ領域に存在することができます。


問題の広い範囲を検出し、

[オプション]ダイアログから、アプリケーションが同様に、悪いスタイルを含め、文法エラー、スラング、句読点の誤り、可能なタイプミス、冗長フレーズ、一般的に混乱した単語、連語、大文字、意味を、検出することができる問題の種類を有効にすることができます非標準の句としてます。


LibreOfficeのとOpenOfficeのためLanguageTool

スタンドアロンのアプリケーションであることに加え、LanguageToolは、ユーザーが右クリックで選択した語句によって、そのテキストを校正することができ、最も人気のある強力なオープンソースのオフィススイートの2、のLibreOfficeとApache OpenOffice.orgのための拡張機能としても利用可能ですまたは段落ます。


Mozilla Firefox用LanguageTool

さらに、アプリケーションはまた、アドオンの世界&rsquo用としてダウンロードすることができます。世界で最も人気のあるオープンソースのウェブブラウザ、Mozilla Firefoxの。それは再起動を必要とせず、あなたがウェブサイトまたはフォームからの強調表示されたテキストを校正することができ、メインツールバーにある小さなボタンを配置します。


フードと可用性の下

アプリケーションは、それ&rsquoことを意味し、Javaプログラミング言語で完全に書かれているが、いずれのGNU / Linuxディストリビューションで動作するように設計されたクロスプラットフォームのソフトウェア、ならびにBSD、Solaris版、Microsoft WindowsとMac OS XのオペレーティングsaでJavaランタイム環境がインストールされているシステムでは、ます。

このリリースののどのような新機能は次のとおりです。

  • カタロニア:
  • 更新POSタグ辞書ます。

  • <李> 新しいルールを追加しました
  • 固定誤報ます。
  • 英語:
  • いくつかのルールを追加します。
  • いくつかの誤警報を固定
  • ヘイッキLehvaslaihoで貢献多くの新しいスタイルルールを追加しました。これらは誤警報が発生する可能性があり、それらはデフォルトで有効にされていません。あなたは、新しい「平易な英語」カテゴリ内のすべてのルールをオンにすることによって、それらを有効にすることができます。
  • エスペラント:
  • はいくつかの新しいルールを追加します。
  • フランス語ます。

  • Dicollecte-5.3 に
  • 更新POSタグ辞書とのhunspell辞書
  • ドイツ:
  • はいくつかの新しいルールと固定誤報を追加します。
  • は、対象の動詞の契約をチェックする新しいルールを追加しました。今のところ、「イスト」、「シンド '、'戦争 '、および'ヴァーレン」でのみの場合は、サポートされています。検出されたエラーの例:「デアフントシンドSCHA&パラ; N。 '、'自動車のIST SCHNELLダイ」。それはまた、持っていたのに対し、(MAS:NOM:SIN SUB)のみ、その主格読書を保持する例えば、句の中の「マン」は「マンをEIN」:このルールを機能させるために、フレーズが今disambiguation.xmlで統一されています対格と与格の読み(SUB:AKK:SIN:MAS、SUB:DAT:SIN:MAS)。 (https://github.com/languagetool-org/languagetool/issues/233)
  • イタリア:
  • はいくつかのルールを改善します。
  • ポーランド:
  • を追加いくつかの新しいルールます。
  • ポルトガル語:
  • 追加/改善されたいくつかのルールます。
  • 3695複合語(プレリフォーム) - 最大の無料データベースます。
  • ロシア:
  • 追加および改善されたルールます。
  • ウクライナ:
  • ビッグ辞書のアップデートます。
  • 新しい文法規則ます。
  • 新しいシンプルなソフトの提案のためのルールを置き換えます。
  • ディスアンビギュエータの改善ます。
  • 化合物のタグ付けやスペル改善ます。
  • イニシャルタギング改善ます。
  • 文章や単語トークン化の改善ます。
  • stresシンボルの処理を改善し、ソフトハイフンます。
  • Bitextルール:
  • は、翻訳は(これはのみが含まれます。?!の文字)をオリジナルと同じ句読点で終わるかどうかをチェックするための簡単​​なルールを追加します。
  • はそれが使用して、コマンドラインで外部bitextルールファイルを追加できるようになりました。
  • -bitextruleオプション。ファイルのパスは、絶対にする必要があります。注:これはデフォルトで含まれないbitextルールを持っていない言語にもbitextルールを使用できます。
  • スペル:
  • /hunspell/spelling.txtで新しいファイルがスペルミスのための提案を作成する際にも考慮されているスペルチェッカに受け入れられた単語を追加するために使用することができます。このリストは、スペルミスのための提案を作成するときに* *使用されていない単語を受け入れ/hunspell/ignore.txtファイルに似ています。
  • API
  • JLanguageTool.activateDefaultPatternRules()とJLanguageTool.activateDefaultFalseFriendRules()が削除されました - すべてのパターンルールと偽の友人のルールを(第二言語が指定されている場合)JLanguageToolのコンストラクタが呼び出されたときに自動的に活性化されます。あなたはgetPatternRules()メソッドを上書きし、そこに空のリストを返すものと言語のクラス(例えば、「英語」)を拡張し、XMLベースのパターンルールなしでチェッカーを必要とする必要があります。
  • ManualTagger.lookup()最新のリリース以降、推奨された後ManualTagger.tag()で置き換えられています。
  • すべての静的メソッドとクラス「言語」のフィールドは、新しいクラスの「言語」に移動されました。ここでは、クラスの言語のメソッド/フィールドがまだ存在しますが、推奨されなくなりました。
  • LanguageIdentifierToolsは削除されました。代わりにLanguageIdentifierを使用します。
  • を削除(デフォルト)ResourceDataBroker.setResourceDir()とsetRulesDir()これらは、コンストラクタで設定できるようにます。
  • は、例えば、クラスコントリビュータをクリーンアップ削除getRemark()
  • がCategory.setDefaultOff()が削除されました、これは今、コンストラクタを介して設定することができます。
  • に改名クラス:o.lt.rules.patterns.Element =&GT; o.lt.rules.patterns.PatternToken o.lt.rules.patterns.ElementMatcher =&GT; o.lt.rules.patterns.PatternTokenMatcherます。

  • 一般的な使用例に影響を与えるべきではない
  • 他の小APIのクリーンアップ、例えば、非推奨メソッドのIncorrectExample.getCorrections()が復帰し、現在変更不可能なリストは、取り外します。
  • 組み込みサーバー:
  • のXMLエスケープが
  • これが返される無効なXML文書を引き起こす可能性があり、修正されました
  • 新しい設定ファイルのオプション使用すると、要求キューの最大サイズを設定することができます 'maxWorkQueueSize' - それはこれよりも大きくなる場合、要求は拒否されます(503サービスは使用できません)
  • は、サーバーは、これらのエラー状態をより特定のHTTPステータスコードで応答:413要求エンティティが大きすぎます - テキストは最大テキストサイズ503サービスを使用できません超えた場合 - チェックは最大チェック時間を超えた場合
  • GUI:
  • 今の引数としてプレーンテキストフ​​ァイルを取ることができるスタンドアロンのGUIは、このファイルは、次に起動(Githubの発行#232)にロードされます。
  • コマンドライン:
  • これは、コマンドラインからLanguageToolを呼び出すときに外部ルールファイルを追加することが可能になりました。ファイルを追加する--rulefile使用します。ファイル名は言語名が含まれているフォーマットを有する場合、それは他のルールと一緒に使用されます。それ以外の場合は、ルールに置き換えられます。また、オプションの--falsefriendsを使用して、偽の友人と外部ファイルを読み込むことができます。ファイル名は絶対パスでなければならず、偽の友人のファイルは常に言語のためにロードされたものに追加されます。 (Githubの発行#192)
  • ルールの構文:
  • ルールがある限り、それは「補正」属性を持っているように、単一の例文を有することができる - 唯一の正解文が適用される補正との誤った文と同じである場合、これは、いくつかの冗長性を保存することができます。前に、ルールは、少なくとも二つの例文を必要としてます。
  • '例'要素:「補正」属性があるかどうかのタイプ= "正しくない"はオプションになりました。 「補正」属性は、文が間違っていることを意味します。
  • '例'要素:タイプ= "正しい"はオプションになりました。 NO 'type'属性なし '補正'属性は、文が正しいことを意味しません。
  • 内部
  • 我々は、自動的にテキスト言語を識別するための言語検出器(https://github.com/optimaize/language-detector)にはApacheティカから切り替えています。それはより速くであるべきであり、結果がより信頼できるものでなければなりません。アストゥリアスやガリシアの検出は、検出品質が低すぎると、またスペイン語の検出に影響を与えたために無効にする必要がありました。
  • GUIで外部ルールファイルをロードすることは不可能に回帰を修正します。

のバージョン2.8でののどのような新機能は次のとおりです。

  • アストゥリアス:
  • のhunspellの削除依存性は、今スペルチェックのためにMorfologikを使用しています。
  • ブルトン:
  • はいくつかのルールを追加し、改善します。
  • カタロニア:
  • 更新辞書ます。
  • 追加および改善されたルールます。
  • 固定誤報ます。
  • オランダ:
  • が追加され、改善された多くのルールます。
  • 英語:
  • いくつかの新しいルール(ニック·ハフのおかげで)ます。
  • 固定、タガーとシンセサイザー辞書を更新し、問題の#202
  • 単語の一部のpartofspeechを照合するための新しいフィルタ、例えば: "には「形容詞(POSタグされた後に*これは「中」、どこの部分で始まる単語にマッチするものを維持します「JJ」)。 'は:1'が。すなわち、ここでトークン位置、最初の(そして唯一の)マッチングと呼ばれます。
  • ではありません
  • フランス:
  • はいくつかのルールを追加し、改善します。
  • ドイツ:
  • はいくつかのルールを追加し、改善します。
  • ポーランド:

  • <李は>追加および改善されたいくつかのルールます。
  • 英語
  • との偽の友人を追加し、改善されました
  • ポルトガル語:
  • 追加/改善されたいくつかのルールます。
  • スペイン語:
  • のhunspellの削除依存性は、今スペルチェックのためにMorfologikを使用しています。
  • 、書式ルール·ファイル

  • <李> 複数のルールを追加しました
  • タガログ語:
  • のhunspellの削除依存性は、今スペルチェックのためにMorfologikを使用しています。

  • テキストをトークン化するとき、
  • ダッシュ文字( "")
  • 今デリミタです
  • ロシア:
  • 追加および改善されたルールます。
  • は(ロシア語/英語)
  • いくつか偽の友人のルールを追加しました
  • ウクライナ:

  • (名詞との契約、時の式などを含む)
  • 多くの新しいルールます。
  • ルールの適用範囲の改善ます。
  • 辞書の更新(固有名詞と呼応ケースのための大きな改善)
  • 新しいタグを、代わりのスペルを警告するルールます。
  • スペル提案を改善するために追加した単語の頻度情報
  • いくつかの新しいディスアンビギュエータルールます。
  • ルールの構文:
  • ...今、そのグループのすべてのルールに影響を与えるためにrulegroupに追加することができます。
  • あなたは今、私たちのスタンドアロンのGUIに表示されcommunity.languagetool.orgするルールのリンクを防止するために、あなたのカテゴリに外部= "yes"を追加することができLTの一部ではない独自のルールを開発する場合(リンクが機能しませんLTの主なディストリビューションの一部ではないルール)のため。 (Githubの発行#223)

  • ルールグループはデフォルト= "オ​​フ"を指定した場合は
  • 、ルールグループ内のルールは、/「オン」と「オフ」= defaultを指定しない場合があります。
  • API

  • 2.7以上から非推奨されていた
  • 削除されたクラスとメソッド
  • 組み込みサーバー:
  • 設定ファイルのオプション 'requestLimit'と 'requestLimitPeriodInSeconds」は今も(だけでなく、HTTPSサーバの場合)HTTPサーバのために使用することができます。
  • 新しい設定ファイルのオプション 'trustXForwardForHeader':あなたはリバースプロキシの背後にあるサーバを実行し、要求の制限が「Xforwardedfor 'HTTPヘッダによって提供元のIPアドレスで動作するようにしたい場合は「本当」に設定は、通常で設定されましたプロキシ。プロキシの背後に実行されますが、このプロパティをtrueに設定しない場合、他のユーザーもいるため、要求制限のエラーメッセージが表示されますので、一人のユーザがすべての要求を使用することができます。

  • 後締切モードの
  • フィックス応答:...ワードプレスのテキストチェックを混乱させ、場合によっては空だった。
  • Bitextルールは、サーバのための適切なパラメータで指定された場合でも、適切に無効になっていません。今、それが固定されています。
  • 一部bitextルールの不適切な位置(問題#218)の問題を修正しました。
  • GUI:
  • 新しい「errorColors」設定がlanguagetool.cfg構成ファイルに追加されました。これは、エラーの背景色を設定するために使用することができます。例えば、errorColors =誤字ます。#b8b8ffは、スタイル:#のffb8b8はLTウィンドウの上部に赤色の背景と青色の背景色の「誤字」エラーや「スタイル」のエラーが表示されます。 「誤字」と「スタイル」は、「タイプ= ...」とgrammar.xmlに設定されているタイプです。ユーザーインターフェイスは、これらの色を設定するには、まだありません。 LTが実行されていないときにのみlanguagetool.cfgファイルを編集する必要があることに注意してくださいます。
  • 内部
  • バグ修正:ルールグループ内のルールがアクティブ化されていない同じrulegroupから前述のルールは、デフォルトを使用した場合=「オフ」
  • の言葉は、それらがルールの提案で発生するという理由だけでスペルチェッカーによってもはや無視されません。あなたはスペルチェッカーがグローバルに言葉を無視したい場合は、のhunspell / ignore.txtに追加します。コンテキストに応じてそれらを無視するには、disambiguation.xmlに「ignore_spelling 'ルールを追加します。
  • ファイル 'のhunspell / prohibit.txt」は、スペルチェッカーは、通常それらを受け入れることになる場合でも、スペルミスなどの単語をマークするために使用することができます。これは、更新される上流のチェッカーを待たずにLanguageToolのスペルチェッカーを改善するのに有用です。 「prohibit.txt 'ファイルは言葉を無視するようにスペルチェッカーを引き起こす「ignore.txt'の反対でます。
  • ほとんどの言語partofspeechタガーは今(XXは言語コードである)ファイルORG / languagetool /リソース/ XX / added.txtにエントリを追加することによって拡張することができます。フォーマットは「fullformベースフォームのpostag」、タブで区切られた3つの列です。これは、彼らが、エクスポート、変更、およびすべての変更のバイナリ辞書を再作成する必要はありませんように、POSタガーを拡張するために、ユーザー(と開発者)のために、それが容易になります。

のバージョン2.7でののどのような新機能は次のとおりです。

  • ブルトン:
  • 追加および改善されたルールます。

  • 曜日、日付と一致するかどうかを確認する
  • 新しいルール、例えばその日は金曜日ではないとして、「Gwener 28すなわちのEost 2014」は、検出します。
  • カタロニア:
  • 追加および改善されたルールます。
  • 固定誤報ます。
  • オランダ:
  • が追加され、改善された多くのルールます。
  • はMorfologikベースのスペルチェッカーに切り替えます。
  • -english:
  • あなたは世界で最も強力なオープンソースの校正ツールを開発するチームの一員になりたいですか?我々はLanguageTool英語ルールのメンテナを探しています。詳細については、http://wiki.languagetool.org/tasks-for-language-maintainersを参照してくださいます。
  • すべての英語辞書はスペルチェッカーの提案を改善するために、単語頻度クラスを含むように拡張されました(周波数データはhttps://github.com/mozilla-b2g/gaia/tree/master/apps/keyboard/jsから取られますすでにこの機能を使用する他の言語のような/のIME /ラテン/辞書)ます。

  • 英語学習者のための
  • より良い提案:不規則動詞、名詞、形容詞は現在、通常、より良い提案があります。例えば、示唆している「thinked ''と思った」、「梨花」が「女性」を示唆します。
  • その他のスペルミスが今の提案を提供し、例えば、 「garentee '(保証)、「GREATFUL'(感謝)。これは、(未知語の多くのテキストのためのより)〜10%の性能低下の原因となることがあります。

  • 曜日、日付と一致するかどうかを確認する
  • 新しいルール、例えばその日が月曜日ではありませんように」2014年10月7日(月曜日)は、「検出します。それは、使用中の日付形式を検出した場合、このルールにのみ機能します。これまでのところ、これらのフォーマットがサポートされています:* "2014年10月7日(月曜日)" * "2014年10月7日(月曜日)「*」は2014年10月7日(月曜日)" * "2014年10月7日(月曜日)「*(これも略さ週間で動作します月曜日のMoまたは月)のような日​​
  • エスペラント:

  • 曜日、日付と一致するかどうかを確認する
  • 新しいルール、例えばその日は金曜日ではないとして、「Vendredonラ28 - デAAgusto 2014」を検出ます。
  • フランス:

  • Dicollecte-5.2 に
  • 更新POSタグ辞書とのhunspell辞書
  • はシンセサイザーを追加 - 契約のルールは、現在いくつかのエラーのための提案を行うことができます。
  • 追加/改善されたいくつかのルールます。

  • 曜日、日付と一致するかどうかを確認する
  • 新しいルール、例えばその日は金曜日ではないとして、「ヴァンドルディ28/08/2014」を検出ます。
  • ドイツ:
  • 固定稀にNullPointerExceptionとは、ArrayIndexOutOfBoundsExceptionます。
  • 固定いくつかの誤報ます。
  • を加え、改善されたルールます。
  • 動詞ずに文章をチェックする新規則(による誤警報のリスクにはデフォルトでオフになって)

  • 曜日、日付と一致するかどうかを確認する
  • 新しいルール、例えばその日は火曜日ではないとして、「Dienstag、2014年9月29日」とは、検出します。
  • スペルチェックの提案のためのパフォーマンスの改善ます。
  • ペルシャ:
  • ペルシャ語(ペルシア語)
  • の初期サポートを追加しました
  • ポーランド:
  • はいくつかのルールを追加し、改善します。

  • 曜日、日付と一致するかどうかを確認する
  • 新しいルールます。
  • ポルトガル語:
  • 追加/改善されたいくつかのルールます。
  • 複合語ます。
  • の多くの数十を追加
  • ロシア:

  • <李> 新しいルールを追加しました
  • SourceForgeの機能要求#38を固定する(別の引用符をチェックする)
  • は(ロシア語/英語)
  • いくつか偽の友人のルールを追加しました
    曜日、日付と一致するかどうかを確認する
  • 新しいルール、例えば検出"ÐонеÐ'еÐ"NŒÐ½Ð¸Ðº, 30 N ??&ETH;&マイクロ;&ETH;&frac12; N&sbquo; N ??&ETH;&plusmn; N&ユーロ; N? 2014&ETH;&SUP3 ;.」、その日が月曜日ます。
  • ではありませんように。
  • postag辞書から新しい言葉で拡大ロシアの複合ルールます。
  • スペイン語:
  • 新しいPOSカテゴリZ(綴ら番号については、例えば、「UNO」、「ドス」、...)を追加しました
  • 綴り番号は現在検出され、曖昧性除去とルールの両方を管理することができます。
  • POS辞書内のいくつかの不正な補題を修正します。
  • を追加しましたハイブリッドチャンカ·ディスアンビギュエータます。
  • タミル語:
  • タミル語の初期サポートを追加しました。 https://bugs.openjdk.java.net/browse/JDK-8008572
  • ウクライナ:
  • POS辞書(修正と新しい単語)のための大きなアップデートます。
  • 一貫性を保つために名前を変更し、いくつかのPOSタグ。略語や珍しい単語の新しいタグます。

  • 既存のルールのための
  • 多くの新しいルールと修正ます。

  • 曜日、日付と一致するかどうかを確認する
  • 新しいルール、例えば検出 "&ETH;&ETH;&frac34;&ETH;&frac12;&ETH;&マイクロ;&ETH; 'N-&ETH;"&ETH;&frac34;&ETH;&ORDM ;, 7&ETH;&パラ;&ETH;&frac34;&ETH;&SUP2;その日が月曜日ます。
  • ではないとして2014」、
  • トークン正規の性能改善ます。
  • LibreOfficeの統合:
  • は(それが今のメタデータとして脚注の位置を提供してくれるので、我々はそれらを無視することができます)以降のLibreOffice 4.3の脚注で混乱してはいけない。
  • API
  • JLanguageToolをスレッドごとに作成されたマルチスレッド·ユースケースのための主要なパフォーマンスの向上が、言語オブジェクト(例えば、「ドイツ語は ')一度だけ作成されます。 JLanguageToolを作成するためのオーバーヘッドは今はるかに低くする必要があります。

  • バージョン2.6 以来、廃止されていた
  • 削除されたいくつかのクラスとメソッド
  • を削除DutchSpellerRule - 代わりMorfologikDutchSpellerRuleを使用します。
  • Language.getRelevantRules()の署名が変更されています。
  • JLanguageToolとMultiThreadedJLanguageToolコンストラクタはもうIOExceptionをスローするように宣言していない
  • WhitespaceRule MultipleWhitespaceRule(WhitespaceRuleがまだ存在しますが、推奨されていません)
  • に変更されました
    <李> (パブリックから保護するなど)、その視認性を減少するであろういくつかのメソッドを非推奨します
  • MorfologikSpellerRule.getRuleMatch(文字列、int)がMorfologikSpellerRule.getRuleMatches(文字列、int型)
  • に変更されました
    toPositionがFromPositionはより大きくない場合は、
  • RuleMatchコンストラクタは現在の例外をスローします
  • は、ルールを拡張し、それが一つの文章よりも多くをカバーするルールのために使用することができる新たな抽象クラスTextLevelRuleを導入ます。
  • コマンドライン:

  • 同時に
  • 特定のルールの有効化と無効化は、現在許可されています。以前は今「--enabledonly --enable LIST_OF_RULES」(または「-eo -e LIST_OF_RULES ")を使用し、「--enable LIST_OF_RULES」で行っただけで、いくつかのルール(すべての残りの部分を無効にする)を、試験するために。
  • 組み込みサーバー:
  • は2つの新しいオプションがLanguageToolは締め切り(ATD)の後と同じXMLフォーマットを返すように、プロパティファイルで設定することができます。 「LanguageTool 'または' AfterTheDeadline '* afterTheDeadlineLanguage - - デフォルトの言語のコードモードは「AfterTheDeadline」注記に設定されている場合*モード::' AfterTheDeadline」モードが考慮されるべきで、それがドロップインATDの代替として使用することができますこの方法で今の実験ます。
  • 新しいオプション 'maxCheckThreads」を並列に要求で作業スレッドの最大数を設定することができます。それがために使用されるデフォルト値は、10です。
  • の内部:
  • 曜日と日付が一致しているかどうかを確認することを可能にする新しい抽象ルールAbstractDateCheckFilter。例えば「2014年9月29日(火曜日)は「9月29日として、2014年は実際にはない火曜日、検出することができました。これは、新しい 'filter'要素を持つXMLから呼び出すことができます新しい実験RuleFilterインターフェイスを使用しています。 「クラス」:RuleFilterを実装するJavaクラスの完全修飾名、たとえば「フィルタ」は、これらの属性を取ります「org.languagetool.rules.de.DateCheckFilter "'引数':のような文字列"年:1月:2日:3平日:4 "、キー/値ペアのすなわちスペース区切りのリスト、xはに解決されます( 'メッセージ'要素のような)パターンのトークン値ます。

  • <李は>複合ルールがdisambiguation.xmlで免疫されているトークンを無視します。
  • はディスアンビギュエータの「フィルタ」アクションが指定されたPOSタグに一致するPOSタグにのみ適用されます。一致しない場合、ルールが適用されない。

  • http://wiki.languagetool.org/tips-and-tricks#toc2で説明したように、XMLのルールを拡張している場合は
  • 、外部ルールと曖昧さ回避のファイルは、現在指定して、パスワードで保護されたサーバー上でホストすることができますます。http://ユーザー:password@example.org/path/user-rules.xmlます。
  • このようなURL
  • 全角ダッシュ(「A&ユーロ; "")
  • 今、すべての言語のトークン化文字です
  • 新機能:

  • 言語モデルの
  • を使用します。
  • LanguageToolは今のngramデータを利用することができます。 NGRAMデータは、フレーズは、言語では発生頻度に関する情報です。現在、これは長さ3の語句を使用しています。
  • データは、粗/コースや才能/フレアを混合のように、同音異義語の誤りを見つけるために、英語の規則で使用されています。 LanguageToolは前にこのようないくつかのルールを持っていましたが、新しいルールは現在、約900、ワードペア/セットのをサポートしています。
  • は、このために必要なデータは、このように一部またはLanguageToolない(英語のための7ギガバイト)巨大であります。
  • データ(英語のみ今のところ)よりマニュアルはhttp://wiki.languagetool.org/finding-errors-using-big-dataで入手できます。
  • ngramsを使用すると、データをSSDに格納されている場合LanguageToolがわずかに遅くなります。
  • SSDに保存されていない場合、パフォーマンスが大幅に低下することがあります。
  • のデータを使用するルールを有効にするには、コマンドラインクライアントを使用して新しい--languagemodelオプションを使用します。そのオプションはまだスタンドアロンのGUIには使用できません。

のバージョン2.4.1でのの新機能:


    1.8.3に
  • 更新Morfologikライブラリは影響を受けたスペルチェッカー、でスロー提案を修正するには、少なくともEN-USます。

のバージョン2.4ののどのような新機能は次のとおりです。

  • ブルトン:
  • SRX文のトークン化ます。

  • <李> いくつかのルールを追加/改善し
  • 一部の誤報を固定
  • 固定誤った提案の修正の追加テストのおかげでます。
  • カタロニア:
  • 追加/改善されたいくつかのルールます。
  • 固定誤報ます。

  • タガー辞書に
  • 行われた追加および修正ます。

  • 合成辞書からいくつかの単語を削除
  • (filterarchaic.txtを参照してください)​​
  • はタガー辞書に周波数データを追加しました。周波数ワードリストは、Apacheライセンス、バージョン2.0(https://github.com/mozillab2g/gaia/tree/master/keyboard/dictionaries)で、ガイアプロジェクトから来ています。
  • 英語:

  • <李> いくつかのルールを追加/改善し
  • 一部の誤報を固定
  • フランス:
  • 追加/改善されたいくつかのルールます。
  • 一部の誤報を固定
  • ドイツ:
  • 追加/改善されたいくつかのルールます。
  • 契約ルールは現在いくつかのエラーのための提案(すべてではないの提案はしかし、正しい)
  • にすることができシンセサイザーを追加しました
  • ポーランド:
  • は特にハイフンとダッシュの使用
  • のために、/改善されたいくつかのルールを追加しました
  • はスペルチェック辞書のための周波数情報を追加しました。周波数ワードリストは、Apacheライセンス、バージョン2.0(https://github.com/mozillab2g/gaia/tree/master/keyboard/dictionaries)で、ガイアプロジェクトから来ています。
  • 一部の誤報を固定
  • ポルトガル語:

  • <李> (それは今 "" / "O"を性別ルールが含まれています。)/改良され、いくつかのルールを追加しました
  • それが今3400+複合語を持っています。
  • JARファイルには、(githubの問題#29)
  • 「スタンドアロン」は、この文脈で何を意味するかについての混乱を避けるために、以前languagetoolstandalone.jarから、languagetool.jarに改名されました
    テキスト(長)のパフォーマンス(フランス語やドイツ語など)多くのルールを持つ言語のための
  • は約2030パーセント増加してきた。
  • threadsafetyの修正(MultiWordChunkerにハング可能性があり)ます。
  • チャンクアノテーションはグループで試験されなかったバグを修正
  • 修正:1と...
  • で評価されていませんでした
  • 途中でマッチング解釈の一部を破棄統一機構の不具合を修正しました
  • はディスアンビギュエータでチャンクアノテーションのサポートを追加し、チャンク注釈でフィルタリングト​​ークンで1バグを修正します。

  • 1.8.2に
  • 更新Morfologikライブラリ(バグ修正、チェック厳格な入力正気、辞書に周波数データを追加)
  • はtagggingまたはスペル辞書に周波数データを含めるオプションを追加しました。周波数ワードリストの予想フォーマットは、Apacheライセンスで、ガイアプロジェクト内の1つである、バージョン2.0(https://github.com/mozillab2g/gaia/tree/master/keyboard/dictionaries)
  • 新しいコマンドラインツールでは、エクスポートして、バイナリ辞書を作成します。
  • org.languagetool.dev.DictionaryExporterます。
  • org.languagetool.dev.POSDictionaryBuilderます。
  • のLibreOffice / OpenOfficeの統合:
  • 脚注が文終止符(Sourceforgeのバグ#191)
  • の後に登場した場合の誤った文を検出するための回避策を追加しました
  • スタンドアロンのGUI:
  • エラーのコンテキストメニューに「もっと...」アイテムにより表示されるダイアログは今も表示され、正しいと誤った例文ます。
  • API

  • <李> SentenceTokenizerインターフェイスが実装はRegexSentenceTokenizerに移動されましたが、これは推奨されておらず、SRXSentenceTokenizerを代わりに使用する必要があり、今でます。
  • org.languagetool.tools.StringToolsからいくつかの方法は、
  • languagetoolguicommonsプロジェクトにorg.languagetool.gui.Toolsクラスに移動されました
  • LanguageToolListener.languageToolEventOccured()LanguageToolListener.languageToolEventOccurred()に名前が変更されています。
  • org.languagetool.tools.SymbolLocatorは
  • (誰に影響を与えるべきではない)もう公開されていません
    3年で廃止されていたDanishSentenceTokenizer削除
  • Rule.getCorrectExamples()とRule.getIncorrectExamples()もうnullを返しませんが、空のリストが例は存在しない場合。その結果、setCorrectExamples()とsetIncorrectExamples()はもうヌル受け付けておりません。
  • Rule.getId()は、今で任意の文字列を返すことができるだけでなくASCIIonly文字列(ASCIIonly制限が適用されず、唯一のjavadocの述べなかったように実際にこれは、前のケースとなっている)
  • languagetoolwikipedia:ウィキペディアダンプをチェックするためのコマンドラインオプションが簡素化されました。コマンドは次のように呼び出すことができます。javaジャーlanguagetoolwikipedia.jar CHECKDATAリットルエンF enwiki20130621pagesarticles.xml使用方法のメッセージを取得するだけの「Javaのjar languagetoolwikipedia.jarのCHECKDATA」コール。複数のファイルは、-fオプションで指定することができます。さらに、ウィキペディアのXMLダンプに、Tatoeba(http://tatoeba.org)からCSVファイルは現在もサポートされ、彼らは唯一の関連語を含むように最初にフィルタリングする必要があります。

のバージョン2.3でのどのような新機能は次のとおりです。

  • ブルトン:

  • <李> いくつかのルールを追加/改善し
  • 固定誤報ます。
  • Apertiumから更新されたPOS辞書(SVN r47282)
  • カタロニア:
  • は、LibreOfficeの4.2.0ます。
  • で使用される言語コードCA-ES-バレンシア(カタロニア語バレンシア)のサポートが追加されました
  • は、交換提案の何百もの単純な置き換えルールを追加した。
  • 追加/改善されたいくつかのルールます。
  • 固定誤報ます。
  • 中国:
  • StringIndexOutOfBoundsExceptionを(http://sourceforge.net/p/languagetool/bugs/186/)
  • の回避策を追加しました
  • 英語:

  • <李>(現在、「teached」のため「教えた」提供しています)の提案を改善するために、スペルチェックのために交換用のパターンを追加します。
    <李> いくつかのルールを追加/改善し
  • フランス:

  • <李> いくつかのルールを追加/改善し
  • 固定誤報ます。

  • Dicollecte-4.12 に
  • 更新POSタグ辞書とのhunspell辞書
  • ドイツ:
  • 追加/改善されたいくつかのルールます。
  • ポルトガル語:

  • <李> いくつかのルールを追加/改善し
  • それが今3300+複合語を持っています。
  • ウクライナ:
  • 追加/改善されたいくつかのルールます。

  • https://github.com/languagetool-org/languagetoolます。 <李>ソースコードはgithubのに移動されました
  • LanguageToolは
  • 今のJava 7を必要とします
    <李> LanguageToolは、テキスト(これはスタンドアロンバージョン、コマンドラインバージョンとのLibreOffice / OpenOfficeの拡張機能に影響を与える)、最新のハードウェア上のチェックのパフォーマンスを向上させるために、今、複数のスレッドを使用しています。
  • ルールの構文:
  • 所定の回数を表示さの要素にマッチすることを可能にする新しい最小/最大の属性の予備サポート。例えば: " - 1" fooがすなわち "foo"が任意のfooが "foo"というか "FOO fooの「fooが何も一致しません、" foo "というか、" FOO fooの「使用maxに=一致しますが、何か "foo"を一致しません無制限の出現を可能にします。分間、唯一の0または1(1はデフォルトです)。サポートされています。
  • OR-文をサポートしています。例:内部および実行時には、OR-ステートメントを含むルールOR-文のないいくつかのルールに変換されます。
  • 英語は現在、とりわけ、単数形と複数形の名詞チャンクを検出するチャンカを持っています。これはhttp://wiki.languagetool.org/using-chunksで文書化されます。
  • スタンドアロン版:
  • スタンドアロンバージョンは、赤(スペルミス)、または青(その他のエラー)ライン(Panagiotisミノス)
  • でエラーを強調します
  • 次の開始
  • の言語選択を忘れないでください
    マルチモニタセットアップで
  • の改善ウィンドウやダイアログの配置
  • 組み込みサーバー:引数なしで起動した場合、再びデフォルトのポート(8081)を使用します。
  • (MAPとREPの等価物はのhunspell辞書にあります)発音区別記号と交換パターンの適切な取り扱いを含め、より良い提案を、有効にするためにバージョン1.7.1にmorfologik-ステミングライブラリを更新
  • のOpenOffice / LibreOfficeの統合:
  • 修正: "について」ダイアログには、Apache OpenOfficeの4.0
  • に動作しませんでした
  • 修正:(イギリス英語用等)の国固有のルールが機能しなかった。
  • API

  • クラス言語で
  • は、getCountryVariantsは()getCountries()に名前が変更されていて、新しいメソッドgetVariantが追加されています。
  • いくつかの方法が推奨されなくなりました。
  • いくつかの方法は、新しいCommandLineToolsクラス(languagetool-コマンドライン)
  • にツールクラス(languagetool芯)から移動されました









のバージョン2.2ののどのような新機能は次のとおりです。



のバージョン2.1でののどのような新機能は次のとおりです。





のバージョン2.0でののどのような新機能は次のとおりです。







の要件

  • のJava 2 Standard Editionのランタイム環境ます。

開発者の他のソフトウェア Daniel Naber

Jwordsplitter
Jwordsplitter

21 Jan 15

LanguageTool
LanguageTool

21 Jan 15

へのコメント LanguageTool

コメントが見つかりません
コメントを追加
画像をオンにする!