TRMinerは、科学的データの学芸員を目指すPythonのユーティリティです それは急速に与えられた鉱山の目標に関連する文章に科学出版物の大規模なコレクションを剪定することができます。
これは2つのステップで達成される。まず、テキストは、関連する言葉のトークンのシーケンスにtranlatedされている。第二に、正規表現パターンは、トークン配列において検索される。 。試合は、自然言語文に戻って翻訳され、手動のキュレーターは、ソートし、さらなる文書や情報抽出のためのレートが一致することができますHTML5ベースの出力として提供されます。
の要件の
- のPythonます。
コメントが見つかりません