uni2ascii

ソフトウェアのスクリーンショット:
uni2ascii
ソフトウェアの詳細:
バージョン: 4.18
日付のアップロード: 11 May 15
開発者: Bill Poser
ライセンス: 無料
人気: 70

Rating: 3.0/5 (Total Votes: 3)

uni2asciiとascii2uni UTF-8 Unicodeとを含む、7ビットのASCII同等の任意の様々な間で変換:16進数と10進数のHTML数値文字参照、U-エスケープ、標準進数、および16進数のロー。
Unicode文字セットが、8ビットの安全ではない、とデバッグ時に処理できるWebプログラムにテキストを入力するときに、このようなASCII同等物は、プログラムソース内のUnicodeテキストを含む場合に便利です。
Unicodeが利用できるエスケープされています:
 
- HTML進数値文字参照(例えば)
- HTML進数値文字参照(例えば、ȳ)
- U-エスケープ、Pythonで使用されるように(例えばu00E9)
- 例えば、BMP、超えたBMPおよびU-エスケープ内のu-エスケープu00E9しかしU00010024。
- Uのエスケープを(例えば、U 00E9)
- U-エスケープ(例えばU00E9)
- U-エスケープ(例えばu00E9)
- 角括弧内のU-エスケープ(例えば)
- X-エスケープ(例えばx00E9)
- 中括弧を使用して、x-エスケープ(例えば、X {} 00E9)
- 標準進数(例えば0x00E9)
- 生進数(例えば、00E9)
uni2asciiは、いくつかのいくつかのプログラムは、どちらか一方だけを受け入れるため、AFの16進数として、大文字のAFまたは小文字を生成するかどうかを決定するコマンドラインフラグを受け付けます。 ascii2uniはどちらか受け入れます。
デフォルトでuni2asciiの場合は、ASCIIの範囲外の文字だけが変換されます。 ASCII文字も変換された場合でも、その変換が明示的に要求されない限り、改行は保持されます。変換が明示的に要求されない限り、空白文字も保持されます。空白文字が変換されない場合は、7-内の出力を維持するように3つの非ASCIIスペース文字(エチオピア語スペース、オガム文字スペース、および表意文字スペース)の場合には、これらはASCIIスペース(0x20の)で置換されていますビットASCIIの範囲。
このパッケージには、4つのプログラムが含まれています。メインプログラムがuni2asciiです。これは、Cで書かれており、コンパイルする必要があります。 uni2html.pyはuni2asciiするの前身です。それはPythonで書かれているように、コンパイルする必要はなく、任意の現在のコンピュータについてだけで実行する必要があります。 uni2asciiは、その中に他の方法で優れています。
- それは、出力形式の広い範囲を生成します。
- それは、約20倍高速です。
- これは、完全な32ビットUnicodeの範囲で入力を処理します。これとは対照的に、uni2htmlのみ扱います
基本多言語面(プレーン0)現在のPythonで内部に16ビット整数を使用して、Unicodeでエンコードされたテキストを表すので。あなたはリニアBまたはウガリット、たとえば、内のテキストを持っている場合は、uni2ascii必要があります。
これは、エラーを報告するより良い仕事をしていません。それは、このような不正な形式のUTF-8のように、その入力にエラーが発生した場合は、ファイル(0から始まる)の先頭からの文字数の点で、バイト数の点で両方のエラーの場所をレポートファイルの先頭から(も0から始まります)。 (UTF-8でエンコードされた文字は、1〜4個のバイトから占有するので、文字カウントおよびバイトカウントは、一般的に同じではありません。)Pythonバージョンレポートのみ文字カウント。 uni2asciiは、エラーの性質についての情報を提供します。
第3のプログラムは、ascii2uniは、uni2asciiの逆です。これは、Unicode文字のASCII表現の多様性を含むテキストを受け入れ、UTF-8のUnicodeを生成します。
第四プログラム、ascii2uni.pyは、PythonとTclで使用されるように、U-エスケープユニコードを含む7ビットASCIIを読み取り、UTF-8のUnicodeに変換します。それはascii2uniが一般化​​しているのオリジナルプログラムです。

このリリースの新機能:

このsubsitutionカウントは固定、高すぎるある場合にはこれにuni2asciiで修正されたバグは、 Debianのバグ#626268。
getlineのを欠いているのNetBSDの状況を処理するためにパッチを適用。
スペースや改行以外のASCIIの範囲の文字を変換するように純粋なオプションの意味を明確にしました。これはUTF8タイプのために正しく実装されなかった不具合を修正しました。

このバージョン4.17の新機能:

このは、最寄りのASCII文字に次の変換をuni2asciiに追加:U + 2022弾丸U + 00B7中ドット、 'O'までの期間に、U 0085次の行は改行に、U + 2028行セパレータを改行します。

このバージョン4.16の新機能です:

このQフォーマットはascii2uniで再び動作します。
追加されたU + 2033ダブルプライムuni2asciiの電子フォーマットを使用しての下での最も近いASCII文字に変換する文字。

このバージョン4.15の新機能です:

この名称変更endian.hは、外部endian.hとの競合を排除するu2a_endian.hします。
それはPOSIX2008のような標準的であるようascii2uni.cからのGNUのgetlineのコピーを削除しました。

この何がバージョン4.14で追加されます。

uni2ascii中のQフォーマットの使用を妨害するバグを修正しました。
U + 2502とU + 2503のバグを修正中ascificationは出力に二重引用符を追加しました。
Sオプションを-aた不具合を修正しまし生成"変換文字&QUOTので、多くの。コー​​ドのデバッグに残しによる各文字の行。

このバージョン4.13の新機能です:

この文字の数が多すぎるバグを修正がASCIIに変更が報告されます。

このバージョン4.12の新機能です:

この両方のプログラムは現在、入力ファイル名をリダイレクトすることなく、コマンドラインで指定することができます。

このバージョン4.11の新機能です。

このリリースでは、&LTのサポートが追加されます。 XX>< XX>と%uXXXXという形式。

このバージョン4.10の新機能です。

このリリースでは、ascii2uniの-aフラグノーオペレーションにY引数を作ったバグを修正し、manページとヘルプを修正します両方のプログラムのために-aフラグをYとQ引数の。
Y引数は、今uni2asciiのエラーです。
バージョン情報とアクション要約がより有益です。

同じようなソフトウェア

LaTeX2Markdown
LaTeX2Markdown

14 Apr 15

seqdiag
seqdiag

20 Feb 15

...">VTD-XML

20 Feb 15

oXygen XML Editor
oXygen XML Editor

22 Jun 18

開発者の他のソフトウェア Bill Poser

UnicodeDataBrowser
UnicodeDataBrowser

14 Jul 15

Redet
Redet

3 Jun 15

へのコメント uni2ascii

コメントが見つかりません
コメントを追加
画像をオンにする!