ICONV(1) | Linux User Manual | ICONV(1) |
iconv - テキストをある文字符号化から別の文字符号化に変換する
iconv [options] [-f from-encoding] [-t to-encoding] [inputfile]...
iconv プログラムはある符号化 (encoding) からテキストを読み出し、 別の符号化でそのテキストを出力する。 入力が指定されなかった場合、 もしくは入力ファイルとしてダッシュ (-) が指定された場合、 iconv は標準入力から入力を行う。 出力が指定されなかった場合、 iconv は標準出力に出力する。
from-encoding が指定されなかった場合、 デフォルトは現在のロケールの文字符号化から取得される。 to-encoding が指定されなかった場合、 デフォルトは現在のロケールの文字符号化から取得される。
to-encoding の後ろに文字列 //IGNORE が付いていた場合、 変換できなかった文字は破棄され、 変換後にエラーが表示される。
to-encoding の後ろに文字列 //TRANSLIT が付いていた場合、 変換される文字の書き直し (transliterate) が必要で可能な場合、書き直しが行われる。 変換先の文字集合で文字が表現できない場合、 変換先の文字集合の文字に近似されることを意味する (1 文字の場合も複数文字の場合もある)。 変換先の文字集合外の文字で、書き直しもできない文字は、 出力では疑問符 (?) に置き換えられる。
成功すると 0 で、 エラーの場合 0 以外。
内部では、 iconv プログラムは iconv(3) 関数を使用する。 iconv(3) 関数は順に gconv モジュール (動的にロードされる共有ライブラリ) を使って、 変換元、変換先の文字集合を取り扱う。 iconv(3) を呼び出す前に、 iconv プログラムは最初に iconv_open(3) を使って変換ディスクリプターを割り当てる。 iconv_open(3) の動作は GCONV_PATH 環境変数の設定の影響を受ける。
POSIX.1-2001.
テキストを ISO 8859-15 文字符号化から UTF-8 に変換する。
$ iconv -f ISO-8859-15 -t UTF-8 < input.txt > output.txt
以下の例は UTF-8 から ASCII への変換を行い、 可能であれば書き直し (transliterate) を行う。
$ echo abc ß α € àḃç | iconv -f UTF-8 -t ASCII//TRANSLIT abc ss ? EUR abc
locale(1), iconv(3), nl_langinfo(3), charsets(7), iconvconfig(8)
この man ページは Linux man-pages プロジェクトのリリース 3.79 の一部 である。プロジェクトの説明とバグ報告に関する情報は http://www.kernel.org/doc/man-pages/ に書かれている。
2014-07-08 | GNU |