Linuxコマンド【 iconv 】ファイルの文字コードを変換する
当ページのリンクには広告が含まれています。
スポンサーリンク
iconvコマンドは、指定した入力ファイルの文字コードを変換するコマンドです。
iconvコマンド
書式
iconv [オプション] [入力ファイル]
cf. » nkfコマンド - 文字コードを変換
オプション
-c | 変換できなかった文字を出力から除きます。 |
-f 文字コード | 変換前の文字コード(エンコーディング)を指定します。 |
-l | 文字コードの一覧を表示します。 |
-o 出力ファイル | 出力ファイルを指定します。 |
-t 文字コード | 変換後の文字コード(エンコーディング)を指定します。 |
使用例
まず、文字コードに一覧を表示します(オプション -l)。コマンドを実行するとやたらと多くの文字コードが表示されます。
$ iconv -l The following list contain all the coded character sets known. This does not necessarily mean that all combinations of these names can be used for the FROM and TO command line parameters. One coded character set can be listed with several different names (aliases). 437, 500, 500V1, 850, 851, 852, 855, 856, 857, 860, 861, 862, 863, 864, 865, 866, 866NAV, 869, 874, 904, 1026, 1046, 1047, 8859_1, 8859_2, 8859_3, 8859_4, 8859_5, 8859_6, 8859_7, 8859_8, 8859_9, 10646-1:1993, 10646-1:1993/UCS4, ANSI_X3.4-1968, ANSI_X3.4-1986, ANSI_X3.4, ANSI_X3.110-1983, ANSI_X3.110, ARABIC, ARABIC7, ARMSCII-8, ASCII, ASMO-708, ASMO_449, BALTIC, BIG-5, … 中略 … SEN_850200_C, SHIFT-JIS, SHIFT_JIS, SHIFT_JISX0213, SJIS-OPEN, SJIS-WIN, SJIS, SS636127, STRK1048-2002, ST_SEV_358-88, T.61-8BIT, T.61, T.618BIT, TCVN-5712, TCVN, TCVN5712-1, TCVN5712-1:1993, THAI8, TIS-620, TIS620-0, TIS620.2529-1, TIS620.2533-0, TIS620, TS-5881, TSCII, TURKISH8, UCS-2, UCS-2BE, UCS-2LE, UCS-4, UCS-4BE, UCS-4LE, UCS2, UCS4, UHC, UJIS, UK, UNICODE, UNICODEBIG, UNICODELITTLE, US-ASCII, US, UTF-7, UTF-8, UTF-16, UTF-16BE, UTF-16LE, UTF-32, UTF-32BE, UTF-32LE, UTF7, UTF8, UTF16, UTF16BE, … 略 …
UTF-8 のテキストファイル「hoge.txt」を EUC-JP に変換し、ファイル「foo.txt」に出力します。
$ iconv -f UTF-8 -t EUC-JP hoge.txt -o foo.txt