漢字コード変換フィルタ NKF でひらがな・カタカナ・記号の各種変換を行なってみました。
プログラミングでは頻繁に使用することのあるツールですが、コマンドラインから単独で使用することが(個人的には)今まであまりなかったので、備忘録として記録しておきます。
0. 前提条件
- Linux Mint 13 での作業を想定。
(他の Linux ディストリビューションでも同様) - 実行環境の文字コードは utf-8 を想定。
1. インストール
以下のようにしてインストールするか、Synaptic パッケージマネージャでインストールする。
(最新バージョンをインストールしたければ、ソースをビルドしてインストールする)
1
|
|
インストールできているかバージョン情報を表示して確認してみる。
1 2 3 4 |
|
2. 「ひらがな => カタカナ」変換
ひらがなをカタカナに変換してみる。
1 2 |
|
3. 「カタカナ => ひらがな」変換
全角・半角カタカナをひらがなに変換してみる。
1 2 |
|
4. 「カタカナ <=> ひらがな」相互変換
ひらがなと全角・半角カタカナを相互に変換してみる。(半角カタカナは全角ひらがなに)
1 2 |
|
半角カタカナを半角のまま維持したければ、-x
を使用する。
5. 「半角カタカナ => 全角カタナカ」変換
半角カタカナを全角カタナカに変換してみる。
1 2 |
|
6. 「全角文字 => 半角文字」変換
全角文字を半角文字に変換してみる。
1 2 |
|
-Z4
は、JISX0208 から JISX0201 への変換なので、全角英数字・記号も半角に変換される。
7. 参考サイト
当然、 nkf
コマンドでは文字の変換ばかりでなく文字コードの変換等も可能です。ヘルプ等でご確認ください。
以上。