Linux - NKF で「かな・カナ・記号」の変換!
Updated:
漢字コード変換フィルタ NKF でひらがな・カタカナ・記号の各種変換を行なってみました。
プログラミングでは頻繁に使用することのあるツールですが、コマンドラインから単独で使用することが(個人的には)今まであまりなかったので、備忘録として記録しておきます。
0. 前提条件
- Linux Mint 13 での作業を想定。
(他の Linux ディストリビューションでも同様) - 実行環境の文字コードは utf-8 を想定。
1. インストール
以下のようにしてインストールするか、Synaptic パッケージマネージャでインストールする。
(最新バージョンをインストールしたければ、ソースをビルドしてインストールする)
$ sudo apt-get install nkf
インストールできているかバージョン情報を表示して確認してみる。
$ nkf -v
Network Kanji Filter Version 2.1.1 (2010-08-08)
Copyright (C) 1987, FUJITSU LTD. (I.Ichikawa).
Copyright (C) 1996-2010, The nkf Project.
2. 「ひらがな => カタカナ」変換
ひらがなをカタカナに変換してみる。
$ echo 漢字かな混じり文変換。 | nkf --katakana
漢字カナ混ジリ文変換。
3. 「カタカナ => ひらがな」変換
全角・半角カタカナをひらがなに変換してみる。
$ echo 漢字カナ・カナ混じり文変換。 | nkf --hiragana
漢字かな・かな混じり文変換。
4. 「カタカナ <=> ひらがな」相互変換
ひらがなと全角・半角カタカナを相互に変換してみる。(半角カタカナは全角ひらがなに)
$ echo 漢字かな・カナ・カナ混じり文変換。 | nkf --katakana-hiragana
漢字カナ・かな・かな混ジリ文変換。
半角カタカナを半角のまま維持したければ、-x
を使用する。
5. 「半角カタカナ => 全角カタナカ」変換
半角カタカナを全角カタナカに変換してみる。
$ echo 漢字カナ混じり文変換。 | nkf -X
漢字カナ混じり文変換。
6. 「全角文字 => 半角文字」変換
全角文字を半角文字に変換してみる。
echo 漢字カナ混じり文変換。A1Bー2 | nkf -Z4
漢字カナ混じり文変換。A1Bー2
-Z4
は、JISX0208 から JISX0201 への変換なので、全角英数字・記号も半角に変換される。
7. 参考サイト
当然、 nkf
コマンドでは文字の変換ばかりでなく文字コードの変換等も可能です。ヘルプ等でご確認ください。
以上。
Comments