Linux - NKF で「かな・カナ・記号」の変換!

Updated:


漢字コード変換フィルタ NKF でひらがな・カタカナ・記号の各種変換を行なってみました。

プログラミングでは頻繁に使用することのあるツールですが、コマンドラインから単独で使用することが(個人的には)今まであまりなかったので、備忘録として記録しておきます。

0. 前提条件

  • Linux Mint 13 での作業を想定。
    (他の Linux ディストリビューションでも同様)
  • 実行環境の文字コードは utf-8 を想定。

1. インストール

以下のようにしてインストールするか、Synaptic パッケージマネージャでインストールする。
(最新バージョンをインストールしたければ、ソースをビルドしてインストールする)

$ sudo apt-get install nkf

インストールできているかバージョン情報を表示して確認してみる。

$ nkf -v
Network Kanji Filter Version 2.1.1 (2010-08-08)
Copyright (C) 1987, FUJITSU LTD. (I.Ichikawa).
Copyright (C) 1996-2010, The nkf Project.

2. 「ひらがな => カタカナ」変換

ひらがなをカタカナに変換してみる。

$ echo 漢字かな混じり文変換。 | nkf --katakana
漢字カナ混ジリ文変換。

3. 「カタカナ => ひらがな」変換

全角・半角カタカナをひらがなに変換してみる。

$ echo 漢字カナ・カナ混じり文変換。 | nkf --hiragana
漢字かな・かな混じり文変換。

4. 「カタカナ <=> ひらがな」相互変換

ひらがなと全角・半角カタカナを相互に変換してみる。(半角カタカナは全角ひらがなに)

$ echo 漢字かな・カナ・カナ混じり文変換。 | nkf --katakana-hiragana
漢字カナ・かな・かな混ジリ文変換。

半角カタカナを半角のまま維持したければ、-x を使用する。

5. 「半角カタカナ => 全角カタナカ」変換

半角カタカナを全角カタナカに変換してみる。

$ echo 漢字カナ混じり文変換。 | nkf -X
漢字カナ混じり文変換。

6. 「全角文字 => 半角文字」変換

全角文字を半角文字に変換してみる。

echo 漢字カナ混じり文変換。A1Bー2 | nkf -Z4
漢字カナ混じり文変換。A1Bー2

-Z4 は、JISX0208 から JISX0201 への変換なので、全角英数字・記号も半角に変換される。

7. 参考サイト


当然、 nkf コマンドでは文字の変換ばかりでなく文字コードの変換等も可能です。ヘルプ等でご確認ください。

以上。





 

Sponsored Link

 

Comments