非常用漢字の探し方

最終更新
2005年12月21日

はじめに

ここでは主に日本国内におけるWEBページ作成者が、通常使用されない漢字を使用してhtmlを作成するにはどうすればいいのかについて簡単に説明します。

非常用漢字を使用するには

我々が普段使用しない文字をWEBページで使用するにはいくつか方法があると思いますが、私がその中で簡単だと思うのは、すべての文字においてUTF-16などで割り当てられている数値を入力し、それをブラウザに解釈させるのが最も手っ取り早くかつ安全な方法だと思います。正しい数値を入力しておけばあとは閲覧者の実装次第で可視・不可視が決まりますから、実際の表示如何は閲覧者に任せるとして、我々情報の発信者は正しい表記を書いておくだけで事足りるのです。

文字にはそれぞれ数値や名前が与えられています。たとえば日本語の「あ」は、Hiragana(ひらがな)ブロックの中にあり、“HIRAGANA LETTER A”という名称がつけられています。コードは3042で、UTF-32においても00003042となっています。したがって「あ」という表記は、「あ」と記述すれば良いことになります。

もっともすべての場合においてコードナンバーを入力するのは手間がかかります。それに、「これは日本語で書かれたhtmlです」と宣言したのであれば、「あ」を「あ」とかかずに直接「あ」と書いたところで文句は言われないでしょう。コードによる入力に頼るのは、本来求められるべき記述とは違う場合に限定しても良いと思います。

たとえば曹操を支えた荀彧の「彧」の字は通常使用を認められていない文字なので、「彧」と入力します。彧の字はUTF-16において5f67という数値が与えられているからです。5f67という数値を提供して閲覧者が彧の字を表示できなかったとしても、それは閲覧者の実装の問題に過ぎないので作成者側が憂慮するものではありません。

補助ソフト

ではそのコードを探すにはどうすれば良いか?ですが、私がお勧めするのはBabelMapと呼ばれるフリーソフトです。このソフトは無料で利用でき、ほとんどすべての文字の詳細な情報が手に入ります。またピンイン情報なども載っているので、中国語の発音を比べたいときにも使えます。

Babel Map:http://www.babelstone.co.uk/Software/BabelMap.html

Babel Map使用法

では実際に起動させて見ましょう。

BabelMap起動後画面

はい、出ましたね。実に多くの情報が現れましたが、使い方については追々説明していきます。細かい説明はさておき実際にチュートリアルを行ってみましょう。

言い忘れましたが、非常用漢字であるか否かを判断するのが面倒な人はWWWChtmlチェッカーに作成したhtmlを入れてみれば良いです。おかしければ何行目がおかしいよ、と英語で教えてくれます。難しい英語ではないので読めます。

非常用漢字を探してみよう

三国志関係の話のほうが分かりやすいでしょうから、蜀漢【しょくかん】を滅ぼした魏の名将である鄧艾【とうがい】を探してみます。いちおうWindows系であればそのまま書いてもらっても認識するのですが、結論から言うと鄧の字は非常用漢字です。そのまま入力するとValidatorでエラーが出ますので確認してください。

鄧の字のナンバーは現時点では分からないとします。ここで鄧の字にたどり着くにはIMEパッドの手書きツールを使うか、部首で同系列の文字を探すかの二通りが考えられそうです。鄧の字で部首に使っているのは右側のもの。都とか郷とか邸とかが仲間ですね。彼らのナンバーがそれぞれ90FD、90F7、90B8なので鄧もそのあたりにあるんだろうなと言う推定方法もありますけど、通常、都のコードナンバーを知っている人は少ないのでこの方法はここでは除外しましょう。

部首からさがしてみよう

ではさっそくですが、日本語IMEパッドを開いてみます。

IMEを開く/部首検索

部首が「おおざと」(3画)になるのは日本人的に問題無いですね。

部首「おおざと」から検索

そしてこの鄧の字を、BabelMapのEditBufferにぶち込みます。

EditBufferに入力する

コードナンバーは今回は16進数で求めたいのでNCRをクリックします。

コードナンバーを取得する

これで鄧の字はコードナンバー9127であることが分かりました。実際にナンバー9127にジャンプしてみましょう。

9127をチェックする

これで鄧の字は鄧と入力すれば良いと分かりました。あとは単語入力でもしてPCに学習させてください。

むすび

とりあえずBabelMapの簡単な使用法は以上です。部首で分からない場合は総画数や手書きで探すと良いでしょう。余談ですが、文字のコードは世界共通なので、たとえばテレビゲームなどで文字情報を書き換える作業を行いたいときにも、このナンバー探しは使えます。

ちなみにBabelMap表示中に黒ポッチで表記されているのは、そのフォントでは表示できない文字です。フォントをハングル文字にすればハングルが表記できますし、同様にアラビア語も表記できます。実際中国史を見ていると日本語フォントでは表示しきれない文字も多数登場しますので、画数だの部首だのから計算して総当りで確認してください。

なおブラウザの実装についてですが、現状ではInternetExplorer以外であればたいてい問題なく表示できるはずです。とはいえ世界中でもっとも使用されているブラウザはInternetExplorerなので、こだわりがあるひとは無理に非常用漢字を使用する必要は無いかもしれません。ブラウザの実装を考慮してhtmlを作成するというのも妙な話ですけど。

おまけですが、その文字に対する詳細な情報が欲しい場合はPropertiesをクリック。いろいろ楽しめます。

This is Chinese GARDEN/ created by SILVA