Tips

4Dのひらがな・カタカナの検索の規則について

日付2000/01/31
ID00-006
バージョン
プラットフォーム

日本語(漢字/ひらがな/カタカナ)の文字を判断する4Dのルール。

基本ルール

4Dは、日本語の文字を、漢字の場合は漢字コードによって2つの文字が等しいかどうかを判断します。ひらがな、カタカナについては、次の4つの基本ルールがあります。

  1. ひらがなとカタカナ
  2. 仮名の大きな文字と小さな文字
  3. カタカナの1バイトと2バイト
  4. 清音、濁音、半濁音

加えて、例外があります。

ルール1.ひらがなとカタカナ

ひらがなとカタカナは同じ文字として扱います。

例.「ひ」「ヒ」は同じ文字と判断します。

ルール2.仮名の大きな文字と小さな文字(拗音)

仮名の大きな文字と小さな文字は同じ文字として扱います。

例.「よ」「ょ」は同じ文字と判断します。

ルール3.カタカナの1バイトと2バイト

カタカナでは、1バイトと2バイトは同じ文字として扱います。

例.「ハ」「ハ」は同じ文字と判断します。

ルール4.清音、濁音、半濁音

清音、濁音、半濁音はそれぞれ別の文字として扱います。

例.「は」と「ば」と「ぱ」は異なる文字と判断します。

例外.「ヴ」の扱いについて

カタカナの「ヴ」は該当するひらがながない特殊な文字です。4Dではこれを清音の「う」と同じグループと判断します。したがって「う」「ぅ」「ウ」「ゥ」「ウ」「ヴ」は同じ文字として扱います。

「う+ ゛」、「ウ+゛」については、それぞれ特別に組み合わせた結果の文字として扱い、その組み合わせではどちらも「う」のグループでないと判断します。

したがって、「う゛」の文字を検索した場合、「ヴ」も「ヴ」も等しいとは判断しません。この例外は、将来のバージョンで再考される可能性があります。

検索対象:
う、ぅ、ウ、ゥ、 ウ、 ヴ、