4Dのひらがな・カタカナの検索の規則について
日付 | 2000/01/31 |
---|---|
ID | 00-006 |
バージョン | |
プラットフォーム |
日本語(漢字/ひらがな/カタカナ)の文字を判断する4Dのルール。
基本ルール
4Dは、日本語の文字を、漢字の場合は漢字コードによって2つの文字が等しいかどうかを判断します。ひらがな、カタカナについては、次の4つの基本ルールがあります。
- ひらがなとカタカナ
- 仮名の大きな文字と小さな文字
- カタカナの1バイトと2バイト
- 清音、濁音、半濁音
加えて、例外があります。
ルール1.ひらがなとカタカナ
ひらがなとカタカナは同じ文字として扱います。
例.「ひ」「ヒ」は同じ文字と判断します。
ルール2.仮名の大きな文字と小さな文字(拗音)
仮名の大きな文字と小さな文字は同じ文字として扱います。
例.「よ」「ょ」は同じ文字と判断します。
ルール3.カタカナの1バイトと2バイト
カタカナでは、1バイトと2バイトは同じ文字として扱います。
例.「ハ」「ハ」は同じ文字と判断します。
ルール4.清音、濁音、半濁音
清音、濁音、半濁音はそれぞれ別の文字として扱います。
例.「は」と「ば」と「ぱ」は異なる文字と判断します。
例外.「ヴ」の扱いについて
カタカナの「ヴ」は該当するひらがながない特殊な文字です。4Dではこれを清音の「う」と同じグループと判断します。したがって「う」「ぅ」「ウ」「ゥ」「ウ」「ヴ」は同じ文字として扱います。
「う+ ゛」、「ウ+゛」については、それぞれ特別に組み合わせた結果の文字として扱い、その組み合わせではどちらも「う」のグループでないと判断します。
したがって、「う゛」の文字を検索した場合、「ヴ」も「ヴ」も等しいとは判断しません。この例外は、将来のバージョンで再考される可能性があります。
検索対象:
う、ぅ、ウ、ゥ、 ウ、 ヴ、