Unicode照合アルゴリズム
表示
Unicode |
---|
文字符号化スキーム |
UTF-7 |
UTF-8 |
CESU-8 |
UTF-16 |
UTF-32 |
UTF-EBCDIC |
SCSU |
Punycode (IDN/IDNA) |
GB 18030 |
その他 |
UCS |
マッピング |
書字方向 |
BOM |
漢字統合 |
UnicodeとHTML |
Unicodeと電子メール |
Unicodeフォント |
Unicode照合アルゴリズム(ユニコードしょうごうアルゴリズム、英: Unicode collation algorithm、略称: UCA)とは、2つのUnicode文字列を比較するアルゴリズムを定義したものである。これによって言語的に正しい大文字小文字変換、ソートが行える。
概要
[編集]Unicode照合アルゴリズムは、Unicodeテクニカル・レポート#10に規定されたアルゴリズムで、2つの文字列を比較する方式であり、カスタマイズ可能である。Unicodeで表現可能な文字および言語ならどんな種類のテキストでも、照合ないしソートの際にこのアルゴリズムが利用できる。
Unicodeテクニカルレポート#10は、デフォルトUnicode照合基本テーブル(Default Unicode Collation Element Table、略称DUCET)についても規定している。DUCETは言語ごとにカスタマイズ可能である。カスタマイズされたテーブルの一部は、共通ロケールデータリポジトリ(Common Locale Data Repository、CLDR)に収録されている。
オープンソースによる大規模なUnicode照合アルゴリズムの実装が、International Components for Unicode(ICU)計画によって行われている。ICUは地域化もサポートしており、CLDRをもとにしたUnicode照合の地域化がICUに含まれている。オンラインで参照できるICUロケールエクスプローラーを見れば、地域化の概要と相当数の各言語データがわかる。
関連項目
[編集]外部リンク
[編集]- “UTS #10: Unicode Collation Algorithm” (英語). Unicode Consortium (2012年2月1日). 2012年7月5日閲覧。