オリヤー文字 (Unicodeのブロック)
オリヤー文字 (Unicodeのブロック) | |
---|---|
Oriya | |
範囲 |
U+0B00..U+0B7F (128 個の符号位置) |
面 | 基本多言語面 |
用字 | オリヤー文字 |
主な言語・文字体系 |
|
割当済 | 90 個の符号位置 |
未使用 | 38 個の保留 |
Unicodeのバージョン履歴 | |
1.0.0 | 77 (+77) |
1.1 | 78 (+1) |
4.0 | 80 (+2) |
5.1 | 83 (+3) |
6.0 | 89 (+6) |
13.0 | 90 (+1) |
公式ページ | |
コード表 ∣ ウェブページ |
オリヤー文字(オリヤーもじ、英語: Oriya)は、Unicodeの27個目のブロック。
解説
[編集]インド東部のオリッサ州などで話されているオリヤー語を表記するためのオリヤー文字を収録している。
オリヤー文字はデーヴァナーガリーなどの他の多くの南アジアの文字体系と同様に、ブラーフミー文字から派生したいわゆるブラーフミー系文字(インド系文字)の一つであり、音素文字のうち子音字単独では短母音/-a/(現在のオリヤー語では[ɔ])を伴って発音され、別の母音にする際に母音記号を付加することで発音を切り替えるアブギダに分類される。母音記号はものによっては文字の左側に付けられることがあるが、Unicodeにおいては子音字→母音記号の順に入力することとなっており、符号上の文字の置かれる順序と実際のレンダーにおける表示順とが入れ替わる場合がある。
また、デーヴァナーガリー同様頭子音を伴わない単独の母音にも子音字同様に独立した文字が充てられており、子音連続など子音のみで発音する場合は半子音字(英語: half-form)と呼ばれる形に変化したり、特殊な子音字同士の合字を形成したり、あるいは単に殺母音記号であるヴィラーマという記号を子音字の下に付加したりする。
書字方向はラテン文字やキリル文字などと同様に左から右へと横書き(左横書き)し、下に行を送り、単語毎に分かち書きをする。なお、デーヴァナーガリーやベンガル文字とは異なり文字の上部に水平線(シローレーカー)は持たない。
子音字は有声音と無声音の弁別に加えて、有気音であるか無気音であるかを区別する。そのため、各調音点における破裂音には計4種類の子音字が存在する。また、母音字については母音の長短によって文字が分けられている。
符号位置の順序はおおむね伝統的なブラーフミー系文字の順序に従っている。
加えて、アラビア文字やタイ文字などと同様に独自の数字体系(オリヤー数字)を有している。
Unicodeのバージョン1.0においても「オリヤー文字(Oriya)」というブロック名で制定されていた。[1]なお、2012年からこの文字と言語の「オリヤー(Oriya)」という名前は、インドでは正式には「オディア(Odia)」と綴られているが、この綴りの変更は、安定性の保証によって制約されている Unicode ブロックまたは文字名には影響しない。[2]
収録文字
[編集]「ラテン文字転写」の列はブラーフミー系文字のラテン文字への翻字方式の一つであるISO 15919に従う。
コード | 文字 | 文字名(英語) | 用例・説明 | ラテン文字転写 |
---|---|---|---|---|
各種記号 | ||||
U+0B01 | ଁ | ORIYA SIGN CANDRABINDU | チャンドラビンドゥ。
母音字や母音記号に付き、母音を鼻母音で発音することを表す。 |
m̐ |
U+0B02 | ଂ | ORIYA SIGN ANUSVARA | アヌスヴァーラ。 | ṁ |
U+0B03 | ଃ | ORIYA SIGN VISARGA | ヴィサルガ。
音節末に[h]を伴うことを表す。 |
ḥ |
独立母音字 | ||||
U+0B05 | ଅ | ORIYA LETTER A | 短母音[ɔ]を表す。 | a |
U+0B06 | ଆ | ORIYA LETTER AA | 長母音[aː]を表す。 | ā |
U+0B07 | ଇ | ORIYA LETTER I | 短母音[i]を表す。 | i |
U+0B08 | ଈ | ORIYA LETTER II | 長母音[iː]を表す。 | ī |
U+0B09 | ଉ | ORIYA LETTER U | 母音[u]を表す。 | u |
U+0B0A | ଊ | ORIYA LETTER UU | 長母音[uː]を表す。 | ū |
U+0B0B | ଋ | ORIYA LETTER VOCALIC R | 音節主音化した短母音としてのR(IPA:[ɹ̩])を表す。
現在のオリヤー語では[ru]と発音される。 |
r̥[3] |
U+0B0C | ଌ | ORIYA LETTER VOCALIC L | 音節主音化した短母音としてのL(IPA:[l̩])を表す。
現在のオリヤー語では[lu]と発音される。 |
l̥[4] |
U+0B0D | (予約済) | ê | ||
U+0B0E | (予約済) | ĕ | ||
U+0B0F | ଏ | ORIYA LETTER E | 長母音[eː]を表す。 | e |
U+0B10 | ଐ | ORIYA LETTER AI | 二重母音[ɔɪ]を表す。 | ai |
U+0B11 | (予約済) | ô | ||
U+0B12 | (予約済) | ŏ | ||
U+0B13 | ଓ | ORIYA LETTER O | 母音[ɔ]を表す。 | o |
U+0B14 | ଔ | ORIYA LETTER AU | 二重母音[ɔʊ]を表す。 | au |
子音字 | ||||
U+0B15 | କ | ORIYA LETTER KA | 子音[k]を表す。 | k |
U+0B16 | ଖ | ORIYA LETTER KHA | 子音[kʰ]を表す。 | kh |
U+0B17 | ଗ | ORIYA LETTER GA | 子音[ɡ]を表す。 | g |
U+0B18 | ଘ | ORIYA LETTER GHA | 子音[ɡʱ]を表す。 | gh |
U+0B19 | ଙ | ORIYA LETTER NGA | 子音[ŋ]を表す。 | ṅ |
U+0B1A | ଚ | ORIYA LETTER CA | 子音[c]を表す。 | c |
U+0B1B | ଛ | ORIYA LETTER CHA | 子音[cʰ]を表す。 | ch |
U+0B1C | ଜ | ORIYA LETTER JA | 子音[ɟ]を表す。 | j |
U+0B1D | ଝ | ORIYA LETTER JHA | 子音[ɟʱ]を表す。 | jh |
U+0B1E | ଞ | ORIYA LETTER NYA | 子音[ɲ]を表す。 | ñ |
U+0B1F | ଟ | ORIYA LETTER TTA | 子音[ʈ]を表す。 | ṭ |
U+0B20 | ଠ | ORIYA LETTER TTHA | 子音[ʈʰ]を表す。 | ṭh |
U+0B21 | ଡ | ORIYA LETTER DDA | 子音[ɖ]を表す。 | ḍ |
U+0B22 | ଢ | ORIYA LETTER DDHA | 子音[ɖʱ]を表す。 | ḍh |
U+0B23 | ଣ | ORIYA LETTER NNA | 子音[ɳ]を表す。 | ṇ |
U+0B24 | ତ | ORIYA LETTER TA | 子音[t]を表す。 | t |
U+0B25 | ଥ | ORIYA LETTER THA | 子音[tʰ]を表す。 | th |
U+0B26 | ଦ | ORIYA LETTER DA | 子音[d]を表す。 | d |
U+0B27 | ଧ | ORIYA LETTER DHA | 子音[dʱ]を表す。 | dh |
U+0B28 | ନ | ORIYA LETTER NA | 子音[n]を表す。 | n |
U+0B29 | (予約済) | ṉ | ||
U+0B2A | ପ | ORIYA LETTER PA | 子音[p]を表す。 | p |
U+0B2B | ଫ | ORIYA LETTER PHA | 子音[pʰ]を表す。 | ph |
U+0B2C | ବ | ORIYA LETTER BA | 子音[b]を表す。 | b |
U+0B2D | ଭ | ORIYA LETTER BHA | 子音[bʱ]を表す。 | bh |
U+0B2E | ମ | ORIYA LETTER MA | 子音[m]を表す。 | m |
U+0B2F | ଯ | ORIYA LETTER YA | 子音[d͡ʒ]を表す。
元々は[j]を表していた。 |
y |
U+0B30 | ର | ORIYA LETTER RA | 子音[r]を表す。 | r |
U+0B31 | (予約済) | ṟ / r̆[5] | ||
U+0B32 | ଲ | ORIYA LETTER LA | 子音[l]を表す。 | l |
U+0B33 | ଳ | ORIYA LETTER LLA | 子音[ɭ]を表す。 | ḷ |
U+0B34 | (予約済) | ḻ | ||
U+0B35 | ଵ | ORIYA LETTER VA | 子音[w]を表す。ただし通常のオリヤー語では/b/と/v/を区別しない。 | v |
U+0B36 | ଶ | ORIYA LETTER SHA | 子音[s]を表す。 | ś |
U+0B37 | ଷ | ORIYA LETTER SSA | 子音[s]を表す。 | ṣ |
U+0B38 | ସ | ORIYA LETTER SA | 子音[s]を表す。 | s |
U+0B39 | ହ | ORIYA LETTER HA | 子音[h]を表す。 | h |
各種記号 | ||||
U+0B3C | ଼ | ORIYA SIGN NUKTA | ヌクター。子音字を拡張して新たな発音を表す際に用いられる。[2] | |
U+0B3D | ଽ | ORIYA SIGN AVAGRAHA | アヴァグラハ。連音(サンディ)によって語頭の母音 a が消えたことを表す。 | ’ |
従属母音記号 | ||||
U+0B3E | ା | ORIYA VOWEL SIGN AA | 長母音[aː]を表す。 | ā |
U+0B3F | ି | ORIYA VOWEL SIGN I | 短母音[i]を表す。 | i |
U+0B40 | ୀ | ORIYA VOWEL SIGN II | 長母音[iː]を表す。 | ī |
U+0B41 | ୁ | ORIYA VOWEL SIGN U | 母音[u]を表す。 | u |
U+0B42 | ୂ | ORIYA VOWEL SIGN UU | 長母音[uː]を表す。 | ū |
U+0B43 | ୃ | ORIYA VOWEL SIGN VOCALIC R | 音節主音化した短母音としてのR(IPA:[ɹ̩])を表す。
現在のオリヤー語では[ru]と発音される。 |
r̥[3] |
U+0B44 | ୄ | ORIYA VOWEL SIGN VOCALIC RR | 音節主音化した長母音としてのR(IPA:[ɹ̩ː])を表す。
現在のオリヤー語では[ruː]と発音される。 |
r̥̄[7] |
U+0B45 | (予約済) | ê | ||
U+0B46 | (予約済) | ĕ | ||
U+0B47 | େ | ORIYA VOWEL SIGN E | 長母音[eː]を表す。
文字の左側にレンダーされるため、符号上の文字順序と表示上の順序とが入れ替わる。[2] |
e |
U+0B48 | ୈ | ORIYA VOWEL SIGN AI | 二重母音[ɔɪ]を表す。
文字の左側と上側の2箇所にレンダーされるため、符号上の文字順序と表示上の順序とが入れ替わる。[2] |
ai |
U+0B49 | (予約済) | ô | ||
U+0B4A | (予約済) | |||
2要素からなる従属母音記号 | ||||
U+0B4B | ୋ | ORIYA VOWEL SIGN O | 母音[ɔ]を表す。 | o |
U+0B4C | ୌ | ORIYA VOWEL SIGN AU | 二重母音[ɔʊ]を表す。 | au |
ヴィラーマ | ||||
U+0B4D | ୍ | GUJARATI SIGN VIRAMA | ヴィラーマ(殺母音記号)。母音/-a/を発音せず子音のみが読まれることを表す。
レンダー上は次の文字と繋がって合字を形成したり、半子音字形(half-form)と呼ばれる形状に変化する。文字によってはただ単にヴィラーマ記号が子音字の下に書かれることもある。 |
|
各種記号 | ||||
U+0B55 | ୕ | ORIYA SIGN OVERLINE | インドで話されるクヴィ語で長母音を表すのに用いられる。[2][8] | |
U+0B56 | ୖ | ORIYA AI LENGTH MARK | ||
U+0B57 | ୗ | ORIYA AU LENGTH MARK | ||
追加の子音字 | ||||
U+0B5C | ଡ଼ | ORIYA LETTER RRA | 子音[ɽ]を表す。 | ṛ |
U+0B5D | ଢ଼ | ORIYA LETTER RHA | 子音[ɽʱ]を表す。 | ṛh |
U+0B5E | (予約済) | f | ||
U+0B5F | ୟ | ORIYA LETTER YYA | 子音[j]を表す。 | ẏ |
サンスクリット語用の追加母音字 | ||||
U+0B60 | ୠ | ORIYA LETTER VOCALIC RR | 音節主音化した長母音としてのR(IPA:[ɹ̩ː])を表す。
現在のオリヤー語では[ruː]と発音される。 |
r̥̄[7] |
U+0B61 | ୡ | ORIYA LETTER VOCALIC LL | 音節主音化した長母音としてのL(IPA:[l̩ː])を表す。
現在のオリヤー語では[luː]と発音される。 |
l̥̄[9] |
従属母音記号 | ||||
U+0B62 | ୢ | ORIYA VOWEL SIGN VOCALIC L | 音節主音化した短母音としてのL(IPA:[l̩])を表す。
現在のオリヤー語では[lu]と発音される。 |
l̥[4] |
U+0B63 | ୣ | ORIYA VOWEL SIGN VOCALIC LL | 音節主音化した長母音としてのL(IPA:[l̩ː])を表す。
現在のオリヤー語では[luː]と発音される。 |
l̥̄[9] |
予約済 | ||||
U+0B64 | (予約済) | . | ||
U+0B65 | (予約済) | |||
数字 | ||||
U+0B66 | ୦ | ORIYA DIGIT ZERO | オリヤー文字における数字の0。 | 0 |
U+0B67 | ୧ | ORIYA DIGIT ONE | オリヤー文字における数字の1。 | 1 |
U+0B68 | ୨ | ORIYA DIGIT TWO | オリヤー文字における数字の2。 | 2 |
U+0B69 | ୩ | ORIYA DIGIT THREE | オリヤー文字における数字の3。 | 3 |
U+0B6A | ୪ | ORIYA DIGIT FOUR | オリヤー文字における数字の4。 | 4 |
U+0B6B | ୫ | ORIYA DIGIT FIVE | オリヤー文字における数字の5。 | 5 |
U+0B6C | ୬ | ORIYA DIGIT SIX | オリヤー文字における数字の6。 | 6 |
U+0B6D | ୭ | ORIYA DIGIT SEVEN | オリヤー文字における数字の7。 | 7 |
U+0B6E | ୮ | ORIYA DIGIT EIGHT | オリヤー文字における数字の8。 | 8 |
U+0B6F | ୯ | ORIYA DIGIT NINE | オリヤー文字における数字の9。 | 9 |
記号 | ||||
U+0B70 | ୰ | ORIYA ISSHAR | 神の名前を表す。 | |
追加の子音字 | ||||
U+0B71 | ୱ | ORIYA LETTER WA | 子音[w]を表す。 | w |
翻字用記号 | ||||
U+0B72 | ୲ | ORIYA FRACTION ONE QUARTER | 数値としての4分の1を表す。 | |
U+0B73 | ୳ | ORIYA FRACTION ONE HALF | 数値としての2分の1を表す。 | |
U+0B74 | ୴ | ORIYA FRACTION THREE QUARTERS | 数値としての4分の3を表す。 | |
U+0B75 | ୵ | ORIYA FRACTION ONE SIXTEENTH | 数値としての16分の1を表す。 | |
U+0B76 | ୶ | ORIYA FRACTION ONE EIGHTH | 数値としての8分の1を表す。 | |
U+0B77 | ୷ | ORIYA FRACTION THREE SIXTEENTHS | 数値としての16分の3を表す。 |
小分類
[編集]このブロックの小分類は「各種記号」(Various signs)、「独立母音字」(Independent vowels)、「子音字」(Consonants)、「従属母音記号」(Dependent vowel signs)、「2要素からなる従属母音記号」(Two-part dependent vowel signs)、「ヴィラーマ」(Virama)、「追加の子音字」(Additional consonants)、「サンスクリット語用の追加母音字」(Additional vowels for Sanskrit)、「予約済」(Reserved)、「数字」(Digits)、「記号」(Sign)、「分数記号」(Fraction signs)の12個となっている。[2]本ブロックでは、Unicodeのバージョン更新時の文字追加が隙間を埋める形で行われた影響で、同一の小分類に属する文字が飛び飛びの符号位置に割り当てられていることがある。
各種記号(Various signs)
[編集]この小分類にはオリヤー文字のうち、母音字や子音字に結合する発音記号などの様々な記号が収録されている。
独立母音字(Independent vowels)
[編集]この小分類にはオリヤー文字のうち、頭子音のない母音の音節を表す際に用いられる独立した母音字が収録されている。
子音字(Consonants)
[編集]この小分類にはオリヤー文字のうち、基本的な子音字が収録されている。子音字は何も母音記号が付かない場合は母音/-a/を伴って発音される。
従属母音記号(Dependent vowel signs)
[編集]この小分類にはオリヤー文字のうち、子音字に結合する母音記号が収録されている。文字によっては子音字の左側に結合されるため文字の符号上の順序とレンダー上の順序が入れ替わる場合があり、また、組み合わせる先の子音字によっては特殊な合字を形成することがある。
2要素からなる従属母音記号(Two-part dependent vowel signs)
[編集]これらの母音記号には、子音の両側にグリフ部分があり、論理的な順序で子音に続くため、ほとんどの処理では 1 つの単位として扱われる。[2]
ヴィラーマ(Virama)
[編集]この小分類にはオリヤー文字のうち、ヴィラーマ(殺母音記号)と呼ばれる、子音字の持つ母音/-a/を読まずに子音のみを発音することを表す記号1つのみが収録されている。この記号はレンダー上は子音字を半子音字形(half-form)に変形したり、後続する別の子音字と合字を形成するための制御文字として働くことが多い。ただし、文字によっては半子音字形を持たずただ単にヴィラーマが子音字の下に付く場合もある。
追加の子音字(Additional consonants)
[編集]この小分類にはオリヤー文字のうち、元々のブラーフミー文字にない拡張子音字が収録されている。
ヌクタ付きの2つの子音は、CompositionExclusions.txt にリストされている。つまり、正規化中に再構成されない。NFC 形式は、分解されたシーケンスと同じである。[2]
サンスクリット語用の追加母音字(Additional vowels for Sanskrit)
[編集]この小分類にはオリヤー文字のうち、サンスクリット語の表記に用いられる音節主音化した母音字としての流音の文字が収録されている。
予約済(Reserved)
[編集]この小分類には現在は文字が収録されていないが、将来的な追加のために領域が予約されている。デーヴァナーガリーにおける「インド諸文字用の一般句読点(Generic punctuation for scripts of India)」に相当する。
なお、ヴィラム(viram)句読点には、デーヴァナーガリー文字ブロックにある一般的なインド諸文字用の句読点の U+0964 । と U+0965 ॥ を使用する。[2]
数字(Digits)
[編集]この小分類にはオリヤー文字で用いられる固有の数字が収録されている。
記号(Sign)
[編集]この小分類にはオリヤー文字のうち、神の名を記す際などに用いられる記号1つのみが収録されている。
分数記号(Fraction signs)
[編集]この小分類にはオリヤー文字において分数を表記するための記号が収録されている。[10]
文字コード
[編集]オリヤー文字(Oriya)[1] Official Unicode Consortium code chart (PDF) | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F | |
U+0B0x | ଁ | ଂ | ଃ | ଅ | ଆ | ଇ | ଈ | ଉ | ଊ | ଋ | ଌ | ଏ | ||||
U+0B1x | ଐ | ଓ | ଔ | କ | ଖ | ଗ | ଘ | ଙ | ଚ | ଛ | ଜ | ଝ | ଞ | ଟ | ||
U+0B2x | ଠ | ଡ | ଢ | ଣ | ତ | ଥ | ଦ | ଧ | ନ | ପ | ଫ | ବ | ଭ | ମ | ଯ | |
U+0B3x | ର | ଲ | ଳ | ଵ | ଶ | ଷ | ସ | ହ | ଼ | ଽ | ା | ି | ||||
U+0B4x | ୀ | ୁ | ୂ | ୃ | ୄ | େ | ୈ | ୋ | ୌ | ୍ | ||||||
U+0B5x | ୕ | ୖ | ୗ | ଡ଼ | ଢ଼ | ୟ | ||||||||||
U+0B6x | ୠ | ୡ | ୢ | ୣ | ୦ | ୧ | ୨ | ୩ | ୪ | ୫ | ୬ | ୭ | ୮ | ୯ | ||
U+0B7x | ୰ | ୱ | ୲ | ୳ | ୴ | ୵ | ୶ | ୷ | ||||||||
注釈
|
履歴
[編集]以下の表に挙げられているUnicode関連のドキュメントには、このブロックの特定の文字を定義する目的とプロセスが記録されている。
バージョン | コードポイント[a] | 文字数 | L2 ID | ドキュメント |
---|---|---|---|---|
1.0.0 | U+0B01..0B03,0B05..0B0C,0B0F..0B10,
0B13..0B28,0B2A..0B30,0B32..0B33, 0B36..0B39,0B3C..0B43,0B47..0B48, 0B4B..0B4D,0B57,0B5C..0B5D,0B5F..0B62, 0B66..0B70 |
77 | (to be determined) | |
1.1 | U+0B56 | 1 | (to be determined) | |
4.0 | U+0B35,0B71 | 2 | L2/02-425 | Michael Everson (21 November 2002), On Oriya VA and WA (英語) |
5.1 | U+0B44,0B62..0B63 | 3 | L2/07-196 | Michael Everson (25 May 2007), Proposal to encode four characters for Oriya and Malayalam (WG2 N3272) (英語) |
6.0 | U+0B72..0B77 | 6 | L2/07-413 | Anshuman Pandey (5 December 2007), Proposal to Encode Oriya Fraction Signs (英語) |
L2/08-199 | Anshuman Pandey (17 June 2008), Proposal to Encode Oriya Fraction Signs (revised) (英語) | |||
13.0 | U+0B55 | 1 | L2/19-005 | Lorna Evans (21 June 2019), Proposal to encode ORIYA SIGN OVERLINE (revised) (英語) |
|
出典
[編集]- ^ “3.8: Block-by-Block Charts”. The Unicode Standard. Unicode Consortium. 2024年7月15日閲覧。
- ^ a b c d e f g h i "The Unicode Standard, Version 15.1 - U0B00.pdf" (PDF). The Unicode Standard (英語). 2024年7月27日閲覧。
- ^ a b IASTではṛと表記される。
- ^ a b IASTではḷと表記される。
- ^ まつ毛のRの時はr̆となる。
- ^ a b Michael Everson (2002年11月21日). “On Oriya VA and WA” (英語). Unicode. 2024年7月27日閲覧。
- ^ a b IASTではṝと表記される。
- ^ Lorna Evans (2019年6月21日). “Proposal to encode ORIYA SIGN OVERLINE (revised)” (英語). Unicode. 2024年7月27日閲覧。
- ^ a b IASTではḹと表記される。
- ^ Anshuman Pandey (2008年6月17日). “Proposal to Encode Oriya Fraction Signs (revised)” (英語). Unicode. 2024年7月27日閲覧。