タイ文字 (Unicodeのブロック)
タイ文字 (Unicodeのブロック) | |
---|---|
Thai | |
範囲 |
U+0E00..U+0E7F (128 個の符号位置) |
面 | 基本多言語面 |
用字 | タイ文字 |
主な言語・文字体系 | |
割当済 | 87 個の符号位置 |
未使用 | 41 個の保留 |
Unicodeのバージョン履歴 | |
1.0.0 | 87 (+87) |
公式ページ | |
コード表 ∣ ウェブページ |
タイ文字(タイもじ、英語: Thai)は、Unicodeの33個目のブロック。
解説
[編集]東南アジアのタイ王国の公用語であるタイ語やその方言を表記するためのタイ文字を収録している。
タイ文字はブラーフミー文字から派生した所謂ブラーフミー系文字(インド系文字)の一つであり、音素文字のうち子音字に母音記号を付加することで発音を切り替えるアブギダに分類される。
母音記号はものによっては文字の左側に付けられたり、子音字を左右から挟む形で付加される。なお、このような母音記号は多くのブラーフミー系文字では実際の発音の順序に合わせてレンダー位置が入れ替わることが多いが、タイ文字については文字が書かれる順序通りに入力することとなっている。
デーヴァナーガリー文字などのインドの文字とは異なり、頭子音のない独立した母音を表す文字が存在しない。代わりに頭子音のない母音を表す場合は無子音、あるいは声門破裂音[ʔ]を表す子音字オー・アーン(U+0E2D อ)を用いて表現する。また、子音連続は単に子音字を連続して書くことで表され、南アジアの文字体系で用いられるヴィラーマのような記号は通常は使われない(例外的にパーリ語の音訳においては似たような記号が用いられる。U+0E3A THAI CHARACTER PHINTHUを参照)。
書字方向はラテン文字やキリル文字などと同様に左から右へと横書き(左横書き)し、下に行を送る。分かち書きは原則しない。
子音字は元々有声音と無声音の弁別に加えて、有気音であるか無気音であるかを区別していた。そのため、各調音点における破裂音には計4種類の子音字が存在していた。なお、現在のタイ語では有声無気音及び有声有気音は無声有気音に合流しており、調音点が反舌音であった子音は歯茎音に合流している。こうした経緯により現在のタイ文字は同一の音素を表す異なる子音字が複数存在する。現在はこれらの有気音/無気音、有声音/無声音の弁別の代わりに声調の規則の変化が対応付けられており、子音字にはその規則ごとに中子音字・高子音字・低子音字の3つのグループに大別される。子音字は末子音としても振舞うことがあり、その場合一部の文字については発音が変化する。また、母音字については母音の長短によって文字が分けられている。
符号位置の順序はおおむねブラーフミー系文字の文字順に由来する伝統的なタイ文字の順序に従っており、文字名についても伝統的なタイ文字の命名法に従っている。
加えて、アラビア文字やデーヴァナーガリーなどと同様に独自の数字体系(タイ数字)を有している。
Unicodeが登場する以前のタイ文字の文字コード規格であるTIS 620-2533に由来する文字セットが元となっている。
Unicodeのバージョン1.0においても「タイ文字(Thai)」というブロック名で制定されていた[1]。
収録文字
[編集]「ラテン文字転写」の列はタイ文字のラテン文字への翻字方式の一つであるISO 11940に従う。
コード | 文字 | 文字名(英語) | 用例・説明 | ラテン文字転写 |
---|---|---|---|---|
子音字 | ||||
U+0E01 | ก | THAI CHARACTER KO KAI | ゴー・ガイ(鶏のゴー)。
子音[k]を表す中子音字。 |
k |
U+0E02 | ข | THAI CHARACTER KHO KHAI | コー・カイ(卵のコー)。
子音[kʰ]を表す高子音字。 |
k̄h |
U+0E03 | ฃ | THAI CHARACTER KHO KHUAT | コー・クアット(瓶のコー)。
子音[kʰ]を表す高子音字。元々は[x]を表していた。kho khai ขから分化した字。 現在は廃字となっており、使われていない。 |
ḳ̄h |
U+0E04 | ค | THAI CHARACTER KHO KHWAI | コー・クワーイ(水牛のコー)。
子音[kʰ]を表す低子音字。元々は有声無気音[ɡ]だった。 |
kh |
U+0E05 | ฅ | THAI CHARACTER KHO KHON | コー・コン(人のコー)。
子音[kʰ]を表す低子音字。元々は[ɣ]を表していた。kho khwai คから分化した字。 現在は廃字となっており、使われていない。 |
k̛h |
U+0E06 | ฆ | THAI CHARACTER KHO RAKHANG | コー・ラカン(鐘のコー)。
子音[kʰ]を表す低子音字。元々は有声有気音[ɡʱ]だった。 |
ḳh |
U+0E07 | ง | THAI CHARACTER NGO NGU | コ゚ー・ク゚ー(蛇のコ゚ー)。
子音[ŋ]を表す低子音字。 |
ng |
U+0E08 | จ | THAI CHARACTER CHO CHAN | チョー・チャーン(皿のチョー)。
子音[t͡ɕ]を表す中子音字。 |
c |
U+0E09 | ฉ | THAI CHARACTER CHO CHING | チョー・チン(銅鑼のチョー)。
子音[tɕʰ]を表す高子音字。 |
c̄h |
U+0E0A | ช | THAI CHARACTER CHO CHANG | チョー・チャーン(象のチョー)。
子音[tɕʰ]を表す低子音字。元々は有声無気音[d͡ʑ]だった。 |
ch |
U+0E0B | ซ | THAI CHARACTER SO SO | ソー・ソー(鎖のソー)。
子音[s]を表す低子音字。cho chang(ช)から分化した字。 |
s |
U+0E0C | ฌ | THAI CHARACTER CHO CHOE | チョー・チャー(木のチョー)。
子音[tɕʰ]を表す低子音字。元々は有声有気音[d͡ʑʱ]だった。 |
c̣h |
U+0E0D | ญ | THAI CHARACTER YO YING | ヨー・イン(女のヨー)。 | ỵ |
U+0E0E | ฎ | THAI CHARACTER DO CHADA | ドー・チャダー(冠のドー)。 | ḍ |
U+0E0F | ฏ | THAI CHARACTER TO PATAK | トー・パタック(突き棒のトー)。 | ṭ |
U+0E10 | ฐ | THAI CHARACTER THO THAN | トー・ターン(台座のトー)。
子音[tʰ]を表す高子音字。元々は反舌音の[ʈʰ]を表していた。 |
ṭ̄h |
U+0E11 | ฑ | THAI CHARACTER THO NANGMONTHO | トー・ナンモントー(モントー夫人のトー)。 | ṯh |
U+0E12 | ฒ | THAI CHARACTER THO PHUTHAO | トー・プータオ(年長者のトー)。
子音[tʰ]を表す低子音字。元々は反舌音の有声有気音[ɖʱ]だった。 |
t̛h |
U+0E13 | ณ | THAI CHARACTER NO NEN | ノー・ネーン(見習い僧のノー)。 | ṇ |
U+0E14 | ด | THAI CHARACTER DO DEK | ドー・デック(子供のドー)。
子音[d]を表す中子音字。 |
d |
U+0E15 | ต | THAI CHARACTER TO TAO | トー・タオ(亀のトー)。
子音[t]を表す中子音字。do dek(ด)から分化した字。 |
t |
U+0E16 | ถ | THAI CHARACTER THO THUNG | トー・トゥン(袋のトー)。
子音[tʰ]を表す高子音字。 |
t̄h |
U+0E17 | ท | THAI CHARACTER THO THAHAN | トー・タハーン(兵士のトー)。
子音[tʰ]を表す低子音字。元々は有声無気音[d]だった。 |
th |
U+0E18 | ธ | THAI CHARACTER THO THONG | トー・トン(旗のトー)。
子音[tʰ]を表す低子音字。元々は有声有気音[dʱ]だった。 |
ṭh |
U+0E19 | น | THAI CHARACTER NO NU | ノー・ヌー(鼠のノー)。
子音[n]を表す低子音字。 |
n |
U+0E1A | บ | THAI CHARACTER BO BAIMAI | ボー・バイマーイ(葉のボー)。
子音[b]を表す中子音字。 |
b |
U+0E1B | ป | THAI CHARACTER PO PLA | ポー・プラー(魚のポー)。
子音[p]を表す中子音字。bo baimai(บ)から分化した字。 |
p |
U+0E1C | ผ | THAI CHARACTER PHO PHUNG | ポー・プン(蜂のポー)。
子音[pʰ]を表す高子音字。 |
p̄h |
U+0E1D | ฝ | THAI CHARACTER FO FA | フォー・ファー(蓋のフォー)。
子音[f]を表す高子音字。pho phung(ผ)から分化した字。 |
f̄ |
U+0E1E | พ | THAI CHARACTER PHO PHAN | ポー・パーン(食台のポー)。
子音[pʰ]を表す低子音字。元々は有声無気音[b]だった。 |
ph |
U+0E1F | ฟ | THAI CHARACTER FO FAN | フォー・ファン(歯のフォー)。
子音[f]を表す低子音字。pho phan(พ)から分化した字。 |
f |
U+0E20 | ภ | THAI CHARACTER PHO SAMPHAO | ポー・サンパオ(ジャンク船のポー)。
子音[pʰ]を表す低子音字。元々は有声有気音[bʱ]だった。 |
p̣h |
U+0E21 | ม | THAI CHARACTER MO MA | モー・マー(馬のモー)。
子音[m]を表す低子音字。 |
m |
U+0E22 | ย | THAI CHARACTER YO YAK | ヨー・ヤック(夜叉のヨー)。
子音[j]を表す低子音字。 |
y |
U+0E23 | ร | THAI CHARACTER RO RUA | ロー・ルア(船のロー)。
子音[r]を表す低子音字。 |
r |
U+0E24 | ฤ | THAI CHARACTER RU | 音節主音化した短母音としてのR(IPA:[r̩])を表す。 | v |
U+0E25 | ล | THAI CHARACTER LO LING | ロー・リン(猿のロー)。
子音[l]を表す低子音字。 |
l |
U+0E26 | ฦ | THAI CHARACTER LU | 音節主音化した短母音としてのL(IPA:[l̩])を表す。 | ł |
U+0E27 | ว | THAI CHARACTER WO WAEN | ウォー・ウェーン(指輪のウォー)。
子音[w]を表す低子音字。 |
w |
U+0E28 | ศ | THAI CHARACTER SO SALA | ソー・サーラー(休憩所のソー)。 | ṣ̄ |
U+0E29 | ษ | THAI CHARACTER SO RUSI | ソー・ルーシー (隠者のソー)。 | s̛̄ |
U+0E2A | ส | THAI CHARACTER SO SUA | ソー・スーア(虎のソー)。
子音[s]を表す高子音字。 |
s̄ |
U+0E2B | ห | THAI CHARACTER HO HIP | ホー・ヒープ(葛籠のホー)。
子音[h]を表す高子音字。 低子音字の文字の声調タイプを高子音字に置き換えるための文字としても用いられる。 |
h̄ |
U+0E2C | ฬ | THAI CHARACTER LO CHULA | ロー・チュラー(凧のロー)。 | ḷ |
U+0E2D | อ | THAI CHARACTER O ANG | オー・アーン(洗面器のオー)。
子音[ʔ]あるいは頭子音が無いことを表す中子音字。 |
x |
U+0E2E | ฮ | THAI CHARACTER HO NOKHUK | ホー・ノックフーク(梟のホー)。
子音[h]を表す低子音字。 |
ḥ |
記号 | ||||
U+0E2F | ฯ | THAI CHARACTER PAIYANNOI | パイヤーンノーイ(ไปยาลน้อย)。タイ文字における略語記号。ラテン文字などにおける省略のピリオド(.)に相当する。
また、古典的には句点(.)としても用いられていた。 |
ǂ/ǀ[3] |
母音記号 | ||||
U+0E30 | ะ | THAI CHARACTER SARA A | 末子音が無い場合の短母音[a]を表す。 | a |
U+0E31 | ั | THAI CHARACTER MAI HAN-AKAT | マーイ・ハン・アーカート(ไม้หันอากาศ)。
末子音が有る場合の短母音[a]を表す。 |
ạ |
U+0E32 | า | THAI CHARACTER SARA AA | 長母音[aː]を表す。 | ā |
U+0E33 | ำ | THAI CHARACTER SARA AM | 鼻母音[ɑm]を表す。 | å |
U+0E34 | ิ | THAI CHARACTER SARA I | 短母音[i]を表す。 | i |
U+0E35 | ี | THAI CHARACTER SARA II | 長母音[iː]を表す。 | ī |
U+0E36 | ึ | THAI CHARACTER SARA UE | 短母音[ɯ]を表す。 | ụ |
U+0E37 | ื | THAI CHARACTER SARA UEE | 長母音[ɯː]を表す。 | ụ̄ |
U+0E38 | ุ | THAI CHARACTER SARA U | 短母音[u]を表す。 | u |
U+0E39 | ู | THAI CHARACTER SARA UU | 長母音[uː]を表す。 | ū |
U+0E3A | ฺ | THAI CHARACTER PHINTHU | パーリ語においてヴィラーマ(無母音)の音訳に用いられる[2]。 | ̥ |
通貨記号 | ||||
U+0E3F | ฿ | THAI CURRENCY SYMBOL BAHT | タイ王国の通貨単位、バーツの通貨記号。 | |
母音記号 | ||||
U+0E40 | เ | THAI CHARACTER SARA E | 短母音[e]を表す。 | e |
U+0E41 | แ | THAI CHARACTER SARA AE | 短母音[ɛ]を表す。 | æ |
U+0E42 | โ | THAI CHARACTER SARA O | 短母音[o]を表す。 | o |
U+0E43 | ใ | THAI CHARACTER SARA AI MAIMUAN | マーイ・ムーアン。二重母音[aɪ]を表す。
20個の単語のみで用いられる。 |
ı |
U+0E44 | ไ | THAI CHARACTER SARA AI MAIMALAI | マーイ・マラーイ。二重母音[aɪ]を表す。 | ị |
長母音化記号 | ||||
U+0E45 | ๅ | THAI CHARACTER LAKKHANGYAO | 0E24 ฤ 或いは 0E26 ฦ で使用され、音節主音化した流音を長母音として発音することを表す[2]。 | ɨ |
繰り返し記号 | ||||
U+0E46 | ๆ | THAI CHARACTER MAIYAMOK | マーイ・ヤモック(ไม้ยมก)。直前の単語を2回繰り返して発音することを表す記号。日本語における「々」などにあたる。 | « |
母音記号 | ||||
U+0E47 | ็ | THAI CHARACTER MAITAIKHU | 母音[e](เ), [ɛ](แ), 及びオー・アーン(อ)を用いて表記する母音[ɔ]について末子音がある場合に子音字の上に書かれる記号。 | ̆ |
声調記号 | ||||
U+0E48 | ่ | THAI CHARACTER MAI EK | マーイ・エーク(ไม้เอก)。子音字の声調を変化させることを表す記号。第1段階。数字の1に由来する。
子音の分類(高・中・低)によってどの声調になるのかの規則が異なる。 |
̀ |
U+0E49 | ้ | THAI CHARACTER MAI THO | マーイ・トー(ไม้โท)。子音字の声調を変化させることを表す記号。第2段階。数字の2に由来する。
子音の分類(高・中・低)によってどの声調になるのかの規則が異なる。 |
̂ |
U+0E4A | ๊ | THAI CHARACTER MAI TRI | マーイ・トリー(ไม้ตรี)。子音字の声調を変化させることを表す記号。第3段階。数字の3に由来する。
子音の分類(高・中・低)によってどの声調になるのかの規則が異なる。 |
́ |
U+0E4B | ๋ | THAI CHARACTER MAI CHATTAWA | マーイ・チャッタワー(ไม้จัตวา)。子音字の声調を変化させることを表す記号。第4段階。数字の4に由来する。
子音の分類(高・中・低)によってどの声調になるのかの規則が異なる。 |
ˇ |
記号 | ||||
U+0E4C | ์ | THAI CHARACTER THANTHAKHAT | マーイ・タンタカート(ไม้ทัณฑฆาต)、或いはガーラン(การันต์)。 | ̒ |
U+0E4D | ํ | THAI CHARACTER NIKHAHIT | ニッカヒット(นิคหิต)。サンスクリット語やパーリ語の音訳において鼻母音化を表す[2]。アヌスヴァーラに対応する。
現在のタイ語では母音am(ำ)にその名残がある。 |
̊ |
U+0E4E | ๎ | THAI CHARACTER YAMAKKAN | ヤマッカン(ยามักการ)。
サンスクリット語やパーリ語の表記においてヴィラーマと同様の働き(無母音化)をする。同時に発音される2つの子音クラスターの一部である子音を示す。 |
~ |
U+0E4F | ๏ | THAI CHARACTER FONGMAN | フォーンマン(ฟองมัน)。スタンザ(詩の節)の開始を表すほか、ブレットとしても用いられる[2]。 | § |
数字 | ||||
U+0E50 | ๐ | THAI DIGIT ZERO | タイ文字における数字の0。 | 0 |
U+0E51 | ๑ | THAI DIGIT ONE | タイ文字における数字の1。 | 1 |
U+0E52 | ๒ | THAI DIGIT TWO | タイ文字における数字の2。 | 2 |
U+0E53 | ๓ | THAI DIGIT THREE | タイ文字における数字の3。 | 3 |
U+0E54 | ๔ | THAI DIGIT FOUR | タイ文字における数字の4。 | 4 |
U+0E55 | ๕ | THAI DIGIT FIVE | タイ文字における数字の5。 | 5 |
U+0E56 | ๖ | THAI DIGIT SIX | タイ文字における数字の6。 | 6 |
U+0E57 | ๗ | THAI DIGIT SEVEN | タイ文字における数字の7。 | 7 |
U+0E58 | ๘ | THAI DIGIT EIGHT | タイ文字における数字の8。 | 8 |
U+0E59 | ๙ | THAI DIGIT NINE | タイ文字における数字の9。 | 9 |
記号 | ||||
U+0E5A | ๚ | THAI CHARACTER ANGKHANKHU | アンカン(อังคั่น)。長い章の終わりを示すために用いられる[2]。 | ǁ |
U+0E5B | ๛ | THAI CHARACTER KHOMUT | コームート(โคมูตร)。章や文書の終わりを示すために用いられる[2]。 | » |
小分類
[編集]このブロックの小分類は「子音字」(Consonants)、「記号」(Signs)、「母音記号」(Vowels)、「通貨記号」(Currency symbol)、「長母音化記号」(Vowel length sign)、「繰り返し記号」(Repetition mark)、「声調記号」(Tone marks)、「数字」(Digits)の8個となっている[2]。本ブロックでは、Unicodeのバージョン更新時の文字追加が隙間を埋める形で行われた影響で、同一の小分類に属する文字が飛び飛びの符号位置に割り当てられていることがある。また、収録文字が1文字しかない小分類については小分類名が単数形で表現されているが、本記事では単数形か複数形かによる小分類名の表記ゆれについては別の小分類として扱わず、同一の小分類として扱うこととする。
子音字(Consonants)
[編集]この小分類にはタイ文字のうち、基本的な子音字が収録されている。
記号(Signs)
[編集]この小分類にはタイ文字のうち、記号や約物などの類が収録されている。
母音記号(Vowels)
[編集]この小分類にはタイ文字のうち、子音字に結合する母音記号が収録されている。U+0E40-0E44の文字については、視覚的な順序では子音の前にある。[2]他のブラーフミー系文字では子音の左側にレンダーされる母音記号を発音順に入力する方式を取っているものが多いが、タイ文字では文字が書かれる順番通りに入力することとなっている。そのため、文字の符号化文字列とレンダー位置とか入れ替わることは無い。
通貨記号(Currency symbol)
[編集]この小分類にはタイ王国の通貨単位であるバーツの通貨記号1つのみが収録されている。
長母音化記号(Vowel length sign)
[編集]この小分類にはタイ文字においてパーリ語の音訳を表記する際に、音節主音化した流音を長母音として発音することを表す記号1つのみが収録されている。
繰り返し記号(Repetition mark)
[編集]この小分類にはタイ文字において直前の単語を2回繰り返して読むことを表す繰り返し記号1つのみが収録されている。
声調記号(Tone marks)
[編集]この小分類にはタイ文字のうち、子音の声調を変化させるための記号が収録されている。なお、1つの声調記号に対して声調が一対一で対応しているわけではなく、付けられた先の子音が高子音字・中子音字・低子音字のうちいずれのグループに属するかによって声調の規則が異なる。
数字(Digits)
[編集]この小分類にはタイ文字で用いられる固有の数字が収録されている。
文字コード
[編集]タイ文字(Thai)[1] Official Unicode Consortium code chart (PDF) | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F | |
U+0E0x | ก | ข | ฃ | ค | ฅ | ฆ | ง | จ | ฉ | ช | ซ | ฌ | ญ | ฎ | ฏ | |
U+0E1x | ฐ | ฑ | ฒ | ณ | ด | ต | ถ | ท | ธ | น | บ | ป | ผ | ฝ | พ | ฟ |
U+0E2x | ภ | ม | ย | ร | ฤ | ล | ฦ | ว | ศ | ษ | ส | ห | ฬ | อ | ฮ | ฯ |
U+0E3x | ะ | ั | า | ำ | ิ | ี | ึ | ื | ุ | ู | ฺ | ฿ | ||||
U+0E4x | เ | แ | โ | ใ | ไ | ๅ | ๆ | ็ | ่ | ้ | ๊ | ๋ | ์ | ํ | ๎ | ๏ |
U+0E5x | ๐ | ๑ | ๒ | ๓ | ๔ | ๕ | ๖ | ๗ | ๘ | ๙ | ๚ | ๛ | ||||
U+0E6x | ||||||||||||||||
U+0E7x | ||||||||||||||||
注釈
|
履歴
[編集]以下の表に挙げられているUnicode関連のドキュメントには、このブロックの特定の文字を定義する目的とプロセスが記録されている。
バージョン | コードポイント[a] | 文字数 | L2 ID | ドキュメント |
---|---|---|---|---|
1.0.0 | 87 | (to be determined) | ||
|
出典
[編集]- ^ “3.8: Block-by-Block Charts”. The Unicode Standard. Unicode Consortium. 2024年7月15日閲覧。
- ^ a b c d e f g h i j k l "The Unicode Standard, Version 15.1 - U0E00.pdf" (PDF). The Unicode Standard (英語). 2024年8月9日閲覧。
- ^ 省略記号(paiyannoi)としてはǂ、句点としてはǀと翻字される。