テルグ文字(テルグもじ、テルグ語: తెలుగు లిపి, Telugu lipi、英: Telugu script)は、主にインドのアーンドラ・プラデーシュ州で話されているテルグ語を表記するための文字。テルグー文字とも呼ばれる。書字システムの性質によりアブギダに分類される。古代インドのブラーフミー文字から派生した文字の1つであり、書字方向は他の派生文字(デーヴァナーガリーなど)と同じく左から右への横書きである。単語と単語の間は欧米諸言語のように分かち書きする。
テルグ文字は、紀元前にインド北部で成立したブラーフミー文字が、 デカン高原南部(インド中部)において時が経つにつれ字形変化して成立したものである。また、通時的に西隣のカルナータカ州において使用されるカンナダ文字とほぼ同じ字形変化をしてきた文字であり、カンナダ文字との違いがはっきりと現れるようになったのは遅くて15世紀頃と比較的最近のことである。
紀元前にインド北部で成立したブラーフミー文字は、紀元後1世紀頃から次第に字形が変化していきなおかつ地方差が生じるようになり、4世紀-6世紀頃には南北で字形に著しい差ができるようになっていた。この時期のブラーフミー文字はインド全体で縦画の始筆部が強調されて筆記される傾向にあり、カダンバ朝やヴァーカータカ朝により支配されていた当時のインド中南部ではこの傾向が顕著に現れていた。当時記された史料としては、始筆部を太く四角く、ときには四角の箱型に書かれた字形のものが発見されている(これを箱型文字、カダンバ文字などと呼ぶことがある)。
その後、インド全体で筆記用具の発達により草書体が発達するようになる。前期チャールキヤ朝期(6〜8世紀)には文字がやや曲線的に書かれはじめ(チャールキヤ文字)、これが現行のテルグ文字・カンナダ文字の源流である。さらに時代が下って10〜12世紀頃には文字全体が円くしかも一筆書きに近い字体に変化していった。この時期の字体は原カンナダ文字、あるいはテルグ・カンナダ文字などと呼ばれる。
インド中南部での、東西間での字体の差異は当初はわずかであり、むしろ時間的・通時的変化のほうが大きかった。しかし10世紀以降東西間での差が徐々に表れはじめ、遅くとも15世紀になると差がはっきり現れるようになったとされる。現在ではこの時期あたり以降の東の字体をテルグ文字、西の字体をカンナダ文字と呼称して区別している。
ただ字形が区別できるようになったとはいえ、テルグ文字・カンナダ文字双方とも、16世紀ごろに現在の字体に近いものになったままその後の大きな(通時的)変化はなくなったため、現在の字体において両者は多くの字母が酷似している。ここに、両者と、インド北方の代表的な文字であるデーヴァナーガリーおよびベンガル文字、南部のタミル文字についていくつかの字母を例にとって比較した表を記す。すべての字母についての比較は、ブラーフミー系文字#比較の項目を参照されたい。
上図は一例であるが、このようにカンナダ文字と似た字形(ときに la のような同形や ka のようなちがう形のものもあるが)が多い。おしなべて字形が円弧を描いたようなものであることが特徴的であり、北方のデーヴァナーガリーのような縦の直線が多い文字とは大いに異なることがわかる。また、南方のタミル文字やマラヤーラム文字なども曲線的な字形が多いが、これらは2〜4世紀からテルグ文字とは分化していったために、やはり字形は異なる。
テルグ文字における子音の基本字母は単独で「子音+随伴母音(テルグ文字の場合は a /ʌ/)」の音節を表す。たとえば、基本子音字母 క は単独で "ka" /kʌ/と読まれる1つの音節である。
子音字母はすべて短母音 a /ʌ/ つきで読まれるが、それ以外の母音をつけた音節を記したいときは、子音字母に母音符号をつける。子音 k に長母音 ā /ɑː/ をつけた音節を記したい場合、ా の破線の円に子音字母を入れて కా としこれを "kā" /kɑː/ と読み、o /o/ をつけたい場合は ొ という形の母音符号を使って同様に కొ とし、これを "ko" /ko/ と読む。
また、子音のない、母音だけで成り立つ音節を記す場合は別個に母音の基礎字母があり、それを使う。たとえば ఆ という母音字があり、これを ā /ɑː/ と読む。
このように、基礎字母を単独で「子音 + 母音」の音節として読み、音節に付属している母音を変えたいときに付加記号をつけて示すテルグ文字のような書字システムのことをアブギダとよぶ。テルグ文字の起源となったブラーフミー文字もまたアブギダの1つであり、この文字から派生した南アジア・東南アジアの文字のほとんどがアブギダに分類される。これに対し基礎字母を音節とせず単独で子音または母音を表すラテン文字のようなシステムをアルファベットと呼び、基礎字母を子音として母音を補助的に書き記す(そしてよく省略して記される)アラビア文字のようなシステムをアブジャドといい、これらとは区別される。
テルグ文字の子音字母とその発音をここに記す。この順序がおおむね辞書順である。発音の列には、ローマ字への翻字と発音記号(IPA)を記す。
これらの字母についていくつか説明すべき点がある。
次に母音字を説明する。下表の一番目の列は、子音のつかない母音のみの音節を表すのに使われる。2番目にある母音付加記号の列は、子音に後続する母音 a をほかの母音に替えるのに用いられる。その使用例を3列目に示す。タラカットゥ(上部にあるチェック記号 ✓ 形の字画)をもつ子音文字につく場合にタラカットゥをはずしてつける付加記号に「○」を記している。
ఋ ṛ はもともとサンスクリットにおいて母音として扱われていたものであり、ときに ర ra に書きかえられる。ほかにもౠ ṝ や、表にはない ఌ ḷ、ౡ ḹ もサンスクリット起源の母音字があるが、現在ではほとんど使用されない。なお、子音字母に ఌ, ౡ を付加する際は、子音字の下に ఌ, ౡ をやや小さく書く。
母音記号を子音字母に付加する場合に意識すべきこととして、できるだけ一筆書きをすることが挙げられる。そのため、付加記号がつなげて書かれたような字形となることが多い。
子音の上部につく付加記号の書き始める点は基本的に次のようになる。
ただし、子音字と母音付加記号の組み合わせによっては、例外的な付き方をするものもかなり多く、特に i, ī については、付き方に3パターンあると言うほうが早い。ここに、それぞれの付加記号について例外的なつけ方や注意点などを示す。
ృ ṛ, ౄ ṝ, ఌ ḷ, ౡ ḹ, ె e, ే ē, ై ai, ్(母音 a をとる符号)には、付け方に例外はない。
"kt" などの二重子音は、్(母音 a をとる符号)を使ってあらわすことができるが、基本的には2番目の子音を下、あるいは右下に少し小さく書くという方法で表す。下に書く文字はタラカットゥをとる。
このような書き方があるために、్はふつう語末に使われる。右下から左上へ伸びて終わる字画をもつ子音字の中には、最後の字画を上へ伸ばすものがある。例:ర్భ rbha. このように書く子音字は次の9字である:చ ca, ఛ cha, ప pa, ఫ pha, బ ba, భ bha, ళ ḷa, శ śa, స sa.
2番目の子音としてよく出てくる次の8つの子音字は、下に来る際に形を変える。下にきたときの形を単独のフォントで表すことができないので、子音字 క ka のあとにきたときの例を示す。
また、慣用的に క్ k + ష ṣa は特殊な形 క్ష となる。これは、ష ṣa のカンナダ文字形 ಷ(の、上部横線をとりのぞいた形)が下にきているように見える。他の子音字に ష ṣa がくるときは、規則的にタラカットゥをとりのぞいて下に小さく書く。ప్ష pṣa.
他にも二重子音を表す文字がいくつかある。子音字の右に ౯ を書くと、子音の前に r- がつく。例:ఘ౯ rgha. しかしこれは、ర్ఘ のように原則どおりに2番目の子音を下に書いてもよい。
音節末の子音を表すのに、次の特殊な記号がある。
句読点には、伝統的には次のものがある。
しかし、現在は欧米式の ピリオド(.)、コンマ(,)、疑問符(?) を用い、伝統的なものはほとんど用いられない。
インド系の各文字には独自の字体をもつ数字がある。テルグ文字における数字は下表のようなものである。
使用法は算用数字とまったく同じである。例: ౯౦౬ = 906 = 九百六。
ただ、現在ではアラビア数字(012…)がほとんどの場で使用され、テルグ文字独自のものはほとんど用いられない。
以上に見てきたように、テルグ文字は子音文字と母音記号の組み合わせや二重子音の組み合わせ方が複雑で、ときに例外をとることもある。このような複雑な書字体系をもつテルグ文字は(これに限らずブラーフミー系文字全般に言えることだが)コンピュータに字形を正しく出力させるのが難しく、出力システムの設計・構築は難題である(複雑なテキスト配置を参照)。
Unicodeでは以下の位置に次の文字が定義されている。
なお、読点(।)および句点(॥)はテルグ文字枠には定義されておらず、デーヴァナーガリーにて定義されているU+0964 および U+0964 を利用する(ただし今後 U+0C64 および U+0C65 として定義される可能性はある)。ピリオド(.)、コンマ(,)、疑問符(?) は英文のものとまったく同じであり、テルグ文字枠には定義されていない。
Windows XP、Windows Server 2003以降のオペレーティングシステム (OS) では、該当のテキスト処理システムをインストールすれば、キーボード上でテルグ文字を入力することができる。インストール法など詳しくはHelp:多言語対応 (インド系文字)を参照。
2018年(平成30年)2月中旬に、iOS 11.2.5に於いて「シンボル」を意味する「జ్ఞా」を受信すると、Apple社の製品がクラッシュし、メッセージアプリが開けなくという不具合が発覚した。 なお、iOS 11.2.6およびmacOS High Sierra 10.13.3追加アップデートでは修正された。
Windowsのテルグ語キーボードの配列は以下の通り。
Owlapps.net - since 2012 - Les chouettes applications du hibou