アラビア文字(アラビアもじ)は、アラビア語をはじめ、世界中のイスラム文化圏に属する諸言語を記述するのに使われる文字。ラテン文字、漢字に次いで、世界で三番目に使用者数が多い文字体系である。
文字体系の類型としてはアブジャドに属する。手書きでも活字でも必ず右から左に横書きし、原則として文字と文字を漢字の草書やラテン文字の筆記体のように続け書きにする。また、基本的に子音を表す文字からなっており、短母音を文字によってあらわさない。ただし、初学者の学習のためや、外来語の表記などの用途のために、補助的にシャクルとよばれる母音を表す記号も用いる。
アラビア語に存在する3種の長母音(ā, ū, ī / アー、ウー、イー)はそれぞれ無音価(ア行)を表すアリフ (alif) 、[w](ワ行)を表すワーウ (wāw) 、[j](ヤ行)を表すヤー (yāʾ) を使って表す。(なお、他言語の固有名詞をアラビア文字で表記するとき、母音は極力長母音を使って表記する傾向がある。こうした転写などの記述法についてはアラビア文字化を参照。)
アラビア語に用いられるアラビア文字はハムザ (ء) を除いて28文字であるが、ペルシア語などアラビア語以外の言語では、アラビア語にない子音(p, ch, zh, gなど)をあらわすため点や棒を付加したりした文字を28文字に付け加えて用いる。
アラビア文字の起源はアラム文字である。紀元前3世紀から紀元後3世紀頃までに勢力をもったペトラを中心とするアラブ系のナバタイ人が使用したアラム文字の一派、ナバテア文字を直接の起源としている。当時のナバテア文字は、他の地域のアラム文字と同様に文字同士を連結して、続け書きする特徴があった。ナバタイ人の活動範囲はシリア北部からイエメン方面まで広域におよび、4世紀頃からヒジャーズ(紅海東岸)地方を中心に、他のアラブ人にも用いられ始めた。当初ナバタイ人や他のアラブ人たちはこの文字をアラム語でのみ筆記して使用していたが、次第に自らの母語であるアラビア語も表記するようになった。
ただアラビア語はアラム語よりも子音が多く、さらに最初期のアラビア文字はいくつかの文字で本来異なる文字同士が同じ字形で表記されるという致命的な欠点を持っていた。この問題と続け書き表記のゆえに、文字を区別するために点が加えられたり、続け書きをしない文字が決められ、イスラム教の生まれた7世紀にはおおよその形ができあがっていた。ただし、点の使用は当初は非公式なものとされていたらしく、最初期のクルアーンでは点による文字の区別は排除されていた。後に、クルアーンを正確に読む必要性からクルアーンにも点が採用されるようになり、さらに母音を表す記号も発明された。現在では点は正書法の一部となっているが、母音記号は日常的な文書では原則として用いられない。
イスラム教布教後のアラビア文字は神(アッラーフ)の発した言葉の記録であるクルアーン(コーラン)や宗教文献の表記に使われたため、イスラム教に改宗した非アラブ民族にも神の教えに近い文字と認識され、ペルシア語をはじめとする多くの言語の表記にも用いられるようになった。
中には近代にヨーロッパ文化の影響を受けて文章語が生まれた時に、あえてアラビア文字による正書法が選ばれた言語もある。
なお、フィリップ・K・ヒッティ(レバノン出身)は、「アラビア文字は、世界でラテン文字の次に広く使われている文字である」と『アラブの歴史(上)』(原著1937年発行)の中で述べた。そして、使用言語として、ペルシャ語、アフガン語、ウルドゥー語、トルコ語、ベルベル語、マレー語をあげた。
2017年の報道によると、ヴァイキングの墓から見つかる死装束にアラビア文字が織り込まれていたことを、スウェーデン、ウプサラ大学のアンニカ・ラーソンが発見した。これらの衣服は100年以上前に見つかったものだが、ヴァイキング時代の典型的な死装束として片付けられ、そのまま保管されていた。ラーソンによると、死装束に織り込まれた細かい幾何学模様は、北欧では見たことがないものだったという。これらはヴァイキングが独自に編み出した模様ではなく、クーフィー体という古い書体のアラビア文字だった。研究者は文字を拡大し、裏側からも含め、あらゆる角度から見てみた。頻繁に見つかったのは、イスラムの第4代カリフの名前「アリ」と、アラビア語で神を表す「アラー」という単語だった。ただ、この文字を「アラー」と読むことについては、テキサス大学のステファニー・モルダーらによって疑問が呈されている。
現在、表記にアラビア文字を使う言語は、アラビア語、ペルシア語、ダリー語、クルド語、パシュトー語、バローチ語、アゼルバイジャン語(主にイラン領で)、シンド語、ウルドゥー語、カシミール語、パンジャブ語(主にパキスタン領で)、ウイグル語、カザフ語(主に中国領で)、キルギス語(主に中国領で)、ベルベル語、マレー語(主にブルネイ、そしてマレーシアやインドネシアでは、ムスリム向けのメディアや宗教関係)、モロ語(主にフィリピンのモロ族)、ジャウィ語、バルティー語、ブルシャスキー語などである。
表記がアラビア文字からラテン文字に変更された言語は、トルコ語、マレー語、スワヒリ語などがある。文字改革が行われる理由として、日常生活からのアラビア文字の排除による脱イスラム化・西欧化を狙うという動機のほか、簡略な表記体系により識字率の向上をはかること、母音が表記しやすくなることが挙げられる。しかし、アラビア文字を改良して母音表記を徹底し、簡略な表記体系を作り上げることに成功した事例もあるため、実際は言語学的な事実よりも、『ヨーロッパ=進歩的』という観念に基づく発想によりアラビア文字が敬遠された面が大きい。これらの言語でも、ラテン文字化へとすんなり舵を切ったわけではなく、アラビア文字を改良して、自言語に完全適用した文字体系にすることで効率のよい表記を達成しようとしたグループも存在した。
マレー・インドネシア語、スワヒリ語など、多くの言語では、政府公用の表記法にてラテン文字が採用される一方、民間や宗教関係ではアラビア文字の使用は継続した。私的な教授や伝承、使用についても特に妨害を受けなかった。またマレーシアでは、マレー語のアラビア文字表記もラテン文字表記に一歩譲るものの、学校で第2正書法として教授されている。しかしトルコのみはアラビア文字による出版物を禁止することで、アラビア文字の使用そのものを断ち切る形でラテン文字化を遂行した。現在でもトルコでは、この時定められたトルコ語表記用のラテン文字29文字以外の文字を用いた出版物を一部を除いて禁止しており、アラビア文字によるトルコ語表記のみならず、クルド語への弾圧の道具にもなっている。
チェチェン語、タタール語、カザフ語、キルギス語、トルクメン語、ウイグル語、ウズベク語、タジク語、ドンガン語などの旧ソ連内のムスリム(イスラム教徒)の諸民族の言語の表記にはロシア革命直後に一時ラテン文字化が試みられたが、スターリンの粛清が始まるとロシア語にならったキリル文字に改められた。なお、当初はラテン文字ではなく、ロシア連邦内のムスリムの間では、アラビア文字を改良して用いるべきという案を唱える知識人も多かった。現在でも、公式の文字表記はラテン文字やキリル文字であっても、アラビア文字も民間や宗教関係で使用され続けている。
アゼルバイジャン語、トルクメン語、ウズベク語、タタール語などはソビエト連邦の崩壊後、さらにラテン文字への再切り替えが進められている。
また中国のウイグル語等のムスリム達少数民族の言語は、かつてはソ連の影響でキリル文字化が図られ、中ソ国境紛争後はさらにソ連との違いを明らかにするためにピンイン風のラテン文字正書法が行われたが、1980年代の民族政策の転換によりアラビア文字が復活された。なお、現在のウイグル語で用いるアラビア文字はアリフ、ワーウなどに点を付加した文字を用い、8つある母音の全てを書き分ける独特なものである。
また、中国に住んでいる中国語(漢語)を話すムスリム(回民、現在の回族)は、アラビア文字で口語体の漢語を書き記すことがあった。このアラビア文字表記の漢語を小児経(小児錦とも)といい、クルアーンなどの経典の注釈に使われて印刷もされたほか、手紙や日記などの個人的用途に使われた。現在でも回族が集中的に居住する寧夏や甘粛では小児錦が部分的に使われているという。また、旧ソ連に移住した回民はドンガン人と呼ばれるようになるが、ドンガン語と呼ばれる彼らの話す漢語の一種もかつてはアラビア文字で書かれていた。また、中国国内のドンシャン族とサラール族も、アラビア文字による自言語表記を行っている。
スペイン語も、主に国内のイスラム教徒の間においてアラビア文字で書かれたことがある。
アラビア文字はもともと子音のみで語根が決まるセム系言語のために作られた文字であった、同じセム系文字を起源とするヨーロッパのアルファベットが文字の転用により母音を全て書き分ける方向に向かったのに対し、アラビア文字はそのような発展をしなかった。セム系言語に限れば、文脈で母音の読み方はほぼ決定するため、アラビア文字は合理的な文字といえる。しかしセム系言語とはまったく違った言語的特徴を有するペルシア語、ヒンドゥスターニー語、トルコ語(オスマン語)、マレー語などに導入された際はこの特徴が逆に不便と考えられることが多い。実際にはこれらの言語でもアラビア文字の改良は主として子音の追加、転用にとどまり、母音の完全な表記へと進むことは少なかった。母音の完全表記に至ったのはウイグル語やクルド語等である。
アラビア文字は太陽文字と月文字の二種類に分かれる。
アラビア語で、定冠詞の "ال" (al-) の /l/ の音が後の文字と逆行同化して長子音となる文字を太陽文字 َحروف شمسية(ḥurūf shamsiyya, フルーフ・シャムスィーヤ)という。具体的には、/l/ と調音点が同じ、または近接である舌頂音 (歯音、歯茎音、後部歯茎音) を表す文字である。「太陽」を意味する شمس (shams, シャムス)の語頭の文字 ش が含まれるためこう呼ばれる。
例えば、 شمس に定冠詞がついた場合、 الشَّمْسُ (ash-shams, アッ=シャムス)となり「アル=シャムス」とは発音しない。すなわち、アラビア語の定冠詞である ال の直後に太陽文字が来る場合には定冠詞は「アル」と発音するのではなく、太陽文字が2つ重なって発音される。具体的には、ت, ث, د, ذ, ر, ز, س, ش, ص, ض, ط, ظ, ل, ن が太陽文字である。
定冠詞の /l/ の音が同化しない文字、つまり太陽文字以外を月文字(َحروف قمرية, ḥurūf qamariyya, フルーフ・カマリーヤ)という。「月」を意味する قمر (qamar, カマル)の語頭の文字 ق が含まれるためこう呼ばれる。
قمر に定冠詞がついた場合、 القمر (al-qamar, アル=カマル)となる。左記のアル=カマルのように定冠詞 ال の直後に月文字が来る場合には、定冠詞は「アル」と発音する。また、具体的には、أ (ء) , ب, ج, ح, خ, ع, غ, ف, ق, ك, م, ه, و, ي が月文字である。
アラビア文字の基本字母28字は以下の通り。
(表中の頭字・中字が存在しない文字は、語頭では単独形で、語中では直前の文字が中字を持った文字なら尾字でつなげ、直前の文字が中字を持たない文字なら単独形で書かれる。)
アラビア文字の書き順 - YouTube
※「ا」(ʾalif) は、アラム語等の子音字配列順におけるアブジャドの「ア」に相当。元々は語頭にある「ʾ」(声門閉鎖音/声門破裂音)がその音価であった。しかし長母音āを示すのにも使われたため後代になり語頭で声門閉鎖音/声門破裂音を示す場合の発音を表記するために「ء」(ハムザ)が考案され、ハムザを伴わないアリフは固有の音価を持たない長母音形成パーツとして見なされるようになった。
といった形で用いられる。
なおアラビア語文法学では、アブジャド(慣用名称:アルファベット)順1文字目のアリフは長母音アリフではなくアリフを台座とした声門閉鎖音/声門破裂音(ハムザ)のことを指していると考える。アラビア語におけるアルファベット文字数が28文字説であっても29文字説であってもアリフという名をまとったハムザが第1文字目に来るとする(*ハムザを29文字目の位置に置く訳ではない)。28文字説では声門閉鎖音/声門破裂音としての機能と長母音パーツとしての機能を併せ持ったものが1文字目のアリフであるとし、29文字説では声門閉鎖音/声門破裂音としての機能が1文字目の「アリフ」ことハムザが担い、長母音アリフとしての機能はوとيの間に置かれるلاに含まれるアリフが担うと考えるなどする。
※「ا」(alif) で始まる語彙の前に、定冠詞「ال」(al) が付く場合などでも、用いられる。なお、そのように、/(ʔ)a/ /(ʔ)i/ /(ʔ)u/ の音価を持ち得る語頭の「ا」(alif) の直前に「ل」(lam, /l/) が来て合字「لا」になった場合、当然のことながら、その音価は/laː/ ではなく、/l(ʔ)a/ /l(ʔ)i/ /l(ʔ)u/ のいずれかになる(例:إسلام (Islām) + ال (al) → الإسلام (al-Islām) )。/laː/ という音価表現は、あくまでもそういった特殊な場合を除く、「語中・語末で他の文字に後続して長母音アー/aː/を形成する」という用法での「ا」(alif) の直前に、「ل」(lam, /l/) が来て合字「لا」になった場合のものである。
ハムザは、子音の一種である声門破裂音 /ʔ/ を表す文字(記号)である。
フェニキア文字・アラム文字に端を発するセム系言語の文字においては、通常この声門破裂音 /ʔ/ は、最初の文字(例えば、ヘブライ文字における「א」(alef) など)が担うものだが、それに相当するアラビア文字の「ا」(alif) は、必ずしもその役割・用途で用いられて来なかったため、それを補うべく当時調音部位が近いと認識されていた「ع」(ayn, /ʕ/) の頭部を切り取る形で、新たに生み出された声門破裂音 /ʔ/ のための専用文字(記号)が、このハムザである。
単独で書かれることは少なく、基本的に「ا」(alif) (※「ل」(lam, /l/) との合字である「لا」の場合も)、「ي」(ya, /j/)、「و」(waw, /w/) 、いずれかの「台字」を必要とする。(なお、「ي」(ya, /j/) がハムザの台字になる場合、2つの下点は省かれる(「ئ」)。)
使用規則は以下の通り。
まとめると、以下のようになる。
これら記号の多くは、通常の表記においては省かれ、主に教育・解説用のテキストでのみ用いられる。
母音記号
アリフ・子音関連
(なおWindowsパソコンなどではワスラ記号や短剣アリフはキーボードから直接入力できない。)
※ちなみに、イスラム教の神である「アラー」(アッラーフ)のアラビア文字表記は「الله」であり、「 ّ 」(shadda) の上に斜めの短い線が書かれているが、これも、特殊な形ではあるが、小アリフ(短剣アリフ)の一種である。キーボードでは、アラビア文字で「ل」(lam) + 「ل」(lam) + 「ه」(ha) を入力すると、自動的にこの記号付き表記に変換される。
現在使われている文字の順序では字形の似たものを1箇所にまとめているが、これとは異なり、アブジャド順というフェニキア文字以来の伝統的な文字順序も存在する。地域によって違いがあるが、もっとも一般的に行われている順序は以下のとおりである(右から左に進む)。アラビア文字を数字として使うときにもこの順序が使われる。
8つに分割して適当な母音を補い、「أبجد هوز حطي كلمن سعفص قرشت ثخذ ضظغ」('abjad hawwaz ḥuṭṭī kalaman sa‘faṣ qurišat ṯaḵaḏ ḍaẓaḡ)のように唱える。
アラビア語の母音は、基本的にア/a/、イ/i/、ウ/u/ の3つ、及びそれを長音化したものと、組み合わせた二重母音のみである。
二重母音に関しては「ي」(ya, /j/)を用いた表記ayが二重母音ai、「و」(waw, /w/) を用いたawが二重母音awに相当する。
短母音は子音字に母音記号を付加することで表現できる。(母音記号は通常の表記では省かれる。)
ちなみに、ハムザの項目で上述したように、「ء」(hamza, /ʔ/) が語頭の「ا」(alif) に付き、/ʔa/ /ʔi/ /ʔu/ といった発音を形成する場合に限り、「ء」(hamza, /ʔ/) の記号は、母音記号と連動する格好で、「ا」(alif) の上に付いたり、下に付いたりする。
また、子音重複記号である「 ّ 」(shadda) が書かれる場合、母音記号は、字母ではなく、この記号の上下に書かれる。
長母音は、上記の短母音に、それぞれ「ا」(alif, /a/)、「ي」(ya, /j/)、「و」(waw, /w/) を後続させることで、表現される。(母音記号は、通常の表記では省かれる。)
※なお、前項の記号類の項目でも書いてあるように、/ʔa/ の音価を持ったハムザ付きアリフ「أ」に、アリフ「ا」が後続し、/ʔaː/ という長母音になる場合に限り、ハムザ付きアリフ専用の長音符であるマッダが用いられる。(「آ」)
二重母音も同じく、短母音ア/a/ に「ي」(ya, /j/)、「و」(waw, /w/) を後続させることで、表現される。(母音記号は、通常の表記では省かれる。)
アラビア文字は、アラビア語以外の言語でも用いられている。
現在アラビア文字を用いている言語は、
等である。
これらの言語には、アラビア語には無い発音もあるため、それらを表現するためにいくつかの字母・記号が追加されている。
歴史的には、トルコ語、中央アジアのチュルク系諸語や、マレー語(ジャウィ文字)、スワヒリ語等、イスラム圏全域の諸言語でもアラビア文字が使用されていた。
Windowsにおけるアラビア語キーボードのキー配列。
アラビア文字のために、以下のような文字コードが存在する。
Unicode では、以下のブロックを定義している。
Owlapps.net - since 2012 - Les chouettes applications du hibou