ယူ​နီ​ကုတ် စာလုံး​စီ​ပုံ - Unicode Encoding

ယူ​နီ​ကုတ် အက္ခရာ​များ​ကို စီစဉ်​တဲ့​အခါ Logical Order (ဘာသာ​စကား အသံ​သဘော) အရ စီစဉ်​ရ​ပါ​တယ်။ အဲ​ဒီ​အခါ အဓိက ပြဿနာ​ဖြစ်​တာ​က သဝေထိုး​ပါ​ပဲ။ သဝေထိုး​နဲ့ ခ​ခွေး​ဟာ ဘယ်​ညာ​လှည့်​ပုံ​သာ ကွဲ​ပေ​မဲ့ ဘယ်​သူ​မှ ဘယ်​ကို ခ​လျှောက်​ခွေး​နေ​တာ​လဲ​လို့ မ​ပြော​ကြ​ပါ။ ဘယ်​ကို သဝေထိုး​နေ​လဲ လို့​သာ ပြော​ပါ​တယ်။ ဆိုလို​ချင်​တာ​ကတော့ သဝေထိုး​ဟာ သဝေထိုး​ပြီး ရှေ့​ကို ရောက်​နေ​တယ်⁠တယ်​လို့ ပြော​ချင်​တာ​ပါ။ မြန်မာ​စာ​ကို ရှေး​လူကြီး​တွေ​က ဒီ​လို​ရေး​ခဲ့​တော့ ထုံးဖြစ်နေသော်လည်း သရကို ရှေ့မှာထားတာ မှားပါတယ်။ နောက်ပြန်​ရှင်း​ပါ့​မယ်။

ဟိုး​ရှေး​ရှေး ဝင်း​ဖောင့်၊ စီ​အီး​ဖောင့် အစ​ရှိ​လို့ ဇော်ဂျီ​ဖောင့် ဖြစ်လာ​တဲ့​အထိ Logical Order နဲ့ မ​စီ​ပါ၊ အမြင်​အတိုင်း​သာ စီ​ပါ​တယ်။ ဆိုလို​တာ​က "ပြောင်း" ဆို​တဲ့ စာလုံး​ကို ရိုက်​မယ်​ဆို​ရင် သဝေထိုး+ ရ​ရစ်+ ပ​စောက်+ ရေး​ချ+ င+ အသတ်+ ဝစ္စ​ပေါက် ရယ်​လို့ ရိုက်​ရ​ပါ​တယ်။ အဲ​လို​မှ မ​ရိုက်​ရင်​လည်း အမှန် မ​မြင်​ရ​ပဲ​ကိုး။

လူ​တိုင်း​အတွက် ယူ​နီ​ကုတ်

ကွန်ပျူတာ​တွေ​စပေါ်​တော့ ဖောင့်​တစ်​ခု​မှာ အက္ခရာ ၂​၅​၆ လုံး​သာ ဆန့်​ပါ​တယ်။ အဲ​ဒီ​နေရာ​တွေ​မှာ အင်္ဂလိပ် လက်တင် အက္ခရာ​တွေ​နဲ့​တင် ပြည့်​သွား​ပါ​ပြီ။ ဒီ​တော့ တခြား​ဘာသာ​စကား​တွေ​အတွက် သုံး​ချင်​ရင် ရှိ​ပြီး​သား စာလုံး​တွေ​ကို ဖယ်​ပြီး မိမိ​ဘာသာ​စကား အက္ခရာ​တွေ​နဲ့ အစားထိုး​ရ​ပါ​တယ်။ မြန်မာ​လို ဝင်း​စာလုံး​စီ​ပုံ​နဲ့ "ပြောင်း"လို့ ရေးထား​ရင် အင်္ဂလိပ်​လို "ajymif;" ဆို​ပြီး ပေါက်​ကရ​တွေ မြင်​ရ​ပါ​တယ်။ အဲ​ဒီ​တော့ ဘာသာ​စကား နှစ်​ခု​နဲ့​အထက် ဒေ​တာ​တွေ​ကို ဖ​လှယ်​ချင်​တဲ့​အခါ ကို​ဒုက္ခ​နဲ့ မလှ​လှ တွေ့​ကြ​ပါ​တော့​တယ်။ ကွန်​ဗာ​တာ​ပေါင်း အမျိုး​စုံ​သုံး​ပြီး ဟို​ဘာသာ​နဲ့​ဒီ​ဘာသာ ပြန်​ပြောင်း၊ ဗမာ​စာ​မှာ​ဆို​လည်း ဟို​ဖောင့်​နဲ့ ဒီ​ဖောင့်​ပြန်​ပြောင်း၊ ဝင်း​နဲ့​ရေး​တာ စီ​အီး​နဲ့ ဖတ်​မ​ရ​လို့ ကွန်​ဗာ​တာ​သုံး​ပြီး ပြန်​ပြောင်း​နဲ့ အင်​မ​တိ အင်မတန် က​ပေါက်​တိ က​ပေါက်​ချာ ဖြစ်​ခဲ့​ပါ​တယ်။

အဲ​ဒီ​ပြဿနာ​တွေ​ကို ဖြေ​ရှင်း​ဖို့ ဘာသာ​စကား​အားလုံး​အတွက် ရည်​ရွယ်​တဲ့ ယူ​နီ​ကုတ်​စနစ်​ကို တီထွင်​ခဲ့​ကြ​ပါ​တယ်။ ယူ​နီ​ကုတ်​မှာ ဘာသာ​စကား​တိုင်း​ရဲ့ အက္ခရာ​တိုင်း​အတွက် သူ့​နေရာ​နဲ့​သူ သတ်​မှတ်​ပေး​ထား​ပါ​တယ်။ ဒါ​ကြောင့် ယူ​နီ​ကုတ်​စနစ်​ကို သုံး​ရင် ဒေ​တာ​တွေ ဖ​လှယ်​နိုင်​ဖို့​အတွက် ဖောင့်​ပြဿနာ​ဆို​တာ လုံး​လုံး မ​ရှိ​တော့​ပါ​ဘူး။

ယူ​နီ​ကုတ် စည်းမျဉ်း

ယူ​နီ​ကုတ်​အက္ခရာ​တွေ​ကို စီ​တဲ့​အခါ ဘာသာ​ဗေဒ အသံ​ထွက် သဘော​တရား (Linguistics) ကို မှီ​ပြီး စီစဉ်​ရ​ပါ​တယ်။ အဲ​ဒါ ဘယ်​ဘာသာ​အတွက် သီး​သန့်​ဆို​ပြီး ချွင်း​ချက် မ​ထား​ပါ​ဘူး။ ဘယ်​ဘာသာ​စကားမ​ဆို ယူ​နီ​ကုတ်​စနစ်​မှာ အဲ​ဒီ​စည်းမျဉ်း​ကို လိုက်နာ​ရ​ပါ​တယ်။

ယူ​နီ​ကုတ် စာလုံး​စီ​ပုံ​မှာ ပထမ​ဆုံး လာ​ရ​တာ "ဗျည်း" (consonants) ပါ။ မြန်မာ​စာ​မှာ​ဆို​ရင် "က​ကြီး" က​နေ "အ" အထိ​လို့ အလွယ်​မှတ်​နိုင်​ပါ​တယ်။

ဒုတိယ လာ​ရ​တာ "ဗျည်း​တွဲ" (medials) ပါ။ မြန်မာ​စာ​မှာ​ဆို "ပင့်​ရစ်​ဆွဲ​ထိုး" လို့ အလွယ်​မှတ်​နိုင်​ပါ​တယ်။ ယ​ပင့်၊ ရ​ရစ်၊ ဝ​ဆွဲ၊ ဟ​ထိုး လေး​လုံး​ပါ။

တတိယ လာ​ရ​တာ "သရ" (vowels) ပါ။ မြန်မာ​မှာ "အ၊ အာ၊ အိ၊ အီ၊ အု၊ အူ၊ အေ၊ အဲ၊ အော၊ အော်၊ အံ၊ အိုး" တွေ​ပါ။ သင်္ကေတ​တွေ​သာ ယူ​ရင် "သဝေ​ထိုး၊ ရေး​ချ၊ မောက်​ချ၊ လုံး​ကြီး​တင်၊ လုံး​ကြီး​တင်​ဆံ​ခတ်၊ တစ်​ချောင်း​ငင်၊ နှစ်​ချောင်း​ငင်၊  နောက်ပစ်" တွေ​ပါ။ သေး⁠သေး​တင်၊ ဝစ္စ​ပေါက်​တွေ​ကို သရ​ထဲ မ​ထည့်​ပါ။

အဲ​ဒီ​နောက်​မှာ​မှ "သေး⁠သေး​တင်၊ အောက်​က​မြစ်၊ ဝစ္စ​ပေါက်၊ အသတ်" တွေ​ကို နောက်ဆုံးပိတ် ထည့်​ပါ​တယ်။ အသတ်​ကို​တော့ အသံ​ကို သတ်​ပစ်​တယ်​လို့ သတ်​မှတ်​ပြီး အောက်​က​မြစ်​နဲ့ ယှဉ်​လာ​ရင် နောက်ဆုံး​မှ ထည့်​ပါ​တယ်။ အသတ်​နဲ့ တန်ဖိုး​ညီ​တာ​က ပါဌ်​ဆင့်​အဖြစ်​သုံး​တဲ့ "ဝိ​ရာ​မ (Virama)" ပါ။ သူ​က မ​မြင်​ရ​ပါ။ ဥပမာ "က​ကြီး+ မ+ ဝိ​ရာ​မ+ ဘ​ကုန်း+ ရေး​ချ" ဆို​ရင် "ကမ္ဘာ" ရ​ပါ​တယ်။ ရှေ့​ထိုး​ဟာ အသတ်​နဲ့ ပုံစံ​တူ​တဲ့​အတွက် ရှေ့​ထိုး​နဲ့ အသတ်​ကို အတူတူ ယူ​ပါ​တယ်။ ရှေ့ထိုးဟာ အက္ခရာ သရအနေနဲ့ မရှိဘဲ ဪသရရဲ့ အစိတ်အပိုင်းသာ ဖြစ်တဲ့အတွက် သူ့အတွက် ကုဒ်ပွိုင့်သတ်သတ် မပေးပါ။

အသံ​ကို အခြေ​ခံ

ကဲ "ပြောင်း"ဆို​တဲ့ စာလုံး​ကို ယူ​နီ​ကုတ်​လို ရေး​ကြည့်​ရ​အောင်။ ယူ​နီ​ကုတ်​က Linguistics ကို အခြေ​ခံ​တဲ့​အတွက် ပထမ​ဆုံး အနေ​နဲ့ ချ​မ​ရေး​ခင် ပါး​စပ်​နဲ့ အသံ​အရင်​ထွက်​ကြည့်​ပါ။

ပြောင်း
ပ+ ရ+ အောင်း
ပ+ ရ​ရစ်+ သဝေထိုး+ ရေး​ချ+ င+ အသတ်+ ဝစ္စ​နှစ်​လုံး​ပေါက်

အဲ​ဒီ​ထိ ရှင်း​သေး​တယ်​ဆို​ရင် ဒီ​အောက်​က န​မူ​နာ စာလုံး​တွေ​ကို ကြည့်​ပါ။

မှောင်
မ+ ဟ+ အောင်
မ+ ဟ​ထိုး+ သဝေထိုး+ ရေး​ချ+ င+ အသတ်

ကျောက်
က+ ယ+ အောက်
က+ ယ​ပင့်+ သဝေထိုး+ ရေး​ချ+ က​ကြီး+ အသတ်

မောင့်
မ+ အောင့်
မ+ သဝေထိုး+ ရေး​ချ+ င+ အောက်​က​မြစ်+ အသတ်

မြို့
မ+ ရ+ အို့
မ+ ရ​ရစ်+ လုံး​ကြီး​တင်+ တစ်​ချောင်း​ငင်+ အောက်​က​မြစ်

မှို
မ+ ဟ+ အို
မ+ ဟ​ထိုး+ လုံး​ကြီး​တင်+ တစ်​ချောင်း​ငင်

သွေး
သ+ ဝ+ အေး
သ+ ဝ​ဆွဲ+ သဝေထိုး+ ဝစ္စ​နှစ်​လုံး​ပေါက်
 
ပင့်ရစ်ဆွဲထိုး လေး​လုံး အချင်းချင်း ယှဉ်​လာ​ရင် အစဉ်​အတိုင်း စီ​ပါ​တယ်။ ဥပမာ အမြွှာ ကို ရေး​ရင် အ + မ + ရ​ရစ် + ဝ​ဆွဲ + ဟ​ထိုး + ရေး​ချ။
 
ပါဌ်​ဆင့် နဲ့ ကင်းစီး

ဟိုး​ရှေး⁠ရှေး​က စာရေး​ရင် ပေ​ရွက် ထန်း​ရွက် စ​သည်မှာ ရေး​ရ​တဲ့​အတွက် ရှည်​နေ​တဲ့​စာလုံး​တွေ​ကို ချုံ့​ပစ်​ပါ​တယ်။ စာ​နှစ်​လုံး​ကို တစ်​လုံး​တည်း ဖြစ်​အောင် ပူး​ပစ်​ပါ​တယ်။ အဲ​ဒါ​တွေ​ဟာ ခု​တော့ ရေး​ထုံး ဖြစ်လာ​ပါ​တယ်။ ဥပမာ - အု ဆို​တဲ့​စာလုံး​ကို အက္ခရာ ဥ လုပ်​လိုက်​ပါ​တယ်။ အဲ​ဒါ ချုံ့​တာ​ပါ။ ကမ်​ဘာ​ဆို​တဲ့ စာလုံး​ကို ကမ္ဘာ လို့ နှစ်​ဆင့်​ထပ်​ပြီး​ရေး​တာ ပါဌ်​ဆင့်​တယ် ခေါ်​ပါ​တယ်။ မင်​ဂ​လာ​ကို မင်္ဂလာ​လို့ တခြား​စာ​လုံးပေါ်​တင်​တာကျ​တော့ ကင်းစီး​တင်​တယ် ခေါ်​ပါ​တယ်။ အခု ပါဌ်​ဆင့်​နဲ့ ကင်းစီး​ရေး​ပုံ​ကို ပြော​ပါ​မယ်။ သူ​တို့​ကို ရေး​ရင် ဝိ​ရာ​မ သုံး​ရ​ပါ​တယ်။

ပါဌ်​ဆင့်​ရေး​ရင် ဝိ​ရာ​မကို အသတ်​နေရာ​မှာ ထည့်​ပါ​တယ်။

စန္ဒာ
စ+ အန်+ ဒ+ အာ
စ+ န​ငယ်+ ဝိ​ရာ​မ+ ဒ​ဒွေး+ ရေး​ချ

ကြမ္မာ
က+ ရ+ အမ်+ မ+ အာ
က+ ရ​ရစ်+ မ+ ဝိ​ရာ​မ+ မ+ ရေး​ချ

ကင်းစီး​ရေး​ရင် အသတ်​အရင်​ရေး​ပါ​တယ်။ အသတ်​နောက်​က ဝိ​ရာ​မ လိုက်​ပါ​တယ်။

မင်္ဂလာ
မ+ အင်+ ဂ+ လ+ အာ
မ+ င+ အသတ်+ ဝိ​ရာ​မ+ ဂ​ငယ်+ လ+ ရေး​ချ

သင်္ကြန်
သ+ အင်+ က+ ရ+ အန်
သ+ င+ အသတ်+ ဝိ​ရာ​မ+ က​ကြီး+ ရ​ရစ်+ န​ငယ်+ အသတ်

Rendering လို

အဲ​ဒီ​လို ယူ​နီ​ကုတ်​စနစ်​နဲ့ စီ​ထား​တာ​တွေ​ကို မျက်စိ​အမြင်​မှာ ပုံ​မှန်​အတိုင်း​မြင်​စေ​ဖို့ ဖောင့်​ထဲ​မှာ ပုံဖော်​တဲ့ စည်းမျဉ်း​တွေ ထည့်​ပေး​ရ​ပါ​တယ်။ ဥပမာ Graphite, Pango, Uniscribe, Harfbuzz, AAT စ​တဲ့ နည်း​ပညာ​တွေ ဖြစ်​ပါ​တယ်။

ကိုယ်​သုံး​နေ​တဲ့​ကွန်ပျူတာ မို​ဘိုင်း​တွေ​မှာ ယူ​နီ​ကုတ်​စနစ်​ကို လိုက်နာ​ထား​တဲ့ ဖောင့်​ကို သုံး​ထား​ပါ​လျက်​နဲ့ စာလုံး​စီ​ပုံ​တွေ ဖတ်​မ​ရ​ဘူး​ဆို​ရင် ဒါ အဲ​ဒီ​စက်​မှာ ယူ​နီ​ကုတ်​စနစ်​ကို မ​ထောက်ပံ့​ပေး​ထား​လို့ ဖြစ်​တယ်​လို့ ယေဘုယျ​အား​ဖြင့် ပြော​နိုင်​ပါ​တယ်။ ဒါ​ဆို​ရင် မြန်မာ​စာ​သာ​မက မြန်မာ​ထက် နည်း​ပညာ​ပိုင်း​ဆိုင်​ရာ ရှေ့​တန်း​ရောက်​နေ​တဲ့ အိန္ဒိ​ယ၊ အာ​ရပ်​တို့​ရဲ့ ယူ​နီ​ကုတ်​စနစ်​သုံး​စာ​တွေ​ပါ အဲ​ဒီ​စက်​မှာ မ​မြင်​ရ​သေး​ဘူး​လို့ ကောက်ချက်​ချ​နိုင်​ပါ​တယ်။

တောင်​ကို​ဖောက်​၍

ဘယ် နည်း​ပညာ​ရပ်​ဝန်း​မှာ ဖြစ်⁠ဖြစ်​ပါ။ တစ်​ချိန်​မှာ မြန်မာ​စာ​ကို ထောက်ပံ့​ပေး​တော့​မယ်​ဆို​ရင် ယူ​နီ​ကုတ်​စနစ်​သုံး မြန်မာ​စာ​ကို သာ ထောက်ပံ့​မှာ ဖြစ်​ပါ​တယ်။ နည်း​ပညာ ပ​လက်​ဖောင်း​တစ်​ခုပေါ်​လာ​တယ်။ ယူ​နီ​ကုတ်​ဖောင့်​တွေ​အတွက် ပုံဖော်​စနစ်​မ​ရှိ​သေး​ဘူး။ ရုတ်​တရက်​ဆို​ရင် လူ​သုံး​များ​နေ​တဲ့ ဇော်ဂျီ​ကို အလွယ်​သုံး​လိုက်​မယ်။ သူ​က ဘာ​စနစ်​မှ လိုက်နာ​စရာ​မ​လို​ဘူး။ ဘာ​ပုံဖော်​စနစ်​မှ မ​လို​ဘူး။ အမြင်​အတိုင်း စာလုံး​စီ​တာ ဖြစ်​တဲ့​အတွက် ပ​လက်​ဖောင်းတော်တော်​များ⁠များ​နဲ့ အဆင်​ပြေ​တယ်။ သို့သော် ဇော်ဂျီ​သည် ဇော်ဂျီ​သာ​ဖြစ်​၍ ဇော်ဂျီ​နဲ့ ဖြေ​ရှင်း​ထား​တဲ့ တစ်​ပွဲ​တိုး​နည်း​များ​ကို ဘယ်​နိုင်ငံ​တကာ​အဖွဲ့​အစည်း​က​မှ တရားဝင် အသိ​အမှတ် ပြု​မှာ​မဟုတ် ဆို​တာ​ကို သတိချပ်​စေ​လို​ပါ​တယ်။

ကျွန်တော်​တို့ လမ်း​သွား​ရင်း​နဲ့ တောင်​တစ်​လုံး ရှေ့က​ခံ​နေ​တာ​တွေ့​မယ်။ ဘေး​က ကွေ့​ရှောင်​သွား​လို့​ရ​တယ်။ ဒါ​ပေ​မယ့် မတော်​ရင် တော​ထဲ​မှာ လမ်း​ပျောက်​သွား​နိုင်​တယ်။ သွား​လို​ရာ ရောက်​ခဲ့​ရင်တောင် အဆင့်ဆင့် ကွေ့​ပတ်​သွား​နေ​ရ​မယ်။ ခြုံ​တော​တိုး​ရ​မယ်။ ကိုယ်​က အားနည်း​နည်း​စိုက်​ပြီး ဒီ​တောင်​ကို လမ်း​ဖြစ်​အောင် ဖောက်​လိုက်​ရင် နောင်​လာ​နောက်​သား​တွေ​အတွက် အကျိုး​များ​နိုင်​ပါ​တယ်။ မြန်မာ​စာ​ကို ချစ်​မြတ်နိုး​တဲ့ လူ​တိုင်း ယူ​နီ​ကုတ်​လမ်း​ကို ကွေ့​သွား​မယ့်​အစား ဝင်​ဖောက်​ပေး​တဲ့ လူ​တွေ​ထဲ​က တစ်​ယောက်​အနေ​နဲ့ ပါဝင်​ကူညီ​ကြ​စေ​လို​ပါ​တယ်။ ကျေးဇူးတင်​ပါ​တယ်။

 

Read more:

http://unicode.org/notes/tn11/UTN11_3.pdf

Tags: 

Comments

Fixed

Lionslayer's picture

I tried to fixed it. I'm confused with to many span tags too. It should be ok now.

Testing on Mac ယူနီကုတ်

Testing on Mac

ယူနီကုတ် အက္ခရာများကို စီစဉ်တဲ့အခါ Logical Order (ဘာသာစကား အသံသဘော) အရ စီစဉ်ရပါတယ်။ အဲဒီအခါ အဓိက ပြဿနာဖြစ်တာက သဝေထိုးပါပဲ။ သဝေထိုးနဲ့ ခခွေးဟာ ဘယ်ညာလှည့်ပုံသာ ကွဲပေမဲ့ ဘယ်သူမှ ဘယ်ကို ခလျှောက်ခွေးနေတာလဲလို့ မပြောကြပါ။ ဘယ်ကို သဝေထိုးနေလဲ လို့သာ ပြောပါတယ်။ ဆိုလိုချင်တာကတော့ သဝေထိုးဟာ သဝေထိုးပြီး ရှေ့ကို ရောက်နေတယ်တယ်လို့ ပြောချင်တာပါ။ မြန်မာစာကို ရှေးလူကြီးတွေက ဒီလိုရေးခဲ့တော့ လက်ရေး၊ပုံနှိပ် မြန်မာစာမှာ မှားတယ်ပြောမရပါ။ ဒါပေမဲ့ ကွန်ပျူတာသုံး မြန်မာစာစနစ်မှာတော့ အဲလို ရှေ့ဆုံးသွားထားရင် မှားပါတယ်။ နောက်ပြန်ရှင်းပါ့မယ်။

..

အစ်ကိုတို့၊ အစ်မတို့ခင်ဗျာ.. ကျွန်တော် ယူနီကုတ်သုံးတဲ့အခါဆိုရင် ပဥ္စမတန်း ကိုရိုက်တဲ့အခါကျရင် စလုံးက ဥ ရဲ့ဟိုးအောက်ကို ရောက်နေတယ် ဒါအမှန်ပဲလားခင်ဗျား.. ပဉ္စမတန်း... ဝိုးအဆင်ပြေသွားပြီဗျာ... ကျွန်တော်မှားနေတာကို "ဥ"နှင့် "ဉ" နဲ့မှားသုံးမိတာကိုး..
ကျေးဇူးပါပဲဗျာ...