ന്, ര്,ല്, ള്,ണ് എന്നീ ചില്ലക്ഷരങ്ങള്ക്ക് ഇപ്പോളുള്ള യഥാക്രമം ന+ചന്ദ്രക്കല+ZWJ, ര+ചന്ദ്രക്കല+ZWJ ,ല+ചന്ദ്രക്കല+ZWJ ,ള+ചന്ദ്രക്കല+ZWJ ണ+ചന്ദ്രക്കല+ZWJ എന്നീ യൂണിക്കോഡ് എന്കോഡിങ്ങിനു് പകരം ഒരൊറ്റ കോഡ് പോയിന്റ് മാത്രം ഉപയോഗിക്കുന്നതിനെയാണ് ആണവചില്ലു് അഥവാ അറ്റോമിക് ചില്ലെന്നു പറയുന്നത്. ഈ വസ്തുത എല്ലാവര്ക്കുമറിയാമെന്നു വിചാരിക്കുന്നു. ഇതെങ്ങനെ സ്പൂഫിങിന് കാരണമാകും എന്ന് വിശദമാക്കുകയാണ് ഈ ലേഖനത്തിന്റെ വിഷയം. പലര്ക്കുമറിയാവുന്ന കാര്യമായിരിയ്ക്കും. എന്നാലും അറിയാത്തവരുടെ അറിവിലേയ്ക്കായി എഴുതുന്നു.
ആദ്യം സ്പൂഫിങ് എന്താണെന്നു് ആദ്യം നോക്കാം
ഒരു പോലെയെന്നു് തോന്നിക്കുന്ന വിലാസം ഉള്ള വ്യാജസൈറ്റുകളുണ്ടാക്കുന്നതിനെയാണു് സ്പൂഫിങ് എന്നതുകൊണ്ട് ഉദ്ദേശിക്കുന്നതു്. ഇതിനെക്കുറിച്ച് വിശദമായി Spoofed URL,Spoofing Attack എന്നീ വിക്കിപ്പീഡിയ പേജുകളില് നിന്നു് മനസ്സിലാക്കാം. ഇത്തരം തട്ടിപ്പുകളിലൂടെ ഉപയോക്താക്കളെ വ്യാജസൈറ്റിലേക്കു് ആകര്ഷിച്ചു് പണം തട്ടുന്നത് പതിവാണു്. ICICI Bank ഉപയോക്താക്കളോട് സ്പൂഫിങ്ങിനെക്കുറിച്ചു് മുന്നറിയിപ്പു നല്കുന്ന ഈ പേജ് കാണൂ..
ആണവ് ചില്ലു് വരുമ്പോള് നമ്മുടെ ചില്ലക്ഷരങ്ങളെല്ലാം രണ്ടു് രീതിയില് എന്കോഡ് ചെയ്യപ്പെടും. യൂണിക്കോഡിന്റെ ബാക്ക്വേര്ഡ് കമ്പാറ്റിബിലിറ്റി നയമനുസരിച്ചു് നിലവിലുള്ള തരം ചില്ലു് കോഡുകളും, അറ്റോമിക് ചില്ലുകളും വരും. ഇതിലേതു് ഉപയോഗിച്ചാലും കാഴ്ചയില് ഒരു പോലിരിയ്ക്കും. തിരിച്ചറിയാന് പറ്റില്ല.
സര്ക്കാര്.com എന്ന ഒരു സൈറ്റ് ഉണ്ടെന്നിരിയ്ക്കട്ടെ. ഇതു് 4 പേര്ക്കു് രജിസ്റ്റര് ചെയ്യാന് പറ്റും യഥാര്ത്ഥ സൈറ്റ് നിലവിലെ ചില്ലുപയോഗിച്ചു് സര്ക്കാര്.com എന്നു രജിസ്റ്റര് ചെയ്തു എന്നിരിക്കട്ടെ.താഴെപ്പറയുന്നവയാണ് സ്പൂഫ് ചെയ്ത വ്യാജന്മാര്
1. സ[അറ്റോമിക് ര്]ക്കാ[നിലവിലെ ര്].com
2. സ[നിലവിലെ ര്]ക്കാ[അറ്റോമിക് ര്].com
3. സ[അറ്റോമിക് ര്]ക്കാ[അറ്റോമിക് ര്].com
കണ്ടാല് ഒരുപോലെയിരിയ്ക്കുന്ന മൂന്നു് വ്യാജന്മാര്!
ഇതു പോലെ ഫെഡറല്ബാങ്ക് 2 പേര്ക്കു രെജിസ്റ്റര് ചെയ്യാം. അങ്ങനെയങ്ങനെ...
ഇതിന്റെ ഒരു ഡെമോണ്സ്ട്രേഷന് റാല്മിനോവ് ചെയ്തിട്ടുണ്ടു്
site 1: http://റാല്മിനോവ്.blogspot.com
site 2: http://റാൽമിനോവ്.blogspot.com [അറ്റോമിക് ചില്ലു്]
വ്യാജന്മാരുടെ ചാകര എന്ന പോസ്റ്റും കാണുക.
Thursday, January 24, 2008
Subscribe to:
Post Comments (Atom)
അപ്പോഴേ സന്തോഷ്, ഈ അപകടം ചൂണ്ടി കാണിച്ച് രണ്ടിലേതെങ്കിലും ഒരു തരത്തിലുള്ള ചില്ലുകളേ നടപ്പില് വരുത്താവൂ എന്ന് ആരോടാണ് പറയേണ്ടത്, പരഞ്ഞാല് നടപ്പില് വരുത്തൂല്ലേ? Backward compatibility വേണമെങ്കില് നിലവിലുള്ള ചില്ലുകള് ആവശ്യമാണ്. എന്നാല് ആണവ ചില്ല് വേണ്ടെന്നു വച്ചു കൂടേ. ഓ, അപ്പോള് ZWJ ആവശ്യമായി വരുന്നു അല്ലേ.
ReplyDeleteസന്തോഷേ,
ReplyDeleteഒരു സംശയം ചോദിച്ചോട്ടെ:
ഐ.ഡി.എന്. സ്പൂഫിംഗിനുള്ള സാദ്ധ്യത കൂട്ടാന് ആണവ ചില്ലുതകും എന്നാണോ? ചില്ലേതായാലും zwnj തരം പോലെ തിരുകികയറ്റിയാലും സ്പൂഫിംഗ്ഗ് ചെയ്യാമല്ലോ? താഴെ കാണുന്ന "സര്ക്കാര്" കാണൂ.
1) സര്ക്കാര് - U+0D38 U+0D30 U+0D4D U+0D15 U+0D4D U+0D15 U+0D3E U+0D30 U+0D4D
2) സര്ക്കാര് - U+0D38 U+0D30 U+0D4D U+200C U+200C U+200C U+200C U+0D15 U+0D4D U+0D15 U+0D3E U+0D30 U+0D4D
3)സര്ക്കാര് - U+0D38 U+200C U+200C U+200C U+200C U+0D30 U+0D4D U+200C U+200C U+200C U+200C U+0D15 U+0D4D U+0D15 U+0D3E U+0D30 U+0D4D
4) സര്ക്കാര് - U+0D38 U+0D30 U+0D4D U+200C U+200C U+200C U+200C U+0D15 U+0D4D U+0D15 U+0D3E U+200C U+200C U+200C U+200C U+200C U+200C U+0D30 U+0D4D
യൂ.ആര്,എല്. സ്പൂഫിംഗ് ഒഴിവാക്കേണ്ടത് യൂണീകോഡിന്റ്റെ ബാദ്ധ്യത ആണോ? അല്ല എന്ന് എന്റ്റെ പക്ഷം.
സ്പൂഫിംഗ്/ ഫിഷിങ്ങ് തുടങ്ങിയതൊക്കെ ഒഴിവാക്കുക എന്നത് ബ്രൗസറുകളുടെയും മറ്റും ബാദ്ധ്യതയല്ലേ?
ഏവൂരാനു് കാര്യം മനസ്സിലാകായ്കയില്ല എന്നു് കരുതാം. എന്നാലിതു് വായിക്കാനിടവരുന്ന മറ്റുള്ളവരുടെ അറിവിലേക്കായി:
ReplyDeleteജോയ്നറും നോണ്ജോയ്നറും ഇന്നു് എത്രയെണ്ണം ഇട്ടാലും സ്പൂഫിങ് നടക്കില്ല.കാരണം ഐഡിയെന് അവ കളയും. പിന്നെ കാഴ്ചയ്ക്ക് പല സൈറ്റുകളുണ്ടാക്കാം, പക്ഷെ അവയൊക്കെ ഒരു സൈറ്റിലേക്കേ പോകൂ. ഇതിനെ സ്പൂഫിങ് എന്നല്ല പറയുക. നമ്മുടെ വന്യവനിക മറന്നിട്ടില്ലല്ലോ.
ഏവൂരാന് താങ്കള് കൊടുത്ത കോഡുകള് പ്രകാരം ഒന്നില് കൂടുതല് സൈറ്റുകള് റെജിസ്റ്റര് ചെയ്യാന് സാധിക്കില്ല, കാരണം അവയുടെ എല്ലാം Punycode ഒന്നാണു്.എന്നാല് ചില്ലു് വന്നാല് കഥ മാറി. ആണവചില്ലുള്ളവയ്ക്കു് Punycode വേറെയാണു്.
നന്ദി റാല്മിനോവേ..!
ReplyDeleteഅറിയായ്ക തന്നെയായിരുന്നു. പ്യൂണീകോഡെന്ന സംഭവത്തെക്കുറിച്ച് താങ്കളുടെ കമന്റ്റിനു മുമ്പ് അറിവില്ലായിരുന്നു.
നന്ദി. ഐ നൌ സ്റ്റാന്ഡ് കറക്ടഡ്.
അങ്കിള്, യൂണിക്കോഡ് റ്റെക്നിക്കല് കമ്മിറ്റിയാണ് തീരുമാനമെടുക്കുന്നതു്. ഇതിനെപ്പറ്റി ധാരാളം എതിര്പ്പുകള് യൂണീക്കോഡിന്റെ ഇന്ഡിക് മെയിലിങ് ലിസ്റ്റില് വളരെയധികം പേര് ഉന്നയിച്ചിരുന്നു. പക്ഷേ നമ്മുടെ ഭാഷയുടെ ഭാവിയെ നിശ്ചയിക്കുന്ന ഒരു പ്രധാനകാര്യമായിട്ടും ഭാഷാവിദഗ്ദ്ധര് ഈ വിഷയത്തെപറ്റി ബോധവാന്മാരല്ല. സാങ്കേതികജ്ഞാനം ഇല്ല എന്നതാണ് ചൂണ്ടിക്കാണിക്കപ്പെടുന്നത്. ചര്ച്ചയില് പങ്കെടുത്തവര് അധികവും സാങ്കേതികരംഗത്തു നിന്നുള്ളവരും.
ReplyDeleteഅങ്ങനെയുള്ള ഈ തീരുമാനം നിരവധി പരിഹരിക്കപ്പെടാതെയുള്ള പ്രശ്നങ്ങള് അവശേഷിപ്പിച്ചു് കൈക്കൊള്ളുമ്പോള് മലയാളികളില് വളരെയധികം പേര് ഇതിനെപ്പറ്റി അറിയാതിരിക്കുന്നത് വളരെ മോശമല്ലേ? മറ്റു രാജ്യങ്ങളില് നിന്നുള്ള ആളുകളുടെ ഭാഷയെപ്പറ്റിയുള്ള പരിമിത ജ്ഞാനത്തിന്റെ അടിസ്ഥാനത്തില് നമ്മുടെ ഭാഷയുടെ ഭാവി തീരുമാനിക്കപ്പെടുന്നതു് എത്ര ദയനീയമാണു്?
പ്രവീണ് എഴുതിക്കൊണ്ടിരിക്കുന്ന ഇതിനെപ്പറ്റിയുള്ള ബ്ലോഗ് പോസ്റ്റുകള് വായിക്കുന്നുണ്ടെന്നു വിചാരിക്കുന്നു.
സംഗതികളുടെ കിടപ്പറിയാന് ഇന്നലെ യൂണിക്കോഡ് മെയിലിങ് ലിസ്റ്റില് പ്രവീണിന്റെ ചോദ്യത്തിന് James Kass എന്നൊരാള് എഴുതിയ മറുപടി നോക്കൂ..
> 4. But if you can't forbid the existing sequences what use is the newly
> added atomic chillus going to serve?
A. It adds variant spellings, which is not always a good thing.
B. It offers employment opportunities for people involved in
file/character conversion.
C. It offers more employment opportunities for anyone working
in text processing, search engine technology, text display, and
so forth because everything will need to be upgraded to support
the new variant spellings.
ഐസിയുവിന്റെ ഐഡിഎന് ബ്രൌസര് പേജില് പോയി എങ്ങനെ പ്യൂണീക്കോഡില് വ്യത്യാസം വരുന്നു എന്നു മനസ്സിലാക്കാം.
ReplyDeleteസന്തോഷിനും റാല്മിനോവിനും നന്ദി. കാര്യങ്ങള് ഞാനും മനസ്സിലാക്കാന് ശ്രമിക്കുന്നു.
ReplyDeleteഇത്രയും വിവരങ്ങള്ക്കു നന്ദി
ReplyDeleteസന്തോഷെ,
ReplyDeleteബാക്വേഡ് കമ്പാറ്റിബിലിറ്റി വേണമെന്നു നിര്ബന്ധം പിടിക്കുമ്പോഴല്ലേ, ഈ പ്രശ്നം? ചില്ലക്ഷരം എന്നല്ലേ നമ്മള് പറയാറു്? അപ്പോഴവ ഒറ്റയൊറ്റ അക്ഷരങ്ങള് തന്നെയല്ലേ? മറ്റു ഭാഷകളില് നിന്നു് വ്യതിരിക്തമായ മലയാളത്തിന്റെ ഒരു സ്വഭാവവും... അതിനെ സെപ്പറേറ്റ് ക്യാരക്ടറായി അംഗീരിക്കുക തന്നെയല്ലേ നല്ലതു്? മുമ്പെഴുതിയ ബ്ലോഗ് പേജുകളുടെയും വിക്കിയ തുടങ്ങിയ വിജ്ഞാന - സാങ്കേതിക പേജുകളുടെയും കാര്യത്തില് വല്ല പാച്ചോ ബോട്ടോ (ഇതൊക്കെ എന്താന്നു് എന്നോടു ചോദിക്കല്ലേ...) ഒക്കെ ഉപയോഗിച്ചു് കറക്ട് ചെയ്യാനുള്ള സംവിധാനം ഒരുക്കാന് മലയാളം കമ്പ്യൂട്ടിംഗു് രംഗത്തു പ്രവര്ത്തിക്കുന്നവര്ക്കു് കഴിയില്ലെന്നുണ്ടോ?
സെബിനേ, അങ്ങനെയാണെങ്കില് കൂട്ടക്ഷരം എന്നു് നമ്മള് വിളിയ്ക്കുന്നവയോ? അവയും ഒറ്റ അക്ഷരമാണെന്നുണ്ടോ? എല്ലാ കൂട്ടക്ഷരങ്ങളും കൂടി ഉള്പ്പെടുത്തണമെന്നു് സെബിന് പറയൂമോ?
ReplyDeleteഅറിയില്ല എന്നു് സെബിന് തന്നെ സമ്മതിച്ച കാര്യം ഒരു കരുതിക്കൂട്ടിയുണ്ടാക്കുന്നൊരു പ്രശ്നത്തിനു് പരിഹാരമായി പറയുന്നതു് കാണുമ്പോള് എനിയ്ക്കു് ശരിയ്ക്കും സങ്കടം വരുന്നു.
മലയാള ഭാഷയെന്താ എല്ലാവര്ക്കും കയറിയിനിരങ്ങാനുള്ളിടമാണോ?
ഞങ്ങള് കുളമാക്കിത്തരാം, നിങ്ങള്ക്കു് കഴിവുണ്ടേല് ശരിയാക്കിക്കോ എന്നാണോ?
പ്രവീണ്,
ReplyDeleteക്ക എന്നെഴുതിയാലും ക്ക ആണു് ഉദ്ദേശിക്കുന്നതു് എന്നു് മനസ്സിലാക്കാനാവും. കാരണം, രണ്ടു് ക ചേരുന്ന അക്ഷരമാണു് ക്ക. അതുകൊണ്ടാണല്ലോ കൂട്ടക്ഷരം എന്ന പ്രയോഗം.
എന്നാല് 'വരമൊഴി മലയാള'ത്തില് പഴക്കമായവര്ക്കല്ലാതെ ര് എന്നെഴുതിയാല് അതു് ചില്ലക്ഷരമാണെന്നു് പെട്ടെന്നു് പിടികിട്ടുമോ? ടൈപ്പ് റൈറ്ററില് ആവശ്യത്തിനു് കീ സ്ഥാനങ്ങള് ഇല്ലാഞ്ഞതുകൊണ്ടു് ഭാഷയില് പല കോപ്രായങ്ങളും വരുത്തി. അതു തിരുത്താന് ലഭിക്കുന്ന അവസരം കേവലം ൫൦൦൦ വിക്കി ലേഖനത്തിന്റെ പേരില് ഉപേക്ഷിക്കേണ്ടതുണ്ടോ?
ടൈപ്പു് ചെയ്യുന്നവരെ സംബന്ധിച്ചു് വ്യജ്ഞനം+്+zwj ഒറ്റ കീ അമര്ത്തിയാല് കിട്ടാവുന്ന തരത്തില് മാപ് ചെയ്താല് ഈ സീറോവെയ്റ്റ് ക്യാരക്ടര് കടന്നുവരുന്നതു് അറിയില്ല. ദാ, ഞാനിപ്പോളുപയോഗിക്കുന്ന റാല്മിനോവിന്റെ ആള്ട്ട് മോഡിഫയറുപയോഗിച്ചു വിപുലപ്പെടുത്തിയ ഇന്സ്ക്രിപ്റ്റ് കീബോര്ഡില് അതാണു് ചെയ്തിരിക്കുന്നതു്. എന്നുവച്ചു്, ആ ലോജിക് - എന്റെ അനുമാനത്തില് തെറ്റായ ലോജിക് - അവിടെ പ്രവര്ത്തിക്കാതിരിക്കുന്നില്ലല്ലോ.
സ്വയമേവ കൂടിച്ചേരാനിടയില്ലാത്ത രണ്ടക്ഷരങ്ങള് നിര്ബന്ധമായും കൂട്ടിച്ചേര്ക്കാനുള്ള നിര്ദ്ദേശം നല്കാനായല്ലാതെ zwjയും കൂട്ടക്ഷരമായി സ്വയമേവ മാറുന്ന രണ്ടക്ഷരങ്ങളെ ഞാന് ഈ കമന്റിന്റെ തുടക്കത്തില് ചെയ്തതുപോലെ നിര്ബന്ധമായും രണ്ടുതുണ്ടമായി നിര്ത്തേണ്ടിവരുന്ന അവസരങ്ങളിലൊഴികെ zwnj / nj ചന്ദ്രക്കല യും ഉപയോഗിക്കേണ്ടാത്ത അവസ്ഥയാണു് അഭികാമ്യം. വെറുതെ രേഖാഭാരം (ഫയല് സൈസിനു് അങ്ങനെ പറയാമോ?) കൂട്ടാന് ഇടയാക്കുന്ന ഈ അദൃശ്യസ്ഥാനഭേദികളെ എന്തിനു് സകലയിടത്തും വലിച്ചിടണം?
പിന്നെ ള്, ല്, ര്, ക്, ന്, ണ് എന്നിങ്ങനെ ആറുചില്ലുകളല്ലേ ഉപയോഗത്തിലുള്ളൂ? അതില് തന്നെ ക് വളരെ പരിമിതമായാണു് ഉപയോഗിക്കുന്നതു്. മ, യ തുടങ്ങിയ അക്ഷരങ്ങള്ക്കും ചില്ലുണ്ടാകാം എന്ന വാദം വെറുതെ വാദത്തിനു വേണ്ടിയുള്ള വാദമായാണു് എനിക്കു തോന്നുന്നതു്. ഇങ്ങനെ വെറും ആറക്ഷരങ്ങള് കൂടി യൂണിക്കോഡ് മലയാളം അക്ഷരമാലയില് സ്ഥാനംപിടിക്കുന്നതുകൊണ്ടു് ആരുടെ ഈഗോയാണു് താഴെപ്പോകുന്നതു്?
സെബിന്,
ReplyDeleteഞാന് ആണവ ചില്ലിന്റെ വിപത്തുകളെപ്പറ്റി പല പോസ്റ്റുകളായി എന്റെ ബ്ലോഗിലെഴുതിയിട്ടുണ്ടു്. അതെല്ലാമൊന്നു് വായിച്ചതിനു് ശേഷം സെബിന് ഇപ്പോ പറഞ്ഞ കാര്യം ഒന്നു് കൂടി വായിച്ചു് നോക്കാമോ?
"ചില്ലക്ഷരവും അതിന്റെ അടിസ്ഥാന അക്ഷരവും തമ്മിലുള്ള ബന്ധം നശിപ്പിയ്ക്കുന്നതു് കൊണ്ടാണു് ആണവ ചില്ലുകള് സ്വീകാര്യമല്ലാത്തതു്."
ചില്ലക്ഷരങ്ങള് അടിസ്ഥാനാക്ഷരങ്ങളല്ല എന്നതു് തന്നെയാണവ വേറെയാക്കാതിരിയ്ക്കാനുള്ള കാരണം.
ഇനി 'ന്' എന്ന അക്ഷരത്തിനു് 'ന' എന്ന അക്ഷരത്തോടൊരു ബന്ധവുമില്ലെന്നാണോ? സെബിന്റെ വിശ്വാസമതാണെങ്കില് ഇനി കൂടുതല് പറഞ്ഞിട്ടൊരു കാര്യവുമില്ല.
സെബിന്റെ വാക്കുകള് ഇനിയും വിലയ്ക്കെടുക്കണമെങ്കില് ആദ്യം ഒരു പാച്ചെന്താണു് ഒരു ബോട്ടെന്താണെന്നു് പഠിച്ചിട്ടു് വരൂ. ഇവിടെ ചില്ലക്ഷരങ്ങളെ എതിര്ക്കുന്ന ഓരോരുത്തരും കാര്യങ്ങള് പഠിച്ചും പ്രശ്നങ്ങള് മനസ്സിലാക്കിയുമാണു് പ്രതികരിയ്ക്കുന്നതു്. ഇത്രയും നിരുത്തരവാദവപരമായൊരു പെരുമാറ്റം സെബിനെങ്ങനെ ന്യായീകരിയ്ക്കാന് പറ്റു?
ReplyDeleteപ്രവീണ്,
ReplyDeleteഇക്കാര്യത്തില് പ്രവീണ് പുതുതായെഴുതിയ രണ്ടുപോസ്റ്റുകളും വായിച്ചിരുന്നു. പഴയ പോസ്റ്റുകള് ഉടനെ നോക്കാം. പാച്ചും ബോട്ടും എന്താണെന്നു് പഠിക്കുകയും ചെയ്യാം. ബോട്ടിനെ കുറിച്ചൊക്കെ വായിച്ചതു് മലയാളം യൂണിക്കോഡ് വിവാദം വിശദീകരിക്കുന്ന വിക്കിയ താളില് നിന്നാണു്. അതില് പറഞ്ഞിരിക്കുന്ന കാര്യങ്ങളില് വിയോജിക്കാന് യുക്തിഭദ്രമായ കാരണം കണ്ടില്ല. ഞാന് സാങ്കേതിക വിദഗ്ദ്ധന്റെ കോട്ടിട്ടുകൊണ്ടല്ല, ഭാഷാ സ്നേഹിയുടെ കുപ്പായമിട്ടുകൊണ്ടാണു് സംസാരിച്ചതു്. തെറ്റുബോദ്ധ്യപ്പെട്ടാല് തിരുത്താന് തയ്യാറുമാണു്.
ചില്ലക്ഷരങ്ങള്ക്കു് അടിസ്ഥാന രൂപങ്ങളില്ലെന്ന വാദമൊന്നും എനിക്കില്ല. എന്നാല് ല് എന്ന ചില്ലിന്റെ അടിസ്ഥാന രൂപം ത ആണോ ല ആണോ എന്ന തര്ക്കം കോഴി - മുട്ട തര്ക്കം പോലെ തുടരുകയാണു്. അതു് എന്തുമാകട്ടെ, ചില്ലുകള് വ്യത്യസ്തമായ ഒരു ചിഹ്നമാണെന്നും നമ്മുടെ അക്ഷരവ്യവസ്ഥയില് അതിനു് സവിശേഷ സ്ഥാനമുണ്ടെന്നും ഉള്ള കാര്യത്തില്തര്ക്കമുണ്ടാവില്ലല്ലോ. ചന്ദ്രക്കല, പുള്ളി, കെട്ടുപുള്ളി, വള്ളി, കെട്ടുവള്ളി, ദീര്ഘം എന്നിവ പോലെ സ്വതന്ത്രമായ നിലനില്പ്പില്ലാത്തതും എന്നാല് വ്യജ്ഞനാക്ഷരങ്ങളോടു ചേര്ന്നു് സ്വരസ്ഥാനം ഉത്പാദിപ്പിക്കുന്നതുമായ കേവല ചിഹ്നവുമല്ല, ചില്ല്. അതു് മറ്റൊരക്ഷരത്തോടും ചേരുന്നില്ല. സ്വതന്ത്രമായി തന്നെയാണു് നില്പ്പു്. ഒട്ടുപിരിച്ചെഴുതി കാട്ടാനുമാവില്ല എന്നാണു് ഞാന് മനസിലാക്കിയിട്ടുള്ളതു്. ണ് എന്നെഴുതിയാല് ണ് ആവില്ലല്ലോ.
(ശ്ശൊ, ഇതു് ബ്ലോഗര് കമന്റിലും ജിമെയിലിലും എങ്ങനെയാണാവോ കാണിക്കുക? യൂണിക്കോഡില് സ്ഥിതനായിരിക്കുന്ന ... എന്ന പ്രാര്ത്ഥനയില് നിന്റെ ചില്ലുകള് തെളിയേണമേ എന്ന വരി വീണ്ടും വീണ്ടും ചൊല്ലാന് തോന്നുന്നു!)
ഇതില് വ്യാകരണപ്പിശകുണ്ടെങ്കില് കയ്യോടെ തിരുത്തിക്കൊള്ളാം. ആരെങ്കിലും വ്യക്തമായി വിശദീകരിച്ചു തരേണ്ട കാര്യമേയുള്ളൂ.
പിന്നെ ZWJ, ZWNJ, NJ ചന്ദ്രക്കല എന്നിവയുടെ അനാവശ്യ ഉപയോഗം ഒഴിവാക്കുക എന്നതു് ചെറിയ കാര്യമാണോ? അതേക്കുറിച്ചു് എന്റെ അഭിപ്രായം മുന് കമന്റില് പറഞ്ഞിരുന്നു.
ReplyDeleteതുടര് കമന്റുകള്ക്കു ക്ഷമാപണം.
ReplyDeleteസ്പൂഫിംഗു് ഒഴിവാക്കാന് ആണവ ചില്ലിനെ മാത്രം അംഗീകരിക്കുക എന്നതല്ലേ നല്ലതു്? എഴുത്തുരീതിയെക്കുറിച്ചുള്ള എന്റെ അഭിപ്രായം പ്രവിയുടെ ജേണലില് ഞാന് ചോദിച്ചിരുന്നു, അതിവിടെയും ആവര്ത്തിക്കുകയാണു്.
റാല്മിനോവ് എന്നെഴുതുന്നതു് റാ+ല+nj ചന്ദ്രക്കല+മി+... എന്നല്ലേ?
റാല്മിനോവ് എന്നെഴുതുന്നതു് റാ+ല+സാധാചന്ദ്രക്കല+മി+... എന്നല്ലേ?
റാൽമിനോവ് എന്നെഴുതേണ്ടതു് റാ+ൽ+മി+... എന്നല്ലേ?
അല്ലാതെ ഇപ്പോഴുള്ളതു പോലെ റാ+ല+ചന്ദ്രക്കല+zwj+മി ... എന്നാണോ?
അതെങ്ങനെ മലയാളമാകും?
യന്ത്രത്തെ ഭാഷയ്ക്കു് വഴക്കിയെടുക്കണം, അല്ലാതെ ഭാഷയെ യന്ത്രത്തിനല്ല എന്നു തോന്നുന്നു.
സെബിന്,
ReplyDeleteപ്രശ്നം താങ്കള് ഉദ്ദേശിക്കുന്നതു് പോലെ നിസ്സാരമല്ല ബാക്ക്വേര്ഡ് കംപാറ്റിബിലിറ്റി എന്നതാണു്. ഇപ്പോഴത്തെ ചില്ല് സീക്വന്സ് വളരെക്കാലം കൂടി തുടരും (ഒരുപക്ഷെ അനന്തമായി തന്നെ).
റാല്മിനോവ് എന്നെഴുതാന് മൂന്നു് സ്പെല്ലിങ് കണ്ടു. ഇപ്പോഴത്തെ സ്ഥിതിയില് ഒരു പേരു് രെജിസ്റ്റര് ചെയ്താല് എനിക്കു് മൂന്നു് സ്പെല്ലിങും ഉപയോഗിക്കാം. ആണവചില്ല് വന്നാല് രണ്ട് സ്പെല്ലിങ് ഞാന് രെജിസ്റ്റര് ചെയ്യേണ്ടി വരും, സ്പൂഫിങ് തടയാന്.
ആണവചില്ലിനു് ഇപ്പോഴത്തെ സീക്വന്സുമായി ഒരു മാപ്പിങ് കൊടുത്താല് പ്രശ്നം കുറെയൊക്കെ പരിഹരിക്കാം.
അപ്പര് ലോവര് കേസ് പോലെയൊക്കെ പരിഗണിച്ച് ഒപ്പിച്ചെടുക്കാം.
ചില്ല് എന്നതു് അക്ഷരത്തിന്റെ ഒരു കാരക്റ്ററാണു്. കായ്കറികള് എന്നെഴുതുമ്പോള് യ യ്ക്ക് ഉള്ളതു് പോലെ. പാഴ്വാക്കു് എന്നതില് ഴ. ഇവയ്ക്കൊന്നു് പ്രത്യേക അക്ഷരങ്ങള് നിലവിലില്ലെങ്കിലും അവ റാല്മിനോവിലെ ല് പോലെതന്നെ "ചില്ലിങ്" കാരക്റ്ററുള്ളതാണു്. പ്രത്യേക അക്ഷരങ്ങള്ക്കൊക്കെ കോഡ്പോയന്റ് നല്കണമെങ്കില് മ്പ, ങ്ക , ്യ, ്ര, ്ല , ്വ എന്നിവയ്ക്കൊക്കെ ആവാം. ഫയല് സൈസൊക്കെ ഇവിടെയും ലാഭിക്കാമല്ലോ.
എന്നാലോ ഇപ്പോഴും ജോയ്നറില്ലാതെ അമ്മായ്യേ എന്നു് വിളിക്കാനും പറ്റില്ല.
മലയാളത്തെ ഡിപ്രിക്കേറ്റ് ചെയ്യാന് മാത്രം പറയാതിരുന്നാല് നന്നു്.
റാല്മിനോവിന്റെ അഭിപ്രായങ്ങള് വായിച്ചു് കാണും എന്നു് കരുതുന്നു. നിങ്ങള് പറയുന്നതു് പോലെ zwj/zwnj എന്നിവയുടെ ഉപയോഗം ഒഴിവാക്കാനാണു് ഈ ആണവ ചില്ലെന്നു് സിബു പോലും പറയില്ല കാരണം ആണവ ചില്ലു് വന്നാലും ഇവയില്ലാതെ മലയാളം ഓടില്ല. ഇനി റാല്മിനോവ് പറഞ്ഞ പോലെ, മലയാളം തന്നെയങ്ങ് ഡിപ്രിക്കേറ്റ് ചെയ്തോളൂ എന്നാണോ?
ReplyDeleteനാണമുണ്ടോ ഫയല് സൈസ് ലാഭിയ്ക്കാം എന്നൊക്കെ ഇപ്പോഴും പറഞ്ഞു നടക്കാന് (ആണവ ചില്ലിനെ അനുകൂലിയ്ക്കുന്നവര് പോലും കളിയാക്കും ഇതു് പോലുള്ള വാദങ്ങളിറക്കിയാല്) ഫ്ലോപ്പി ഡിസ്കിന്റേയും ടൈപ്റൈറ്ററിന്റേയും കാലമൊക്കെ കഴിഞ്ഞു. ഇവിടെ പ്രശ്നം ആണവ ചില്ലു് വന്നാല് ഡിജിറ്റല് യുഗത്തില് മലയാളത്തിനു് നേരിടേണ്ട പ്രശ്നങ്ങളാണു്. യന്ത്രത്തിനു് വേണ്ടി ഭാഷയെ വളയ്ക്കുക എന്നു് സെബിന് നേരത്തെ പറഞ്ഞില്ലേ അത്തരത്തിലുള്ളൊരു വാദമാണു് സെബിനിപ്പറഞ്ഞതും. ഇതേ വാദമല്ലേ കൂട്ടക്ഷരങ്ങള് നിര്ദാക്ഷിണ്യം വെട്ടിമുറിയ്ക്കാനും ഉപയോഗിച്ചതു്? പക്ഷേ അന്നാണെങ്കില് അതു് ടൈപ്റൈറ്റരില് കൊള്ളില്ലായിരുന്നു വേറെ വഴിയില്ലായിരുന്നു എന്നെങ്കിലും പറയാം. ഒരു ബ്ലോഗ് പോസ്റ്റില് സെബിന് എത്ര കണ്ടു് വലിപ്പം ലാഭിയ്ക്കുമെന്നാലോചിച്ചിട്ടുണ്ടോ?
ഉദാഹരണത്തിനു് അങ്കിളിന്റെ ആദ്യത്തെ അഭിപ്രായം നോക്കുക. ആറു് ചില്ലക്ഷരമാണതിലുപയോഗിച്ചിരിയ്ക്കുന്നതു്. പന്ത്രണ്ടു് ബൈറ്റ് സെബിന് ലാഭിയ്ക്കും അതില്. ഇനി നൂറു ചില്ലുകളുപയോഗിയ്ക്കുമ്പോള് സെബിന് ലാഭിയ്ക്കുന്നതു് ഇരുനൂറു് ബൈറ്റ്. ഒരു ഫ്ലോപ്പിയില് കൊള്ളുന്നത്രയും സ്ഥലം ലാഭിയ്ക്കണമെങ്കില് എത്ര ബോഗ് പോസ്റ്റുകള് വേണമെന്നു് ചിന്തിയ്ക്കുക. യുട്യൂബിലെ ഒരു വീഡിയോയുടെ വലിപ്പമുള്ളത്രേം സ്ഥലം ലാഭിയ്ക്കാന് എത്ര ആണവ ചില്ലു് വേണമെന്നു് കണക്കു് കൂട്ടിനോക്കൂ. അപ്പോഴറിയാം എത്ര ബാലിശമാണു് ഫയല് വലിപ്പത്തിന്റെ വാദമെന്നു്. ചെരിപ്പിനനുസരിച്ചു് കാല് മുറിച്ചോളൂ എന്നാണോ?
സെബിന് ഝ എന്നതു് ത ചന്ദ്രക്കല ധ എന്നല്ലേ എന്നു് ചോദിയ്ക്കാത്തതു് ഭാഗ്യം. ഇനി സെബിന് പറഞ്ഞതു് പോലെ ല് എന്നതു് ല യുടേയും ത യുടേയും ചില്ലു് തന്നെയാണെന്നു് വയ്ക്കുക. ആണവ ചില്ലു് വന്നാല് അകാരാദിക്രമത്തില് തരം തിരിയ്ക്കുമ്പോള് (sorted in alphabetical order) അതിനെ എവിടെ വയ്ക്കും. സെബിനെ ബ്ലോഗും അച്ചടിയും കഴിഞ്ഞും പലതും ചെയ്യാനാകും കമ്പ്യൂട്ടറില് എന്നാദ്യം മനസ്സിലാക്കുക. ഇതിനെപ്പറ്റിയൊന്നു് ആലോചിയ്ക്കുകയോ ഉത്തരം പറയാതിരിയ്ക്കുകയോ ചെയ്യുന്നവര് മലയാള ഭാഷയെയാണു് ദ്രോഹിയ്ക്കുന്നതെന്നോര്ക്കുക.
പിന്നെ പാച്ചും ബോട്ടും പഠിയ്ക്കാമെന്നു് പറഞ്ഞതില് സന്തോഷം. സിബു വരെ ആ വാദം നിര്ത്തി എന്നു് സെബിനറിയുമോ? മഹേഷ് ടി പൈ വരെ പഴയ ചില്ലുകള് സംരക്ഷിയ്ക്കണമെന്നാണു് പറയുന്നതു്. സെബനെ ഇപ്പോ പറഞ്ഞതു് പറഞ്ഞു, ഇനിയും പാച്ച്, ബോട്ട് എന്നൊക്കെ പറഞ്ഞാല് സിബു പോലും പിന്തുണയ്ക്കില്ല.
zwj, zwnj എന്നിവയുടെ അനാവശ്യ ഉപയോഗത്തെപ്പറ്റി. ഇന്ഡിക് പേര്ഷ്യന് ഭാഷകളുടെ പ്രത്യേകതകളെ പിന്തുണയ്ക്കാണിവ കൊണ്ടുവന്നതെന്നു് സെബിനറിയുമോ?
റാല്മിനോവ് പറഞ്ഞ കായ്കറികള്, താഴ്വാരം എന്നീ വാക്കുകളെപ്പറ്റി എന്തു് പറയുന്നു.
ഗൂഗിളെടുത്തു് malayalam bloggers are fools എന്നു കൊടുത്തു് ഞാന് ഭാഗ്യവാനാണെന്നു പറഞ്ഞാല് കുറച്ചു കാര്യങ്ങളറിയാനുള്ള ഭാഗ്യം നിങ്ങള്ക്കു ലഭിക്കുന്നതാണു്...!
ReplyDeleteക്യാരക്ടറുകളെല്ലാം ഇന്ഡിപെന്റന്റായി നില്ക്കുന്ന ലാറ്റിന് ഭാഷകളുടെ കാര്യത്തില് ക്യാകര്ക്ടറുകളുടെ “ലിംഗ്വിസ്റ്റിക് റപ്രസെന്റേഷന്” പ്രശ്നമല്ലാതിരിക്കാം. എന്നാല് ഒട്ടേറെ സങ്കീര്ണ്ണതകളുള്ള മലയാളം പോലുള്ള ഭാഷകളിലെ ക്യാരക്ടറുകള്ക്ക് “ലിംഗ്വിസ്റ്റിക് റപ്രസെന്റേഷന്” നോക്കിയേ പറ്റൂ. യൂണീക്കോഡ് കണ്സോര്ഷ്യത്തിന്റെ ബൈലോയില് അങ്ങനെ പറയുന്നില്ലായിരിക്കാം. യൂണീക്കോഡ് കണ്സോര്ഷ്യത്തിനായി നമ്മുടെ ഭാഷ എന്നല്ല, നമ്മുടെ ഭാഷയ്ക്കായി യൂണീക്കോഡ് കണ്സോര്ഷ്യം എന്നായിരിക്കണം നമ്മുടെ രാഷ്ട്രീയം. ഞാന് പറഞ്ഞ് മടുത്തു. നമ്മുടെ സര്ക്കാരില്, ഭാഷയുടെ കമ്പ്യൂട്ടേഷണല് പ്രശ്നങ്ങള് മനസ്സിലാവുന്ന ഒരൊറ്റ ഉദ്യോഗസ്ഥനും ഇല്ലേ എന്റെ ദൈവമേ? - ബെന്നി
ReplyDeleteസെബിനേ, പ്രവീണേ
ReplyDeleteസെബിന്റേത് നിര്ദ്ദോഷമായ ഒരു ചോദ്യമാണ്. യൂണിക്കോഡ് ഇന്ഡിക് ലിസ്റ്റിലെ ഡിസ്കഷന്റെ ചൂടൊന്നും ഇവിടെ വേണ്ട. സെബിന് പ്രവീണ് ചര്ച്ച ചെയ്ത് അല്പം ചൂടായതാണ് . ക്ഷമിക്കുക.
ഇന്നുള്ള എല്ലാ സോഫ്റ്റ്വെയറുകളും മലയാളമുല്പ്പാദിച്ചുകൊണ്ടേയിരിക്കും. അവ ഇപ്പോള് യൂണിക്കോഡ് 5.0 കംപാറ്റിബിള് ആന്. അവര് എല്ലാവരും യൂണിക്കോഡ് സ്റ്റാന്ഡേര്ഡിനനുസരിച്ചു പരിഷ്കരിക്കണമെന്നില്ല. പരിഷ്കരിച്ചാല് തന്നെ എല്ലാ ഉപഭോക്താക്കളും അപ്ഡേഠ്ട് ചെയ്യണമെന്നില്ല. അതുപോലെ ഇന്നുള്ള മലയാളം (യൂണിക്കോഡ് 5.0 അനുസരിക്കുന്നത്) വരും കാലത്ത് ശരിക്കുകാണിക്കുന്നതിന് ( ഡിജിറ്റല് ഡാറ്റയ്ക്ക് മരണമില്ലല്ലോ) എല്ലാ ഫോണ്ടുകളും വീണ്ടും ഈ രണ്ടുസ്കീമുകളേയും പിന്തുണയ്ക്കും. (യൂണിക്കോഡിന് സ്റ്റെബിലിറ്റി പൊളിസിയുണ്ടെന്ന് മറക്കല്ലേ) ഇതൊന്നും ബോട്ടോടിച്ച് തീര്ക്കാവുന്ന പ്രശ്നമല്ല. അപ്പോ എന്തിനാണ് ആണവ ചില്ലന് വരുന്നതെന്ന ചോദ്യം വീണ്ടും വരുന്നു. അഞ്ചാറെണ്ണമല്ലേ ഉള്ളൂ എന്കോഡ് ചെയ്തുകളയാം എന്ന ന്യായമാണ് ഈ നീക്കത്തിനു പുറകില് .
കണ്വീനിയന്സും സെക്യൂരിറ്റിയും ഒരു ആവശ്യത്തിനു പുറകില് വരുമ്പോള് കമ്പ്യൂട്ടിങ്ങ് അറിയുന്ന ആരും പ്രാധാന്യം കൊടുക്കുക സെക്യൂരിറ്റി പ്രശ്നത്തിനാണ്. അതാണ് നമ്മള് ചെയ്യുന്നതും. അതുപോലെ ഭാഷാപരമായ സാധുതയ്ക്കും ഊന്നല് നല്കിയില്ലെങ്കില് മലയാളം കമ്പ്യൂട്ടിങ്ങ് കുട്ടിച്ചോറാവുകയാണ്. ന് ആണവനാകുമ്പോള് അതിന് ന എന്ന അക്ഷരവുമായുള്ള ബന്ധം നഷ്ടപ്പെടുകയാണ്. ര് ആണവനാകുമ്പോള് അതിനും ഭാഷാശാസ്ത്രപരമായ സാധുത നഷ്ടപ്പെടുകയാണ്. അല്ലെങ്കില് നമ്മളാവശ്യപ്പെട്ട cannonical equivalence വേണം. ആണവന് = വ്യഞ്ജനം+ചന്ദ്രക്കല+ZWJ എന്ന നിര്വചനം യൂണിക്കോഡ് പറയണം. (Implimentation ഓപ്പറേറ്റിങ്ങ് സിസ്റ്റം ലെവലിലാനെങ്കിലും)
കമ്പ്യൂട്ടിങ്ങിന്റെ ആവശ്യം മലയാളം ടൈപ്പ് ചെയ്യലോ , കീബോര്ഡ് സൌകര്യമോ മാത്രമല്ല സെബിനേ, സോര്ട്ടിങ്ങ്, സെര്ച്ചിങ്ങ് തുടങ്ങി നിരവധിയനവധി കമ്പ്യൂട്ടിങ്ങ് ഓപ്പറേഷന് ഭാഷയെ പ്രാപ്തമാക്കണമെങ്കില് അതിന്റെ ലോജിക്കല് നിലനില്പ്പ് അത്യാവശ്യമാണ്. അത് Exeptional റൂളുകളുടെ കുത്തരങ്ങാക്കാനെ പുതിയ പരിഷ്കാരം കൊണ്ട് സാധിക്കൂ. മലയാളം കമ്പ്യൂട്ടിങ്ങിന്റെ ഭാവി നിങ്ങളുടെ കയ്യിലാണ് , യൂണിക്കോഡ് 5.1 നെപ്പറ്റി ഇനി അഭിപ്രായം രേഖപ്പെടുത്താന് 8-10 മണിക്കൂറുകള് മാത്രം . വേഗമാകട്ടെ.
സെബിന്,
ReplyDeleteബാക്ക് വേര്ഡ് കമ്പാറ്റിബിലിറ്റി അങ്ങെടുത്തു കളഞ്ഞാല് എന്തു സംഭവിക്കുമെന്ന് നല്ല ബോധമുള്ളതുകൊണ്ടാണ് യൂണിക്കോഡ് ദാ ഇങ്ങനെ ഒരു സാധനം എഴുതി വച്ചിട്ടുള്ളത്.
മഹേഷ് പൈയുടെ വക ഒരു തമാശ പങ്കുവയ്ക്കട്ടെ.
ReplyDeleteസ്പൂഫിങ് തടയാനായി മൂപ്പര് പറഞ്ഞ ഉപായം input method-ല് മാറ്റം വരുത്തിയാല് മതി എന്നാണു്.അതായതു് കക്കാന് വരുന്നവന് ഗേറ്റില് പൂട്ടുകണ്ടു് മടങ്ങിപ്പോയ്ക്കോളും എന്നു പറയുന്നതു പോലെ!
അനിവര്,
ReplyDeleteപ്രവീണ് അങ്ങനെ സംസാരിച്ചതില് എനിക്കു് പരിഭവമൊന്നുമില്ല. വിഷയത്തിന്റെ extremeല് നില്ക്കുന്നതുകൊണ്ടാണു് പ്രവീണ് അങ്ങനെ പറഞ്ഞതെന്നു് എനിക്കു മനസ്സിലാക്കാനാവും. കാരണം ഞാനും എനിക്കു് വ്യക്തമായി അറിയാവുന്ന കാര്യങ്ങളില് ഇതേപോലൊക്കെ മുമ്പു് സംസാരിച്ചിട്ടുണ്ടു്. ഒരു കാര്യത്തില് വ്യക്തമായ ധാരണയും അറിവുമുള്ള ഒരാള്ക്കു് അതേ വിഷയത്തില് പരിമിതമായ അറിവും പക്ഷപാതവുമുള്ള മറ്റൊരാളുടെ 'വിവരക്കേടു്' സഹിക്കാനാവില്ലല്ലോ.
പക്ഷെ ഞാന് വെറുതെ എതിര്ക്കാന് വരികയായിരുന്നില്ല. പ്രശ്നം പഠിക്കുകയായിരുന്നു ഉദ്ദേശ്യം. ഇന്നലെ സാങ്കേതിക കാര്യങ്ങളില് അറിവുള്ള കുറേയേറെ പേരോടു് ഞാന് ഇതേക്കുറിച്ചൊക്കെ സംസാരിച്ചു. അങ്ങനെ ലഭിച്ച ചില ഉള്ക്കാഴ്ചകളുടെ വെളിച്ചത്തില് എന്റെ നിലപാടിനു് ചില മാറ്റങ്ങളും വന്നിട്ടുണ്ടു്. അതു് ആണവ ചില്ലിനെ പൂര്ണ്ണമായും നിരാകരിക്കുന്ന രീതിയിലല്ല, എന്നാല് canonical equivalence വേണം എന്നതിലാണു് വന്നെത്തി നില്ക്കുന്നതു്. അങ്ങനെയെങ്കില് പിന്നെ ആണവ ചില്ലെന്തിനു് എന്ന മറുചോദ്യം വരുമെന്നറിയാം. അതിനുള്ള മറുപടി നേരത്തെ ഞാന് തന്നു കഴിഞ്ഞു എന്നു് കരുതട്ടെ. ഭാഷയുടെ സ്വഭാവത്തിനു് നന്നു് അതാണെന്ന ധാരണയാണു് അതിനു കാരണം.
യൂണിക്കോഡില് ബായ്ക്ക്വേഡ് കമ്പാറ്റിബിലിറ്റി ഉറപ്പാക്കുന്നതു് നല്ല ഉദ്ദേശ്യത്തോടെയാണെന്നു് തിരിച്ചറിയുന്നു. പക്ഷെ എന്തുകൊണ്ടോ, ഒരിക്കല് തെറ്റായ എന്കോഡിംഗു് നടന്നാല് അതു് എല്ലാക്കാലത്തേക്കും അങ്ങനെ നിലനില്ക്കും എന്ന അപകടം പതിയിരിക്കുന്നു. അതില് അസ്വാഭാവികമായി ഒന്നുമില്ല. യൂണിക്കോഡിന്റെ പ്രശ്നമല്ല, ഭാഷയുടെ പരിമിതിയാണു് മലയാളം അഭിമുഖീകരിക്കുന്നതു്. ചരിത്രത്തെ തിരുത്താനുമാവില്ലല്ലോ.
സേര്ച്ചിംഗു്, സോര്ട്ടിംഗു് തുടങ്ങി ഒട്ടേറെ പ്രശ്നങ്ങള് വേറെയുമുണ്ടെന്നും സെക്യൂരിറ്റി മാത്രമല്ല ഇവിടെ വിഷയമെന്നും എനിക്കു് വ്യക്തമായി. മലയാളത്തിന്റെ പ്രശ്നം CJK ഭാഷകള് പോലെ അക്ഷരവൈപുല്യമല്ല, വ്യാകരണ നിയമങ്ങളിലെ ചില അവ്യവസ്ഥകളാണു് എന്നു് ഇപ്പോളെനിക്കു് തോന്നുന്നു. അറബിയിലെ ചില മുഖമില്ലാത്ത ക്യാരക്ടറുകളെ കൈകാര്യം ചെയ്യുന്ന അതേ രീതിയില് മലയാളത്തില് അവയെ കൈകാര്യം ചെയ്യാനാവാത്തതു് അതുകൊണ്ടാണെന്നും തോന്നുന്നു.
ല് തയില് നിന്നാണോ ല യില് നിന്നാണോ എന്നതുപോലെ തന്നെ ര് രയില് നിന്നോ റയില് നിന്നോ എന്നും തര്ക്കമുണ്ടല്ലോ. ഇതും സോര്ട്ടിംഗില് പ്രയാസമുണ്ടാക്കുന്ന കാര്യം തന്നെ. ര് രണ്ടില് നിന്നും ഉണ്ടാവുന്നെണ്ടെന്നു് പറഞ്ഞാല് പോലും ഒരു പ്രത്യേക വാക്കില് അതു് ഏതില് നിന്നാണു് ഉണ്ടായതെന്നു് കമ്പ്യൂട്ടറിനെ എങ്ങനെ മനസ്സിലാക്കിക്കും എന്നതു തന്നെ പ്രശ്നം. ഇതു് ആറ്റോമിക് ചില്ലു് വന്നാലും ഇല്ലെങ്കിലും നിലനില്ക്കുന്ന പ്രശ്നമാണു്. അല്ലെങ്കില് നിഘണ്ടുക്കള് ചെയ്തതുപോലെ കണ്ണുമടച്ചു് രയ്ക്ക് അനുകൂലമായി ഒരു തീര്പ്പുകല്പ്പിക്കേണ്ടി വരും. അതേപോലെ തന്നെയാണു് 'പ്ര'യുടെ കാര്യവും. ഇവിടെയും വിവിധ വാക്കുകളില് പ്രയ്ക്ക് ര ശബ്ദവും റ ശബ്ദവും വരുന്നുണ്ടു്.
ഇതൊക്കെ, മലയാളം ഉച്ചരിക്കുന്നതു പോലെ എഴുതുന്ന ഭാഷയായിരിക്കെ തന്നെ പല സന്ദര്ഭങ്ങളിലും ഒന്നിലേറെ ശബ്ദങ്ങള്ക്കു് വെവ്വേറെ അക്ഷരം ഇല്ലാത്തതിനാല് വരുന്ന പ്രശ്നമാണു്. മലയാളം മാതൃഭാഷയായവര്ക്കു് ഇതു പ്രശ്നമല്ലെങ്കിലും ഇതിനു് കൃത്യമായ നിയമം പറഞ്ഞുകൊടുക്കാന് പ്രയാസമായതിനാല് മറ്റുഭാഷക്കാര്ക്കും യന്ത്രത്തിനും ബുദ്ധിമുട്ടുണ്ടാക്കുന്നു.
പിന്നെയും ചില വാക്കുകളില് മാത്രമായി 'ലളയോ നഭേദഃ' എന്ന നിയമവുമുണ്ടു്. ലയുടെ സ്ഥാനത്തു് ളയും മറിച്ചും ഉപയോഗിക്കാം എന്നു സാരം. എന്നാല് ഇതു് universal law അല്ല. 'ഴ'യും 'ള'യും ഇതേപോലെ മാറിമാറി ഉപയോഗിക്കാറുണ്ടു്.
'മ്പ' ശബ്ദം കൊണ്ടു് 'മ'യുടെയും 'പ'യുടെയും സന്ധിയാണെങ്കിലും 'ന'യും 'പ'യും ചേരുന്ന ചില വാക്കുകള്ക്കു് 'ന്പ' ശബ്ദവും 'മ്പ'ശബ്ദവും ഒരേ സമയം പ്രയോഗിക്കാറുണ്ടു്. എന്നാല് മ്പയുടെ കാര്യത്തില് കാനോനിക്കല് ഈക്വലന്സ് വിലപ്പോവില്ല. ശബ്ദതാരാവലിയും ശ്രീകണ്ഠേശ്വരവും മറിച്ചു പറഞ്ഞാല് പോലും അതു് മയും പയും തന്നെയാണു്. അന്പു്, അമ്പു് എന്നീ വാക്കുകള് പരിഗണിക്കുമ്പോള് ശബ്ദവ്യത്യാസം അര്ത്ഥവ്യത്യാസമുണ്ടാക്കുന്നതു് വ്യക്തമായി കാണാം. എന്നാല് പിമ്പട തുടങ്ങിയ വാക്കുകളില് 'ന'യല്ലേ എന്ന ചോദ്യമുണ്ടാകാം. ഇവിടെ പിന്പട എന്നും പിമ്പട എന്നും പറയുമെന്നു കൂടി അറിഞ്ഞാലോ? അപ്പോള് ന്പയുടെ സ്ഥാനത്തു് ചില വാക്കുകളില് മ്പ ഉപയോഗിച്ചാലും അക്ഷരപ്പിശകല്ല, ശരിയായ രൂപമാണു് എന്നു വരുന്നു. അവിടെ ന്പയ്ക്കു് പകരം ഉപയോഗിക്കാവുന്ന അക്ഷരസങ്കരമാണു് മ്പ. അല്ലാതെ നയും പയും ചേര്ന്നു് മ്പ ആകുകയല്ല എന്നാണു് എനിക്കു തോന്നുന്നതു്.
ഇതേ പോലെ ഉറപ്പില്ലാത്ത ഒട്ടധികം നിയമങ്ങളുണ്ടു്. ചില വാക്കുകളില് 'ക'യും 'വ'യും മാറി മാറി ഉപയോഗിക്കാറുണ്ടു്. ഇതിനൊക്കെ സാധൂകരണം കണ്ടെത്താന് പ്രയാസമാകും. അപ്പോള് പിന്നെ സോര്ട്ടിംഗില് ഈ വിഷയം എങ്ങനെ പരിഹരിക്കും?
'ന' വേറൊരു വില്ലനാണു്. നനയുക എന്ന വാക്കില് രണ്ടു് ശബ്ദവുമുണ്ടല്ലോ. കന്നന്തരം എന്നിടത്തു് നനയുക എന്നതിലെ രണ്ടാമത്തെ നയുടെ ഇരട്ടിപ്പാണു്. ചെന്നായ എന്നിടത്തു് ആദ്യത്തെ നയുടേതും. ഇരട്ടിപ്പിലും രണ്ടു ശബ്ദവും വരുന്നുണ്ടു്. എന്നാല് കന്നി എന്ന പദത്തെ രണ്ടു ശബ്ദം ഉപയോഗിച്ചും വായിക്കാം. രണ്ടും പ്രയോഗ സാധുത ഉള്ളതു തന്നെ. നെറ്റി എന്ന അര്ത്ഥത്തില് ചെന്നി എന്നെഴുതുമ്പോള് രണ്ടാമത്തെ നയും ചെന്നിറങ്ങി എന്നെഴുതുമ്പോള് ആദ്യത്തെ നയും വരുന്നു. മലയാളം സങ്കീര്ണ്ണമായ ഭാഷ തന്നെ.
ഇനി റാല്മിനോവു് പറഞ്ഞ ഴ, യ എന്നിവയുടെ കാര്യം. കായ്, പാഴ് എന്നീ വാക്കുകളില് വരുന്നതു് ചില്ലിന്റെ സ്വഭാവമാണെന്ന വാദത്തോടു് പൂര്ണ്ണമായും യോജിക്കുമ്പോഴും ഇവയ്ക്കു് പ്രത്യേക ചിഹ്നങ്ങള് ഉപയോഗിക്കുന്നില്ലെന്നതു് ശ്രദ്ധിക്കുക. ഇവിടെ സംവൃതോകാരം ഉപയോഗിക്കാതെയാണു് ആ സ്വഭാവം പ്രകടമാക്കുന്നതു്. അങ്ങനെ വരുമ്പോള് ശരിയായ മലയാളം എഴുതണമെങ്കില് സംവൃതോകാരം നിര്ബന്ധമാണെന്നു് വരുന്നു. അതുപയോഗിക്കാത്തവര് ഉടന് ഉപയോഗിച്ചു തുടങ്ങൂ എന്നേ അതേക്കുറിച്ചു് പറയാനുള്ളൂ. നിലവില് ചിഹ്നങ്ങളില്ലാത്ത രൂപങ്ങള്ക്കു് ചിഹ്നങ്ങളുണ്ടാക്കുക എന്നതു് യൂണിക്കോഡിന്റെ പണിയല്ലല്ലോ. അതങ്ങനെ തന്നെ തുടരട്ടെ എന്നാണു് കൂട്ടിച്ചേര്ക്കാനുള്ളതു്.
ഫയല് ഭാരത്തെ കുറിച്ചു് ഞാന് പറഞ്ഞതു് തീര്ത്തും ബാലിശമായിരുന്നുവെന്നു് പ്രവീണിന്റെ വിശദീകരണത്തില് നിന്നു് മനസ്സിലായി. നന്ദി.
This comment has been removed by the author.
ReplyDeleteസെബിന് കാര്യങ്ങള് മനസ്സിലാക്കാന് ശ്രമിച്ചതിനു നന്ദി.
ReplyDeleteഭാഷയില് നിലനില്ക്കുന്ന ആശയക്കുഴപ്പങ്ങള് ഏതൊക്കെ യുണിക്കോഡിന്റെ പരിധിയില് വരും ഏതൊക്കെ അതുപയോഗിക്കുന്നവരുടെ പരിധിയില് വരും എന്നതും പ്രധാനമാണു്.
വേണം നമുക്ക് ഏകീകൃതമായ ഒരെഴുത്തുരീതി., ചരിത്രത്തെ വീണ്ടെടുക്കുക
എന്നിവ വായിച്ചിട്ടുണ്ടാകുമെന്നു കരുതുന്നു.