Thursday, January 24, 2008

ആണവചില്ലും സ്പൂഫിങ്ങും

ന്‍, ര്‍,ല്‍, ള്‍,ണ്‍ എന്നീ ചില്ലക്ഷരങ്ങള്‍ക്ക് ഇപ്പോളുള്ള യഥാക്രമം ന+ചന്ദ്രക്കല+ZWJ, ര+ചന്ദ്രക്കല+ZWJ ,ല+ചന്ദ്രക്കല+ZWJ ,ള+ചന്ദ്രക്കല+ZWJ ണ+ചന്ദ്രക്കല+ZWJ എന്നീ യൂണിക്കോഡ് എന്‍‌കോഡിങ്ങിനു് പകരം ഒരൊറ്റ കോഡ് പോയിന്റ് മാത്രം ഉപയോഗിക്കുന്നതിനെയാണ് ആണവചില്ലു് അഥവാ അറ്റോമിക് ചില്ലെന്നു പറയുന്നത്. ഈ വസ്തുത എല്ലാവര്‍ക്കുമറിയാമെന്നു വിചാരിക്കുന്നു. ഇതെങ്ങനെ സ്പൂഫിങിന് കാരണമാകും എന്ന് വിശദമാക്കുകയാണ് ഈ ലേഖനത്തിന്റെ വിഷയം. പലര്‍ക്കുമറിയാവുന്ന കാര്യമായിരിയ്ക്കും. എന്നാലും അറിയാത്തവരുടെ അറിവിലേയ്ക്കായി എഴുതുന്നു.

ആദ്യം സ്പൂഫിങ് എന്താണെന്നു് ആദ്യം നോക്കാം
ഒരു പോലെയെന്നു് തോന്നിക്കുന്ന വിലാസം ഉള്ള വ്യാജസൈറ്റുകളുണ്ടാക്കുന്നതിനെയാണു് സ്പൂഫിങ് എന്നതുകൊണ്ട് ഉദ്ദേശിക്കുന്നതു്. ഇതിനെക്കുറിച്ച് വിശദമായി Spoofed URL,Spoofing Attack എന്നീ വിക്കിപ്പീഡിയ പേജുകളില്‍ നിന്നു് മനസ്സിലാക്കാം. ഇത്തരം തട്ടിപ്പുകളിലൂടെ ഉപയോക്താക്കളെ വ്യാജസൈറ്റിലേക്കു് ആ‍കര്‍ഷിച്ചു് പണം തട്ടുന്നത് പതിവാ‍ണു്. ICICI Bank ഉപയോക്താക്കളോട് സ്പൂഫിങ്ങിനെക്കുറിച്ചു് മുന്നറിയിപ്പു നല്‍കുന്ന ഈ പേജ് കാണൂ..

ആണവ് ചില്ലു് വരുമ്പോള്‍ നമ്മുടെ ചില്ലക്ഷരങ്ങളെല്ലാം രണ്ടു് രീതിയില്‍ എന്‍‌കോഡ് ചെയ്യപ്പെടും. യൂണിക്കോഡിന്റെ ബാക്ക്‌വേര്‍ഡ് കമ്പാറ്റിബിലിറ്റി നയമനുസരിച്ചു് നിലവിലുള്ള തരം ചില്ലു് കോഡുകളും, അറ്റോമിക് ചില്ലുകളും വരും. ഇതിലേതു് ഉപയോഗിച്ചാലും കാഴ്ചയില്‍ ഒരു പോലിരിയ്ക്കും. തിരിച്ചറിയാന്‍ പറ്റില്ല.

സര്‍ക്കാര്‍.com എന്ന ഒരു സൈറ്റ് ഉണ്ടെന്നിരിയ്ക്കട്ടെ. ഇതു് 4 പേര്‍ക്കു് രജിസ്റ്റര്‍ ചെയ്യാന്‍ പറ്റും യഥാര്‍ത്ഥ സൈറ്റ് നിലവിലെ ചില്ലുപയോഗിച്ചു് സര്‍ക്കാര്‍.com എന്നു രജിസ്റ്റര്‍ ചെയ്തു എന്നിരിക്കട്ടെ.താഴെപ്പറയുന്നവയാണ് സ്പൂഫ് ചെയ്ത വ്യാജന്മാര്‍
1. സ[അറ്റോമിക് ര്‍]ക്കാ[നിലവിലെ ര്‍].com
2. സ[നിലവിലെ ര്‍]ക്കാ[അറ്റോമിക് ര്‍].com
3. സ[അറ്റോമിക് ര്‍]ക്കാ[അറ്റോമിക് ര്‍].com
കണ്ടാല്‍ ഒരുപോലെയിരിയ്ക്കുന്ന മൂന്നു് വ്യാജന്മാര്‍!
ഇതു പോലെ ഫെഡറല്‍ബാങ്ക് 2 പേര്‍ക്കു രെജിസ്റ്റര്‍ ചെയ്യാം. അങ്ങനെയങ്ങനെ...
ഇതിന്റെ ഒരു ഡെമോണ്‍സ്ട്രേഷന്‍ റാല്‍മിനോവ് ചെയ്തിട്ടുണ്ടു്
site 1: http://റാല്‍മിനോവ്.blogspot.com
site 2: http://റാൽമിനോവ്.blogspot.com [അറ്റോമിക് ചില്ലു്]

വ്യാജന്മാരുടെ ചാകര എന്ന പോസ്റ്റും കാണുക.

26 comments:

  1. അപ്പോഴേ സന്തോഷ്‌, ഈ അപകടം ചൂണ്ടി കാണിച്ച്‌ രണ്ടിലേതെങ്കിലും ഒരു തരത്തിലുള്ള ചില്ലുകളേ നടപ്പില്‍ വരുത്താവൂ എന്ന്‌ ആരോടാണ് പറയേണ്ടത്‌, പരഞ്ഞാല്‍ നടപ്പില്‍ വരുത്തൂല്ലേ? Backward compatibility വേണമെങ്കില്‍ നിലവിലുള്ള ചില്ലുകള്‍ ആവശ്യമാണ്. എന്നാല്‍ ആണവ ചില്ല്‌ വേണ്ടെന്നു വച്ചു കൂടേ. ഓ, അപ്പോള്‍ ZWJ ആവശ്യമായി വരുന്നു അല്ലേ.

    ReplyDelete
  2. സന്തോഷേ,

    ഒരു സംശയം ചോദിച്ചോട്ടെ:

    ഐ.ഡി.എന്. സ്പൂഫിംഗിനുള്ള സാദ്ധ്യത കൂട്ടാന്‌‌ ആണവ ചില്ലുതകും എന്നാണോ? ചില്ലേതായാലും zwnj തരം പോലെ തിരുകികയറ്റിയാലും സ്പൂഫിംഗ്ഗ് ചെയ്യാമല്ലോ? താഴെ കാണുന്ന "സര്ക്കാര്" കാണൂ.

    1) സര്ക്കാര് - U+0D38 U+0D30 U+0D4D U+0D15 U+0D4D U+0D15 U+0D3E U+0D30 U+0D4D
    2) സര്‌‌‌‌ക്കാര് - U+0D38 U+0D30 U+0D4D U+200C U+200C U+200C U+200C U+0D15 U+0D4D U+0D15 U+0D3E U+0D30 U+0D4D
    3)സ‌‌‌‌ര്‌‌‌‌ക്കാര് - U+0D38 U+200C U+200C U+200C U+200C U+0D30 U+0D4D U+200C U+200C U+200C U+200C U+0D15 U+0D4D U+0D15 U+0D3E U+0D30 U+0D4D
    4) സര്‌‌‌‌ക്കാ‌‌‌‌‌‌ര് - U+0D38 U+0D30 U+0D4D U+200C U+200C U+200C U+200C U+0D15 U+0D4D U+0D15 U+0D3E U+200C U+200C U+200C U+200C U+200C U+200C U+0D30 U+0D4D

    യൂ.ആര്,എല്. സ്പൂഫിംഗ് ഒഴിവാക്കേണ്ടത് യൂണീകോഡിന്റ്റെ ബാദ്ധ്യത ആണോ? അല്ല എന്ന് എന്റ്റെ പക്ഷം.

    സ്പൂഫിംഗ്/ ഫിഷിങ്ങ് തുടങ്ങിയതൊക്കെ ഒഴിവാക്കുക എന്നത് ബ്രൗസറുകളുടെയും മറ്റും ബാദ്ധ്യ‌‌തയല്ലേ?

    ReplyDelete
  3. ഏവൂരാനു് കാര്യം മനസ്സിലാകായ്കയില്ല എന്നു് കരുതാം. എന്നാലിതു് വായിക്കാനിടവരുന്ന മറ്റുള്ളവരുടെ അറിവിലേക്കായി:
    ജോയ്നറും നോണ്‍ജോയ്നറും ഇന്നു് എത്രയെണ്ണം ഇട്ടാലും സ്പൂഫിങ് നടക്കില്ല.കാരണം ഐഡിയെന്‍ അവ കളയും. പിന്നെ കാഴ്ചയ്ക്ക് പല സൈറ്റുകളുണ്ടാക്കാം, പക്ഷെ അവയൊക്കെ ഒരു സൈറ്റിലേക്കേ പോകൂ. ഇതിനെ സ്പൂഫിങ് എന്നല്ല പറയുക. നമ്മുടെ വന്യവനിക മറന്നിട്ടില്ലല്ലോ.

    ഏവൂരാന്‍ താങ്കള്‍ കൊടുത്ത കോഡുകള്‍ പ്രകാരം ഒന്നില്‍ കൂടുതല്‍ സൈ​റ്റുകള്‍ റെജിസ്റ്റര്‍ ചെയ്യാന്‍ സാധിക്കില്ല, കാരണം അവയുടെ എല്ലാം Punycode ഒന്നാണു്.എന്നാല്‍ ചില്ലു് വന്നാല്‍ കഥ മാറി. ആണവചില്ലുള്ളവയ്ക്കു് Punycode വേറെയാണു്.

    ReplyDelete
  4. നന്ദി റാല്മിനോവേ..!

    അറിയായ്ക തന്നെയായിരുന്നു. പ്യൂണീകോഡെന്ന സംഭവത്തെക്കുറിച്ച് താങ്കളുടെ കമന്റ്റിനു മുമ്പ് അറിവില്ലായിരുന്നു.

    നന്ദി. ഐ നൌ സ്റ്റാന്ഡ് കറക്ടഡ്.

    ReplyDelete
  5. അങ്കിള്‍, യൂണിക്കോഡ് റ്റെക്നിക്കല്‍ കമ്മിറ്റിയാണ് തീരുമാനമെടുക്കുന്നതു്. ഇതിനെപ്പറ്റി ധാരാളം എതിര്‍പ്പുകള്‍ യൂണീക്കോഡിന്റെ ഇന്‍ഡിക് മെയിലിങ് ലിസ്റ്റില്‍ വളരെയധികം പേര്‍ ഉന്നയിച്ചിരുന്നു. പക്ഷേ നമ്മുടെ ഭാഷയുടെ ഭാവിയെ നിശ്ചയിക്കുന്ന ഒരു പ്രധാനകാര്യമായിട്ടും ഭാഷാവിദഗ്ദ്ധര്‍ ഈ വിഷയത്തെപറ്റി ബോധവാന്മാരല്ല. സാങ്കേതികജ്ഞാനം ഇല്ല എന്നതാണ് ചൂണ്ടിക്കാണിക്കപ്പെടുന്നത്. ചര്‍ച്ചയില്‍ പങ്കെടുത്തവര്‍ അധികവും സാങ്കേതികരംഗത്തു നിന്നുള്ളവരും.
    അങ്ങനെയുള്ള ഈ തീരുമാനം നിരവധി പരിഹരിക്കപ്പെടാതെയുള്ള പ്രശ്നങ്ങള്‍ അവശേഷിപ്പിച്ചു് കൈക്കൊള്ളുമ്പോള്‍ മലയാളികളില്‍ വളരെയധികം പേര്‍ ഇതിനെപ്പറ്റി അറിയാതിരിക്കുന്നത് വളരെ മോശമല്ലേ? മറ്റു രാജ്യങ്ങളില്‍ നിന്നുള്ള ആളുകളുടെ ഭാഷയെപ്പറ്റിയുള്ള പരിമിത ജ്ഞാനത്തിന്റെ അടിസ്ഥാനത്തില്‍ നമ്മുടെ ഭാഷയുടെ ഭാവി തീരുമാനിക്കപ്പെടുന്നതു് എത്ര ദയനീയമാണു്?
    പ്രവീണ്‍ എഴുതിക്കൊണ്ടിരിക്കുന്ന ഇതിനെപ്പറ്റിയുള്ള ബ്ലോഗ് പോസ്റ്റുകള്‍ വായിക്കുന്നുണ്ടെന്നു വിചാരിക്കുന്നു.
    സംഗതികളുടെ കിടപ്പറിയാന്‍ ഇന്നലെ യൂണിക്കോഡ് മെയിലിങ് ലിസ്റ്റില്‍ പ്രവീണിന്റെ ചോദ്യത്തിന് James Kass എന്നൊരാള്‍ എഴുതിയ മറുപടി നോക്കൂ..
    > 4. But if you can't forbid the existing sequences what use is the newly
    > added atomic chillus going to serve?

    A. It adds variant spellings, which is not always a good thing.
    B. It offers employment opportunities for people involved in
    file/character conversion.
    C. It offers more employment opportunities for anyone working
    in text processing, search engine technology, text display, and
    so forth because everything will need to be upgraded to support
    the new variant spellings.

    ReplyDelete
  6. ഐസിയുവിന്റെ ഐഡി‌എന്‍ ബ്രൌസര്‍ പേജില്‍ പോയി എങ്ങനെ പ്യൂണീക്കോഡില്‍ വ്യത്യാസം വരുന്നു എന്നു മനസ്സിലാക്കാം.

    ReplyDelete
  7. സന്തോഷിനും റാല്‍മിനോവിനും നന്ദി. കാര്യങ്ങള്‍ ഞാനും മനസ്സിലാക്കാന്‍ ശ്രമിക്കുന്നു.

    ReplyDelete
  8. ഇത്രയും വിവരങ്ങള്‍ക്കു നന്ദി

    ReplyDelete
  9. സന്തോഷെ,

    ബാക്‍വേഡ് കമ്പാറ്റിബിലിറ്റി വേണമെന്നു നിര്‍ബന്ധം പിടിക്കുമ്പോഴല്ലേ, ഈ പ്രശ്നം? ചില്ലക്ഷരം എന്നല്ലേ നമ്മള്‍ പറയാറു്? അപ്പോഴവ ഒറ്റയൊറ്റ അക്ഷരങ്ങള്‍ തന്നെയല്ലേ? മറ്റു ഭാഷകളില്‍​ നിന്നു് വ്യതിരിക്തമായ മലയാളത്തിന്റെ ഒരു സ്വഭാവവും... അതിനെ സെപ്പറേറ്റ് ക്യാരക്ടറായി അംഗീരിക്കുക തന്നെയല്ലേ നല്ലതു്? മുമ്പെഴുതിയ ബ്ലോഗ് പേജുകളുടെയും വിക്കിയ തുടങ്ങിയ വിജ്ഞാന - സാങ്കേതിക പേജുകളുടെയും കാര്യത്തില്‍ വല്ല പാച്ചോ ബോട്ടോ (ഇതൊക്കെ എന്താന്നു് എന്നോടു ചോദിക്കല്ലേ...) ഒക്കെ ഉപയോഗിച്ചു് കറക്ട് ചെയ്യാനുള്ള സംവിധാനം ഒരുക്കാന്‍ മലയാളം കമ്പ്യൂട്ടിംഗു് രംഗത്തു പ്രവര്‍ത്തിക്കുന്നവര്‍ക്കു് കഴിയില്ലെന്നുണ്ടോ?

    ReplyDelete
  10. സെബിനേ, അങ്ങനെയാണെങ്കില്‍ കൂട്ടക്ഷരം എന്നു് നമ്മള്‍ വിളിയ്ക്കുന്നവയോ? അവയും ഒറ്റ അക്ഷരമാണെന്നുണ്ടോ? എല്ലാ കൂട്ടക്ഷരങ്ങളും കൂടി ഉള്‍‌പ്പെടുത്തണമെന്നു് സെബിന്‍ പറയൂമോ?

    അറിയില്ല എന്നു് സെബിന്‍ തന്നെ സമ്മതിച്ച കാര്യം ഒരു കരുതിക്കൂട്ടിയുണ്ടാക്കുന്നൊരു പ്രശ്നത്തിനു് പരിഹാരമായി പറയുന്നതു് കാണുമ്പോള്‍ എനിയ്ക്കു് ശരിയ്ക്കും സങ്കടം വരുന്നു.

    മലയാള ഭാഷയെന്താ എല്ലാവര്‍ക്കും കയറിയിനിരങ്ങാനുള്ളിടമാണോ?

    ഞങ്ങള്‍ കുളമാക്കിത്തരാം, നിങ്ങള്‍ക്കു് കഴിവുണ്ടേല്‍ ശരിയാക്കിക്കോ എന്നാണോ?

    ReplyDelete
  11. പ്രവീണ്‍,

    ക്‌ക എന്നെഴുതിയാലും ക്ക ആണു് ഉദ്ദേശിക്കുന്നതു് എന്നു് മനസ്സിലാക്കാനാവും. കാരണം, രണ്ടു് ക ചേരുന്ന അക്ഷരമാണു് ക്ക. അതുകൊണ്ടാണല്ലോ കൂട്ടക്ഷരം എന്ന പ്രയോഗം.

    എന്നാല്‍ 'വരമൊഴി മലയാള'ത്തില്‍ പഴക്കമായവര്‍ക്കല്ലാതെ ര്‌ എന്നെഴുതിയാല്‍ അതു് ചില്ലക്ഷരമാണെന്നു് പെട്ടെന്നു് പിടികിട്ടുമോ? ടൈപ്പ് റൈറ്ററില്‍ ആവശ്യത്തിനു് കീ സ്ഥാനങ്ങള്‍ ഇല്ലാഞ്ഞതുകൊണ്ടു് ഭാഷയില്‍ പല കോപ്രായങ്ങളും വരുത്തി. അതു തിരുത്താന്‍ ലഭിക്കുന്ന അവസരം കേവലം ൫൦൦൦ വിക്കി ലേഖനത്തിന്റെ പേരില്‍ ഉപേക്ഷിക്കേണ്ടതുണ്ടോ?

    ടൈപ്പു് ചെയ്യുന്നവരെ സംബന്ധിച്ചു് വ്യജ്ഞനം+്‌+zwj ഒറ്റ കീ അമര്‍ത്തിയാല്‍ കിട്ടാവുന്ന തരത്തില്‍ മാപ് ചെയ്താല്‍ ഈ സീറോവെയ്റ്റ് ക്യാരക്ടര്‍ കടന്നുവരുന്നതു് അറിയില്ല. ദാ, ഞാനിപ്പോളുപയോഗിക്കുന്ന റാല്‍മിനോവിന്റെ ആള്‍ട്ട് മോഡിഫയറുപയോഗിച്ചു വിപുലപ്പെടുത്തിയ ഇന്‍സ്ക്രിപ്റ്റ് കീബോര്‍ഡില്‍ അതാണു് ചെയ്തിരിക്കുന്നതു്. എന്നുവച്ചു്, ആ ലോജിക്‍ - എന്റെ അനുമാനത്തില്‍ തെറ്റായ ലോജിക്‍ - അവിടെ പ്രവര്‍ത്തിക്കാതിരിക്കുന്നില്ലല്ലോ.

    സ്വയമേവ കൂടിച്ചേരാനിടയില്ലാത്ത രണ്ടക്ഷരങ്ങള്‍ നിര്‍ബന്ധമായും കൂട്ടിച്ചേര്‍ക്കാനുള്ള നിര്‍ദ്ദേശം നല്‍കാനായല്ലാതെ zwjയും കൂട്ടക്ഷരമായി സ്വയമേവ മാറുന്ന രണ്ടക്ഷരങ്ങളെ ഞാന്‍ ഈ കമന്റിന്റെ തുടക്കത്തില്‍ ചെയ്തതുപോലെ നിര്‍ബന്ധമായും രണ്ടുതുണ്ടമായി നിര്‍ത്തേണ്ടിവരുന്ന അവസരങ്ങളിലൊഴികെ zwnj / nj ചന്ദ്രക്കല യും ഉപയോഗിക്കേണ്ടാത്ത അവസ്ഥയാണു് അഭികാമ്യം. വെറുതെ രേഖാഭാരം (ഫയല്‍ സൈസിനു് അങ്ങനെ പറയാമോ?) കൂട്ടാന്‍ ഇടയാക്കുന്ന ഈ അദൃശ്യസ്ഥാനഭേദികളെ എന്തിനു് സകലയിടത്തും വലിച്ചിടണം?

    പിന്നെ ള്‍, ല്‍, ര്‍, ക്‍, ന്‍, ണ്‍ എന്നിങ്ങനെ ആറുചില്ലുകളല്ലേ ഉപയോഗത്തിലുള്ളൂ? അതില്‍ തന്നെ ക്‍ വളരെ പരിമിതമായാണു് ഉപയോഗിക്കുന്നതു്. മ, യ തുടങ്ങിയ അക്ഷരങ്ങള്‍ക്കും ചില്ലുണ്ടാകാം എന്ന വാദം വെറുതെ വാദത്തിനു വേണ്ടിയുള്ള വാദമായാണു് എനിക്കു തോന്നുന്നതു്. ഇങ്ങനെ വെറും ആറക്ഷരങ്ങള്‍ കൂടി യൂണിക്കോഡ് മലയാളം അക്ഷരമാലയില്‍ സ്ഥാനംപിടിക്കുന്നതുകൊണ്ടു് ആരുടെ ഈഗോയാണു് താഴെപ്പോകുന്നതു്?

    ReplyDelete
  12. സെബിന്‍,
    ഞാന്‍ ആണവ ചില്ലിന്റെ വിപത്തുകളെപ്പറ്റി പല പോസ്റ്റുകളായി എന്റെ ബ്ലോഗിലെഴുതിയിട്ടുണ്ടു്. അതെല്ലാമൊന്നു് വായിച്ചതിനു് ശേഷം സെബിന്‍ ഇപ്പോ പറഞ്ഞ കാര്യം ഒന്നു് കൂടി വായിച്ചു് നോക്കാമോ?

    "ചില്ലക്ഷരവും അതിന്റെ അടിസ്ഥാന അക്ഷരവും തമ്മിലുള്ള ബന്ധം നശിപ്പിയ്ക്കുന്നതു് കൊണ്ടാണു് ആണവ ചില്ലുകള്‍ സ്വീകാര്യമല്ലാത്തതു്."

    ചില്ലക്ഷരങ്ങള്‍ അടിസ്ഥാനാക്ഷരങ്ങളല്ല എന്നതു് തന്നെയാണവ വേറെയാക്കാതിരിയ്ക്കാനുള്ള കാരണം.

    ഇനി 'ന്‍' എന്ന അക്ഷരത്തിനു് 'ന' എന്ന അക്ഷരത്തോടൊരു ബന്ധവുമില്ലെന്നാണോ? സെബിന്റെ വിശ്വാസമതാണെങ്കില്‍ ഇനി കൂടുതല്‍ പറഞ്ഞിട്ടൊരു കാര്യവുമില്ല.

    ReplyDelete
  13. സെബിന്റെ വാക്കുകള്‍ ഇനിയും വിലയ്ക്കെടുക്കണമെങ്കില്‍ ആദ്യം ഒരു പാച്ചെന്താണു് ഒരു ബോട്ടെന്താണെന്നു് പഠിച്ചിട്ടു് വരൂ. ഇവിടെ ചില്ലക്ഷരങ്ങളെ എതിര്‍ക്കുന്ന ഓരോരുത്തരും കാര്യങ്ങള്‍ പഠിച്ചും പ്രശ്നങ്ങള്‍ മനസ്സിലാക്കിയുമാണു് പ്രതികരിയ്ക്കുന്നതു്. ഇത്രയും നിരുത്തരവാദവപരമായൊരു പെരുമാറ്റം സെബിനെങ്ങനെ ന്യായീകരിയ്ക്കാന്‍ പറ്റു?

    ReplyDelete
  14. പ്രവീണ്‍,

    ഇക്കാര്യത്തില്‍ പ്രവീണ്‍ പുതുതായെഴുതിയ രണ്ടുപോസ്റ്റുകളും വായിച്ചിരുന്നു. പഴയ പോസ്റ്റുകള്‍ ഉടനെ നോക്കാം. പാച്ചും ബോട്ടും എന്താണെന്നു് പഠിക്കുകയും ചെയ്യാം. ബോട്ടിനെ കുറിച്ചൊക്കെ വായിച്ചതു് മലയാളം യൂണിക്കോഡ് വിവാദം വിശദീകരിക്കുന്ന വിക്കിയ താളില്‍ നിന്നാണു്. അതില്‍ പറഞ്ഞിരിക്കുന്ന കാര്യങ്ങളില്‍ വിയോജിക്കാന്‍ യുക്തിഭദ്രമായ കാരണം കണ്ടില്ല. ഞാന്‍ സാങ്കേതിക വിദഗ്ദ്ധന്റെ കോട്ടിട്ടുകൊണ്ടല്ല, ഭാഷാ സ്നേഹിയുടെ കുപ്പായമിട്ടുകൊണ്ടാണു് സംസാരിച്ചതു്. തെറ്റുബോദ്ധ്യപ്പെട്ടാല്‍ തിരുത്താന്‍ തയ്യാറുമാണു്.

    ചില്ലക്ഷരങ്ങള്‍ക്കു് അടിസ്ഥാന രൂപങ്ങളില്ലെന്ന വാദമൊന്നും എനിക്കില്ല. എന്നാല്‍ ല്‍ എന്ന ചില്ലിന്റെ അടിസ്ഥാന രൂപം ത ആണോ ല ആണോ എന്ന തര്‍ക്കം കോഴി - മുട്ട തര്‍ക്കം പോലെ തുടരുകയാണു്. അതു് എന്തുമാകട്ടെ, ചില്ലുകള്‍ വ്യത്യസ്തമായ ഒരു ചിഹ്നമാണെന്നും നമ്മുടെ അക്ഷരവ്യവസ്ഥയില്‍ അതിനു് സവിശേഷ സ്ഥാനമുണ്ടെന്നും ഉള്ള കാര്യത്തില്‍​തര്‍ക്കമുണ്ടാവില്ലല്ലോ. ചന്ദ്രക്കല, പുള്ളി, കെട്ടുപുള്ളി, വള്ളി, കെട്ടുവള്ളി, ദീര്‍ഘം എന്നിവ പോലെ സ്വതന്ത്രമായ നിലനില്‍പ്പില്ലാത്തതും എന്നാല്‍ വ്യജ്ഞനാക്ഷരങ്ങളോടു ചേര്‍ന്നു് സ്വരസ്ഥാനം ഉത്പാദിപ്പിക്കുന്നതുമായ കേവല ചിഹ്നവുമല്ല, ചില്ല്. അതു് മറ്റൊരക്ഷരത്തോടും ചേരുന്നില്ല. സ്വതന്ത്രമായി തന്നെയാണു് നില്‍പ്പു്. ഒട്ടുപിരിച്ചെഴുതി കാട്ടാനുമാവില്ല എന്നാണു് ഞാന്‍ മനസിലാക്കിയിട്ടുള്ളതു്. ണ്‌ എന്നെഴുതിയാല്‍ ണ്‍ ആവില്ലല്ലോ.
    (ശ്ശൊ, ഇതു് ബ്ലോഗര്‍ കമന്റിലും ജിമെയിലിലും എങ്ങനെയാണാവോ കാണിക്കുക? യൂണിക്കോഡില്‍ സ്ഥിതനായിരിക്കുന്ന ... എന്ന പ്രാര്‍ത്ഥനയില്‍ നിന്റെ ചില്ലുകള്‍ തെളിയേണമേ എന്ന വരി വീണ്ടും വീണ്ടും ചൊല്ലാന്‍ തോന്നുന്നു!)

    ഇതില്‍ വ്യാകരണപ്പിശകുണ്ടെങ്കില്‍ കയ്യോടെ തിരുത്തിക്കൊള്ളാം. ആരെങ്കിലും വ്യക്തമായി വിശദീകരിച്ചു തരേണ്ട കാര്യമേയുള്ളൂ.

    ReplyDelete
  15. പിന്നെ ZWJ, ZWNJ, NJ ചന്ദ്രക്കല എന്നിവയുടെ അനാവശ്യ ഉപയോഗം ഒഴിവാക്കുക എന്നതു് ചെറിയ കാര്യമാണോ? അതേക്കുറിച്ചു് എന്റെ അഭിപ്രായം മുന്‍ കമന്റില്‍ പറഞ്ഞിരുന്നു.

    ReplyDelete
  16. തുടര്‍ കമന്റുകള്‍ക്കു ക്ഷമാപണം.

    സ്പൂഫിംഗു് ഒഴിവാക്കാന്‍ ആണവ ചില്ലിനെ മാത്രം അംഗീകരിക്കുക എന്നതല്ലേ നല്ലതു്? എഴുത്തുരീതിയെക്കുറിച്ചുള്ള എന്റെ അഭിപ്രായം പ്രവിയുടെ ജേണലില്‍ ഞാന്‍ ചോദിച്ചിരുന്നു, അതിവിടെയും ആവര്‍ത്തിക്കുകയാണു്.

    റാല്‌മിനോവ് എന്നെഴുതുന്നതു് റാ+ല+nj ചന്ദ്രക്കല+മി+... എന്നല്ലേ?
    റാല്മിനോവ് എന്നെഴുതുന്നതു് റാ+ല+സാധാചന്ദ്രക്കല+മി+... എന്നല്ലേ?
    റാൽമിനോവ് എന്നെഴുതേണ്ടതു് റാ+ൽ+മി+... എന്നല്ലേ?
    അല്ലാതെ ഇപ്പോഴുള്ളതു പോലെ റാ+ല+ചന്ദ്രക്കല+zwj+മി ... എന്നാണോ?
    അതെങ്ങനെ മലയാളമാകും?
    യന്ത്രത്തെ ഭാഷയ്ക്കു് വഴക്കിയെടുക്കണം, അല്ലാതെ ഭാഷയെ യന്ത്രത്തിനല്ല എന്നു തോന്നുന്നു.

    ReplyDelete
  17. സെബിന്‍,
    പ്രശ്നം താങ്കള്‍ ഉദ്ദേശിക്കുന്നതു് പോലെ നിസ്സാരമല്ല ബാക്ക്​വേര്‍ഡ് കംപാറ്റിബിലിറ്റി എന്നതാണു്. ഇപ്പോഴത്തെ ചില്ല് സീക്വന്‍സ് വളരെക്കാലം കൂടി തുടരും (ഒരുപക്ഷെ അനന്തമായി തന്നെ).
    റാല്‍മിനോവ് എന്നെഴുതാന്‍ മൂന്നു് സ്പെല്ലിങ് കണ്ടു. ഇപ്പോഴത്തെ സ്ഥിതിയില്‍ ഒരു പേരു് രെജിസ്റ്റര്‍ ചെയ്താല്‍ എനിക്കു് മൂന്നു് സ്പെല്ലിങും ഉപയോഗിക്കാം. ആണവചില്ല് വന്നാല്‍ രണ്ട് സ്പെല്ലിങ് ഞാന്‍ രെജിസ്റ്റര്‍ ചെയ്യേണ്ടി വരും, സ്പൂഫിങ് തടയാന്‍.
    ആണവചില്ലിനു് ഇപ്പോഴത്തെ സീക്വന്‍സുമായി ഒരു മാപ്പിങ് കൊടുത്താല്‍ പ്രശ്നം കുറെയൊക്കെ പരിഹരിക്കാം.
    അപ്പര്‍ ലോവര്‍ കേസ് പോലെയൊക്കെ പരിഗണിച്ച് ഒപ്പിച്ചെടുക്കാം.
    ചില്ല് എന്നതു് അക്ഷരത്തിന്റെ ഒരു കാരക്റ്ററാണു്. കായ്​കറികള്‍ എന്നെഴുതുമ്പോള്‍ യ യ്ക്ക് ഉള്ളതു് പോലെ. പാഴ്​വാക്കു് എന്നതില്‍ ഴ. ഇവയ്ക്കൊന്നു് പ്രത്യേക അക്ഷരങ്ങള്‍ നിലവിലില്ലെങ്കിലും അവ റാല്‍മിനോവിലെ ല്‍ പോലെതന്നെ "ചില്ലിങ്" കാരക്റ്ററുള്ളതാണു്. പ്രത്യേക അക്ഷരങ്ങള്‍ക്കൊക്കെ കോഡ്പോയന്റ് നല്‍കണമെങ്കില്‍ മ്പ, ങ്ക , ​്യ, ്ര, ്ല , ്വ എന്നിവയ്ക്കൊക്കെ ആവാം. ഫയല്‍ സൈസൊക്കെ ഇവിടെയും ലാഭിക്കാമല്ലോ.
    എന്നാലോ ഇപ്പോഴും ജോയ്നറില്ലാതെ അമ്മായ‍്യേ എന്നു് വിളിക്കാനും പറ്റില്ല.

    മലയാളത്തെ ഡിപ്രിക്കേറ്റ് ചെയ്യാന്‍ മാത്രം പറയാതിരുന്നാല്‍ നന്നു്.

    ReplyDelete
  18. റാല്‍മിനോവിന്റെ അഭിപ്രായങ്ങള്‍ വായിച്ചു് കാണും എന്നു് കരുതുന്നു. നിങ്ങള്‍ പറയുന്നതു് പോലെ zwj/zwnj എന്നിവയുടെ ഉപയോഗം ഒഴിവാക്കാനാണു് ഈ ആണവ ചില്ലെന്നു് സിബു പോലും പറയില്ല കാരണം ആണവ ചില്ലു് വന്നാലും ഇവയില്ലാതെ മലയാളം ഓടില്ല. ഇനി റാല്‍മിനോവ് പറഞ്ഞ പോലെ, മലയാളം തന്നെയങ്ങ് ഡിപ്രിക്കേറ്റ് ചെയ്തോളൂ എന്നാണോ?

    നാണമുണ്ടോ ഫയല്‍ സൈസ് ലാഭിയ്ക്കാം എന്നൊക്കെ ഇപ്പോഴും പറഞ്ഞു നടക്കാന്‍ (ആണവ ചില്ലിനെ അനുകൂലിയ്ക്കുന്നവര്‍ പോലും കളിയാക്കും ഇതു് പോലുള്ള വാദങ്ങളിറക്കിയാല്‍) ഫ്ലോപ്പി ഡിസ്കിന്റേയും ടൈപ്റൈറ്ററിന്റേയും കാലമൊക്കെ കഴിഞ്ഞു. ഇവിടെ പ്രശ്നം ആണവ ചില്ലു് വന്നാല്‍ ഡിജിറ്റല്‍ യുഗത്തില്‍ മലയാളത്തിനു് നേരിടേണ്ട പ്രശ്നങ്ങളാണു്. യന്ത്രത്തിനു് വേണ്ടി ഭാഷയെ വളയ്ക്കുക എന്നു് സെബിന്‍ നേരത്തെ പറഞ്ഞില്ലേ അത്തരത്തിലുള്ളൊരു വാദമാണു് സെബിനിപ്പറഞ്ഞതും. ഇതേ വാദമല്ലേ കൂട്ടക്ഷരങ്ങള്‍ നിര്‍ദാക്ഷിണ്യം വെട്ടിമുറിയ്ക്കാനും ഉപയോഗിച്ചതു്? പക്ഷേ അന്നാണെങ്കില്‍ അതു് ടൈപ്റൈറ്റരില്‍ കൊള്ളില്ലായിരുന്നു വേറെ വഴിയില്ലായിരുന്നു എന്നെങ്കിലും പറയാം. ഒരു ബ്ലോഗ് പോസ്റ്റില്‍ സെബിന്‍ എത്ര കണ്ടു് വലിപ്പം ലാഭിയ്ക്കുമെന്നാലോചിച്ചിട്ടുണ്ടോ?

    ഉദാഹരണത്തിനു് അങ്കിളിന്റെ ആദ്യത്തെ അഭിപ്രായം നോക്കുക. ആറു് ചില്ലക്ഷരമാണതിലുപയോഗിച്ചിരിയ്ക്കുന്നതു്. പന്ത്രണ്ടു് ബൈറ്റ് സെബിന്‍ ലാഭിയ്ക്കും അതില്‍. ഇനി നൂറു ചില്ലുകളുപയോഗിയ്ക്കുമ്പോള്‍ സെബിന്‍ ലാഭിയ്ക്കുന്നതു് ഇരുനൂറു് ബൈറ്റ്. ഒരു ഫ്ലോപ്പിയില്‍ കൊള്ളുന്നത്രയും സ്ഥലം ലാഭിയ്ക്കണമെങ്കില്‍ എത്ര ബോഗ് പോസ്റ്റുകള്‍ വേണമെന്നു് ചിന്തിയ്ക്കുക. യുട്യൂബിലെ ഒരു വീഡിയോയുടെ വലിപ്പമുള്ളത്രേം സ്ഥലം ലാഭിയ്ക്കാന്‍ എത്ര ആണവ ചില്ലു് വേണമെന്നു് കണക്കു് കൂട്ടിനോക്കൂ. അപ്പോഴറിയാം എത്ര ബാലിശമാണു് ഫയല്‍ വലിപ്പത്തിന്റെ വാദമെന്നു്. ചെരിപ്പിനനുസരിച്ചു് കാല്‍ മുറിച്ചോളൂ എന്നാണോ?

    സെബിന്‍ ഝ എന്നതു് ത ചന്ദ്രക്കല ധ എന്നല്ലേ എന്നു് ചോദിയ്ക്കാത്തതു് ഭാഗ്യം. ഇനി സെബിന്‍ പറഞ്ഞതു് പോലെ ല്‍ എന്നതു് ല യുടേയും ത യുടേയും ചില്ലു് തന്നെയാണെന്നു് വയ്ക്കുക. ആണവ ചില്ലു് വന്നാല്‍ അകാരാദിക്രമത്തില്‍ തരം തിരിയ്ക്കുമ്പോള്‍ (sorted in alphabetical order) അതിനെ എവിടെ വയ്ക്കും. സെബിനെ ബ്ലോഗും അച്ചടിയും കഴിഞ്ഞും പലതും ചെയ്യാനാകും കമ്പ്യൂട്ടറില്‍ എന്നാദ്യം മനസ്സിലാക്കുക. ഇതിനെപ്പറ്റിയൊന്നു് ആലോചിയ്ക്കുകയോ ഉത്തരം പറയാതിരിയ്ക്കുകയോ ചെയ്യുന്നവര്‍ മലയാള ഭാഷയെയാണു് ദ്രോഹിയ്ക്കുന്നതെന്നോര്‍ക്കുക.

    പിന്നെ പാച്ചും ബോട്ടും പഠിയ്ക്കാമെന്നു് പറഞ്ഞതില്‍ സന്തോഷം. സിബു വരെ ആ വാദം നിര്‍ത്തി എന്നു് സെബിനറിയുമോ? മഹേഷ് ടി പൈ വരെ പഴയ ചില്ലുകള്‍ സംരക്ഷിയ്ക്കണമെന്നാണു് പറയുന്നതു്. സെബനെ ഇപ്പോ പറഞ്ഞതു് പറഞ്ഞു, ഇനിയും പാച്ച്, ബോട്ട് എന്നൊക്കെ പറഞ്ഞാല്‍ സിബു പോലും പിന്തുണയ്ക്കില്ല.

    zwj, zwnj എന്നിവയുടെ അനാവശ്യ ഉപയോഗത്തെപ്പറ്റി. ഇന്‍ഡിക് പേര്‍ഷ്യന്‍ ഭാഷകളുടെ പ്രത്യേകതകളെ പിന്തുണയ്ക്കാണിവ കൊണ്ടുവന്നതെന്നു് സെബിനറിയുമോ?

    റാല്‍മിനോവ് പറഞ്ഞ കായ്‌കറികള്‍, താഴ്‌വാരം എന്നീ വാക്കുകളെപ്പറ്റി എന്തു് പറയുന്നു.

    ReplyDelete
  19. ഗൂഗിളെടുത്തു് malayalam bloggers are fools എന്നു കൊടുത്തു് ഞാന്‍ ഭാഗ്യവാനാണെന്നു പറഞ്ഞാല്‍ കുറച്ചു കാര്യങ്ങളറിയാനുള്ള ഭാഗ്യം നിങ്ങള്‍ക്കു ലഭിക്കുന്നതാണു്...!

    ReplyDelete
  20. ക്യാരക്ടറുകളെല്ലാം ഇന്‍‌ഡിപെന്റന്റായി നില്‍ക്കുന്ന ലാറ്റിന്‍ ഭാഷകളുടെ കാര്യത്തില്‍ ക്യാകര്‍ക്ടറുകളുടെ “ലിംഗ്വിസ്റ്റിക് റപ്രസെന്റേഷന്‍” പ്രശ്നമല്ലാതിരിക്കാം. എന്നാല്‍ ഒട്ടേറെ സങ്കീര്‍ണ്ണതകളുള്ള മലയാളം പോലുള്ള ഭാഷകളിലെ ക്യാരക്ടറുകള്‍ക്ക് “ലിംഗ്വിസ്റ്റിക് റപ്രസെന്റേഷന്‍” നോക്കിയേ പറ്റൂ. യൂണീക്കോഡ് കണ്‍‌സോര്‍ഷ്യത്തിന്റെ ബൈലോയില്‍ അങ്ങനെ പറയുന്നില്ലായിരിക്കാം. യൂണീക്കോഡ് കണ്‍‌സോര്‍ഷ്യത്തിനായി നമ്മുടെ ഭാഷ എന്നല്ല, നമ്മുടെ ഭാഷയ്ക്കായി യൂണീക്കോഡ് കണ്‍‌സോര്‍ഷ്യം എന്നായിരിക്കണം നമ്മുടെ രാഷ്ട്രീയം. ഞാന്‍ പറഞ്ഞ് മടുത്തു. നമ്മുടെ സര്‍ക്കാരില്‍, ഭാഷയുടെ കമ്പ്യൂട്ടേഷണല്‍ പ്രശ്നങ്ങള്‍ മനസ്സിലാവുന്ന ഒരൊറ്റ ഉദ്യോഗസ്ഥനും ഇല്ലേ എന്റെ ദൈവമേ? - ബെന്നി

    ReplyDelete
  21. സെബിനേ, പ്രവീണേ

    സെബിന്റേത് നിര്‍ദ്ദോഷമായ ഒരു ചോദ്യമാണ്. യൂണിക്കോഡ് ഇന്‍ഡിക് ലിസ്റ്റിലെ ഡിസ്കഷന്റെ ചൂടൊന്നും ഇവിടെ വേണ്ട. സെബിന്‍ പ്രവീണ്‍ ചര്‍ച്ച ചെയ്ത് അല്പം ചൂടായതാണ് . ക്ഷമിക്കുക.
    ഇന്നുള്ള എല്ലാ സോഫ്റ്റ്‌വെയറുകളും മലയാളമുല്‍പ്പാദിച്ചുകൊണ്ടേയിരിക്കും. അവ ഇപ്പോള്‍ യൂണിക്കോഡ് 5.0 കംപാറ്റിബിള്‍ ആന്. അവര്‍ എല്ലാവരും യൂണിക്കോഡ് സ്റ്റാന്‍ഡേര്‍ഡിനനുസരിച്ചു പരിഷ്കരിക്കണമെന്നില്ല. പരിഷ്കരിച്ചാല്‍ തന്നെ എല്ലാ ഉപഭോക്താക്കളും അപ്‌ഡേഠ്ട് ചെയ്യണമെന്നില്ല. അതുപോലെ ഇന്നുള്ള മലയാളം (യൂണിക്കോഡ് 5.0 അനുസരിക്കുന്നത്) വരും കാലത്ത് ശരിക്കുകാണിക്കുന്നതിന് ( ഡിജിറ്റല്‍ ഡാറ്റയ്ക്ക് മരണമില്ലല്ലോ) എല്ലാ ഫോണ്ടുകളും വീണ്ടും ഈ രണ്ടുസ്കീമുകളേയും പിന്തുണയ്ക്കും. (യൂണിക്കോഡിന് സ്റ്റെബിലിറ്റി പൊളിസിയുണ്ടെന്ന് മറക്കല്ലേ) ഇതൊന്നും ബോട്ടോടിച്ച് തീര്‍ക്കാവുന്ന പ്രശ്നമല്ല. അപ്പോ എന്തിനാണ് ആണവ ചില്ലന്‍ വരുന്നതെന്ന ചോദ്യം വീണ്ടും വരുന്നു. അഞ്ചാറെണ്ണമല്ലേ ഉള്ളൂ എന്‍കോഡ് ചെയ്തുകളയാം എന്ന ന്യായമാണ് ഈ നീക്കത്തിനു പുറകില്‍ .

    കണ്‍വീനിയന്‍സും സെക്യൂരിറ്റിയും ഒരു ആവശ്യത്തിനു പുറകില്‍ വരുമ്പോള്‍ കമ്പ്യൂട്ടിങ്ങ് അറിയുന്ന ആരും പ്രാധാന്യം കൊടുക്കുക സെക്യൂരിറ്റി പ്രശ്നത്തിനാണ്. അതാണ് നമ്മള്‍ ചെയ്യുന്നതും. അതുപോലെ ഭാഷാപരമായ സാധുതയ്ക്കും ഊന്നല്‍ നല്‍കിയില്ലെങ്കില്‍ മലയാളം കമ്പ്യൂട്ടിങ്ങ് കുട്ടിച്ചോറാവുകയാണ്. ന്‍ ആണവനാകുമ്പോള്‍ അതിന് ന എന്ന അക്ഷരവുമായുള്ള ബന്ധം നഷ്ടപ്പെടുകയാണ്. ര്‍ ആണവനാകുമ്പോള്‍ അതിനും ഭാഷാശാസ്ത്രപരമായ സാധുത നഷ്ടപ്പെടുകയാണ്. അല്ലെങ്കില്‍ നമ്മളാവശ്യപ്പെട്ട cannonical equivalence വേണം. ആണവന്‍ = വ്യഞ്ജനം+ചന്ദ്രക്കല+ZWJ എന്ന നിര്‍വചനം യൂണിക്കോഡ് പറയണം. (Implimentation ഓപ്പറേറ്റിങ്ങ് സിസ്റ്റം ലെവലിലാനെങ്കിലും)

    കമ്പ്യൂട്ടിങ്ങിന്റെ ആവശ്യം മലയാളം ടൈപ്പ് ചെയ്യലോ , കീബോര്‍ഡ് സൌകര്യമോ മാത്രമല്ല സെബിനേ, സോര്‍ട്ടിങ്ങ്, സെര്‍ച്ചിങ്ങ് തുടങ്ങി നിരവധിയനവധി കമ്പ്യൂട്ടിങ്ങ് ഓപ്പറേഷന് ഭാഷയെ പ്രാപ്തമാക്കണമെങ്കില്‍ അതിന്റെ ലോജിക്കല്‍ നിലനില്‍പ്പ് അത്യാവശ്യമാണ്. അത് Exeptional റൂളുകളുടെ കുത്തരങ്ങാക്കാനെ പുതിയ പരിഷ്കാരം കൊണ്ട് സാധിക്കൂ. മലയാളം കമ്പ്യൂട്ടിങ്ങിന്റെ ഭാവി നിങ്ങളുടെ കയ്യിലാണ് , യൂണിക്കോഡ് 5.1 നെപ്പറ്റി ഇനി അഭിപ്രായം രേഖപ്പെടുത്താന്‍ 8-10 മണിക്കൂറുകള്‍ മാത്രം . വേഗമാകട്ടെ.

    ReplyDelete
  22. സെബിന്‍,
    ബാക്ക് വേര്‍ഡ് കമ്പാറ്റിബിലിറ്റി അങ്ങെടുത്തു കളഞ്ഞാല്‍ എന്തു സംഭവിക്കുമെന്ന് നല്ല ബോധമുള്ളതുകൊണ്ടാണ് യൂണിക്കോഡ് ദാ ഇങ്ങനെ ഒരു സാധനം എഴുതി വച്ചിട്ടുള്ളത്.

    ReplyDelete
  23. മഹേഷ് പൈയുടെ വക ഒരു തമാശ പങ്കുവയ്ക്കട്ടെ.

    സ്പൂഫിങ് തടയാനായി മൂപ്പര്‍ പറഞ്ഞ ഉപായം input method-ല്‍ മാറ്റം വരുത്തിയാല്‍ മതി എന്നാണു്.അതായതു് കക്കാന്‍ വരുന്നവന്‍ ഗേറ്റില്‍ പൂട്ടുകണ്ടു് മടങ്ങിപ്പോയ്ക്കോളും എന്നു പറയുന്നതു പോലെ!

    ReplyDelete
  24. അനിവര്‍,

    പ്രവീണ്‍ അങ്ങനെ സംസാരിച്ചതില്‍ എനിക്കു് പരിഭവമൊന്നുമില്ല. വിഷയത്തിന്റെ extremeല്‍ നില്‍ക്കുന്നതുകൊണ്ടാണു് പ്രവീണ്‍ അങ്ങനെ പറഞ്ഞതെന്നു് എനിക്കു മനസ്സിലാക്കാനാവും. കാരണം ഞാനും എനിക്കു് വ്യക്തമായി അറിയാവുന്ന കാര്യങ്ങളില്‍ ഇതേപോലൊക്കെ മുമ്പു് സംസാരിച്ചിട്ടുണ്ടു്. ഒരു കാര്യത്തില്‍ വ്യക്തമായ ധാരണയും അറിവുമുള്ള ഒരാള്‍ക്കു് അതേ വിഷയത്തില്‍ പരിമിതമായ അറിവും പക്ഷപാതവുമുള്ള മറ്റൊരാളുടെ‍ 'വിവരക്കേടു്' സഹിക്കാനാവില്ലല്ലോ.

    പക്ഷെ ഞാന്‍ വെറുതെ എതിര്‍ക്കാന്‍ വരികയായിരുന്നില്ല. പ്രശ്നം പഠിക്കുകയായിരുന്നു ഉദ്ദേശ്യം. ഇന്നലെ സാങ്കേതിക കാര്യങ്ങളില്‍ അറിവുള്ള കുറേയേറെ പേരോടു് ഞാന്‍ ഇതേക്കുറിച്ചൊക്കെ സംസാരിച്ചു. അങ്ങനെ ലഭിച്ച ചില ഉള്‍ക്കാഴ്ചകളുടെ വെളിച്ചത്തില്‍ എന്റെ നിലപാടിനു് ചില മാറ്റങ്ങളും വന്നിട്ടുണ്ടു്. അതു് ആണവ ചില്ലിനെ പൂര്‍ണ്ണമായും നിരാകരിക്കുന്ന രീതിയിലല്ല, എന്നാല്‍ canonical equivalence വേണം എന്നതിലാണു് വന്നെത്തി നില്‍ക്കുന്നതു്. അങ്ങനെയെങ്കില്‍ പിന്നെ ആണവ ചില്ലെന്തിനു് എന്ന മറുചോദ്യം വരുമെന്നറിയാം. അതിനുള്ള മറുപടി നേരത്തെ ഞാന്‍ തന്നു കഴിഞ്ഞു എന്നു് കരുതട്ടെ. ഭാഷയുടെ സ്വഭാവത്തിനു് നന്നു് അതാണെന്ന ധാരണയാണു് അതിനു കാരണം.

    യൂണിക്കോഡില്‍ ബായ്ക്ക്‌വേഡ് കമ്പാറ്റിബിലിറ്റി ഉറപ്പാക്കുന്നതു് നല്ല ഉദ്ദേശ്യത്തോടെയാണെന്നു് തിരിച്ചറിയുന്നു. പക്ഷെ എന്തുകൊണ്ടോ, ഒരിക്കല്‍ തെറ്റായ എന്‍കോഡിംഗു് നടന്നാല്‍ അതു് എല്ലാക്കാലത്തേക്കും അങ്ങനെ നിലനില്‍ക്കും എന്ന അപകടം പതിയിരിക്കുന്നു. അതില്‍ അസ്വാഭാവികമായി ഒന്നുമില്ല. യൂണിക്കോഡിന്റെ പ്രശ്നമല്ല, ഭാഷയുടെ പരിമിതിയാണു് മലയാളം അഭിമുഖീകരിക്കുന്നതു്. ചരിത്രത്തെ തിരുത്താനുമാവില്ലല്ലോ.

    സേര്‍ച്ചിംഗു്, സോര്‍ട്ടിംഗു് തുടങ്ങി ഒട്ടേറെ പ്രശ്നങ്ങള്‍ വേറെയുമുണ്ടെന്നും സെക്യൂരിറ്റി മാത്രമല്ല ഇവിടെ വിഷയമെന്നും എനിക്കു് വ്യക്തമായി. മലയാളത്തിന്റെ പ്രശ്നം CJK ഭാഷകള്‍ പോലെ അക്ഷരവൈപുല്യമല്ല, വ്യാകരണ നിയമങ്ങളിലെ ചില അവ്യവസ്ഥകളാണു് എന്നു് ഇപ്പോളെനിക്കു് തോന്നുന്നു. അറബിയിലെ ചില മുഖമില്ലാത്ത ക്യാരക്ടറുകളെ കൈകാര്യം ചെയ്യുന്ന അതേ രീതിയില്‍ മലയാളത്തില്‍ അവയെ കൈകാര്യം ചെയ്യാനാവാത്തതു് അതുകൊണ്ടാണെന്നും തോന്നുന്നു.

    ല്‍ തയില്‍ നിന്നാണോ ല യില്‍ നിന്നാണോ എന്നതുപോലെ തന്നെ ര്‍ രയില്‍ നിന്നോ റയില്‍ നിന്നോ എന്നും തര്‍ക്കമുണ്ടല്ലോ. ഇതും സോര്‍ട്ടിംഗില്‍ പ്രയാസമുണ്ടാക്കുന്ന കാര്യം തന്നെ. ര്‍ രണ്ടില്‍ നിന്നും ഉണ്ടാവുന്നെണ്ടെന്നു് പറഞ്ഞാല്‍ പോലും ഒരു പ്രത്യേക വാക്കില്‍ അതു് ഏതില്‍ നിന്നാണു് ഉണ്ടായതെന്നു് കമ്പ്യൂട്ടറിനെ എങ്ങനെ മനസ്സിലാക്കിക്കും എന്നതു തന്നെ പ്രശ്നം. ഇതു് ആറ്റോമിക്‍ ചില്ലു് വന്നാലും ഇല്ലെങ്കിലും നിലനില്‍ക്കുന്ന പ്രശ്നമാണു്. അല്ലെങ്കില്‍ നിഘണ്ടുക്കള്‍ ചെയ്തതുപോലെ കണ്ണുമടച്ചു് രയ്ക്ക് അനുകൂലമായി ഒരു തീര്‍പ്പുകല്‍പ്പിക്കേണ്ടി വരും. അതേപോലെ തന്നെയാണു് 'പ്ര'യുടെ കാര്യവും. ഇവിടെയും വിവിധ വാക്കുകളില്‍ പ്രയ്ക്ക് ര ശബ്ദവും റ ശബ്ദവും വരുന്നുണ്ടു്.

    ഇതൊക്കെ, മലയാളം ഉച്ചരിക്കുന്നതു പോലെ എഴുതുന്ന ഭാഷയായിരിക്കെ തന്നെ പല സന്ദര്‍ഭങ്ങളിലും ഒന്നിലേറെ ശബ്ദങ്ങള്‍ക്കു് വെവ്വേറെ അക്ഷരം ഇല്ലാത്തതിനാല്‍ വരുന്ന പ്രശ്നമാണു്. മലയാളം മാതൃഭാഷയായവര്‍ക്കു് ഇതു പ്രശ്നമല്ലെങ്കിലും ഇതിനു് കൃത്യമായ നിയമം പറഞ്ഞുകൊടുക്കാന്‍ പ്രയാസമായതിനാല്‍ മറ്റുഭാഷക്കാര്‍ക്കും യന്ത്രത്തിനും ബുദ്ധിമുട്ടുണ്ടാക്കുന്നു.

    പിന്നെയും ചില വാക്കുകളില്‍ മാത്രമായി 'ലളയോ നഭേദഃ' എന്ന നിയമവുമുണ്ടു്. ലയുടെ സ്ഥാനത്തു് ളയും മറിച്ചും ഉപയോഗിക്കാം എന്നു സാരം. എന്നാല്‍ ഇതു് universal law അല്ല. 'ഴ'യും 'ള'യും ഇതേപോലെ മാറിമാറി ഉപയോഗിക്കാറുണ്ടു്.

    'മ്പ' ശബ്ദം കൊണ്ടു് 'മ'യുടെയും 'പ'യുടെയും സന്ധിയാണെങ്കിലും 'ന'യും 'പ'യും ചേരുന്ന ചില വാക്കുകള്‍ക്കു് 'ന്‍പ' ശബ്ദവും 'മ്പ'ശബ്ദവും​ ഒരേ സമയം പ്രയോഗിക്കാറുണ്ടു്. എന്നാല്‍ മ്പയുടെ കാര്യത്തില്‍ കാനോനിക്കല്‍ ഈക്വലന്‍സ് വിലപ്പോവില്ല. ശബ്ദതാരാവലിയും ശ്രീകണ്ഠേശ്വരവും മറിച്ചു പറഞ്ഞാല്‍ പോലും അതു് മയും പയും തന്നെയാണു്. അന്‍പു്, അമ്പു് എന്നീ വാക്കുകള്‍ പരിഗണിക്കുമ്പോള്‍ ശബ്ദവ്യത്യാസം അര്‍ത്ഥവ്യത്യാസമുണ്ടാക്കുന്നതു് വ്യക്തമായി കാണാം. എന്നാല്‍ പിമ്പട തുടങ്ങിയ വാക്കുകളില്‍ 'ന'യല്ലേ എന്ന ചോദ്യമുണ്ടാകാം. ഇവിടെ പിന്‍പട എന്നും പിമ്പട എന്നും പറയുമെന്നു കൂടി അറിഞ്ഞാലോ? അപ്പോള്‍ ന്‍പയുടെ സ്ഥാനത്തു് ചില വാക്കുകളില്‍ മ്പ ഉപയോഗിച്ചാലും അക്ഷരപ്പിശകല്ല, ശരിയായ രൂപമാണു് എന്നു വരുന്നു. അവിടെ ന്‍പയ്ക്കു് പകരം ഉപയോഗിക്കാവുന്ന അക്ഷരസങ്കരമാണു് മ്പ. അല്ലാതെ നയും പയും ചേര്‍ന്നു് മ്‌പ ആകുകയല്ല എന്നാണു് എനിക്കു തോന്നുന്നതു്.

    ഇതേ പോലെ ഉറപ്പില്ലാത്ത ഒട്ടധികം നിയമങ്ങളുണ്ടു്. ചില വാക്കുകളില്‍ 'ക'യും 'വ'യും മാറി മാറി ഉപയോഗിക്കാറുണ്ടു്. ഇതിനൊക്കെ സാധൂകരണം കണ്ടെത്താന്‍ പ്രയാസമാകും. അപ്പോള്‍ പിന്നെ സോര്‍ട്ടിംഗില്‍ ഈ വിഷയം എങ്ങനെ പരിഹരിക്കും?

    'ന' വേറൊരു വില്ലനാണു്. നനയുക എന്ന വാക്കില്‍ രണ്ടു് ശബ്ദവുമുണ്ടല്ലോ. കന്നന്തരം എന്നിടത്തു് നനയുക എന്നതിലെ രണ്ടാമത്തെ നയുടെ ഇരട്ടിപ്പാണു്. ചെന്നായ എന്നിടത്തു് ആദ്യത്തെ നയുടേതും. ഇരട്ടിപ്പിലും രണ്ടു ശബ്ദവും വരുന്നുണ്ടു്. എന്നാല്‍ കന്നി എന്ന പദത്തെ രണ്ടു ശബ്ദം ഉപയോഗിച്ചും വായിക്കാം. രണ്ടും പ്രയോഗ സാധുത ഉള്ളതു തന്നെ. നെറ്റി എന്ന അര്‍ത്ഥത്തില്‍ ചെന്നി എന്നെഴുതുമ്പോള്‍ രണ്ടാമത്തെ നയും ചെന്നിറങ്ങി എന്നെഴുതുമ്പോള്‍ ആദ്യത്തെ നയും വരുന്നു. മലയാളം സങ്കീര്‍ണ്ണമായ ഭാഷ തന്നെ.

    ഇനി റാല്‍മിനോവു് പറഞ്ഞ ഴ, യ എന്നിവയുടെ കാര്യം. കായ്, പാഴ് എന്നീ വാക്കുകളില്‍ വരുന്നതു് ചില്ലിന്റെ സ്വഭാവമാണെന്ന വാദത്തോടു് പൂര്‍ണ്ണമായും യോജിക്കുമ്പോഴും ഇവയ്ക്കു് പ്രത്യേക ചിഹ്നങ്ങള്‍ ഉപയോഗിക്കുന്നില്ലെന്നതു് ശ്രദ്ധിക്കുക. ഇവിടെ സംവൃതോകാരം ഉപയോഗിക്കാതെയാണു് ആ സ്വഭാവം പ്രകടമാക്കുന്നതു്. അങ്ങനെ വരുമ്പോള്‍ ശരിയായ മലയാളം എഴുതണമെങ്കില്‍ സംവൃതോകാരം നിര്‍ബന്ധമാണെന്നു് വരുന്നു. അതുപയോഗിക്കാത്തവര്‍ ഉടന്‍ ഉപയോഗിച്ചു തുടങ്ങൂ എന്നേ അതേക്കുറിച്ചു് പറയാനുള്ളൂ. നിലവില്‍ ചിഹ്നങ്ങളില്ലാത്ത രൂപങ്ങള്‍ക്കു് ചിഹ്നങ്ങളുണ്ടാക്കുക എന്നതു് യൂണിക്കോഡിന്റെ പണിയല്ലല്ലോ. അതങ്ങനെ തന്നെ തുടരട്ടെ എന്നാണു് കൂട്ടിച്ചേര്‍ക്കാനുള്ളതു്.

    ഫയല്‍ ഭാരത്തെ കുറിച്ചു് ഞാന്‍ പറഞ്ഞതു് തീര്‍ത്തും ബാലിശമായിരുന്നുവെന്നു് പ്രവീണിന്റെ വിശദീകരണത്തില്‍ നിന്നു് മനസ്സിലായി. നന്ദി.

    ReplyDelete
  25. This comment has been removed by the author.

    ReplyDelete
  26. സെബിന്‍ കാര്യങ്ങള്‍ മനസ്സിലാക്കാന്‍ ശ്രമിച്ചതിനു നന്ദി.
    ഭാഷയില്‍ നിലനില്‍ക്കുന്ന ആശയക്കുഴപ്പങ്ങള്‍ ഏതൊക്കെ യുണിക്കോഡിന്റെ പരിധിയില്‍ വരും ഏതൊക്കെ അതുപയോഗിക്കുന്നവരുടെ പരിധിയില്‍ വരും എന്നതും പ്രധാനമാണു്.
    വേണം നമുക്ക് ഏകീകൃതമായ ഒരെഴുത്തുരീതി., ചരിത്രത്തെ വീണ്ടെടുക്കുക
    എന്നിവ വായിച്ചിട്ടുണ്ടാകുമെന്നു കരുതുന്നു.

    ReplyDelete

Note: Only a member of this blog may post a comment.

 
live web stats