Sunday, December 9, 2007

കേള്‍വി ഒരു കല, സംഭാഷണം സംഗീതവും

"കേള്‍വി ഒരു കലയാണ്. നാക്ക് നമ്മുടെ ചെവിയിലായിരുന്നെങ്കില്‍ ശബ്ദത്തെ രുചിയ്ക്കാമായിരുന്നു" ഫോസ്.ഇന്‍ പരിപാടിയ്ക്കിടയില്‍ ഉണ്ടായ ഒരു സംഭാഷണമദ്ധ്യേ പ്രശസ്ത ഡിസൈനറും കോളമിസ്റ്റൂം സ്വതന്ത്ര സോഫ്റ്റ്‌വെയര്‍ പ്രചാരകനുമായ നിയാം ഭൂഷണ്‍ എന്നോടു പറഞ്ഞു.
ഫോസ്.ഇന്‍ പരിപാടിയില്‍ എന്റെ ഭാരതീയ ഭാഷാ സംഭാഷണവിശ്ലേഷിണിയെപ്പറ്റിയുള്ള(Speech Synthesizer) അവതരണത്തില്‍ നിയാം ഭൂഷണും ശ്രോതാവായി വന്നിരുന്നു. വാക്കുകളെ ശബ്ദമാക്കുമ്പോള്‍ ശാസ്ത്രം അഭിമുഖീകരിയ്ക്കുന്ന ഒരു വെല്ലുവിളിയാണ് വായിക്കുന്നതിന്റെ താളഭംഗിയും അതിന്റെ സ്വാഭാവികതയും. ധ്വനി എന്ന എന്റെ സോഫ്റ്റ്‌വെയര്‍ തികച്ചും യാന്ത്രികമായിട്ടാണ് 8 ഭാഷകള്‍ വായിക്കുന്നത്. കേട്ടാല്‍ മനസ്സിലാവുമെങ്കിലും അതിന്റെ റോബോട്ടിക് സംസാരശൈലി പലപ്പോഴും അരോചകമാണെന്നത് സത്യമാണ്. ശബ്ദങ്ങളെ കൂട്ടിയിണക്കിയുള്ള സംസാരവിശ്ലേഷിണികളാണ് ഏറെയും പ്രചാരത്തിലുള്ളത്. അവയില്‍ താളവും സ്വാഭാവികതയും കൊണ്ടു വരുന്നതിനെപ്പറ്റിയുള്ള ഗവേഷണങ്ങള്‍ ഇപ്പോളും പൂര്‍ണ്ണവിജയത്തിലെത്തിയിട്ടില്ല. പലരും അങ്ങനെയൊരു സംരംഭം പൂര്‍ണ്ണവിജയം കാണില്ലെന്ന് വാദിയ്ക്കുന്നുണ്ടു താനും. ഈ ഗവേഷണം ലാറ്റിന്‍ ഭാഷകളില്‍ ഏറെക്കുറെ പുരോഗതി നേടിയിട്ടുണ്ട്. ഫെസ്റ്റിവല്‍ എന്ന സോഫ്റ്റ്‌വെയര്‍ ഇംഗ്ലീഷിനു വേണ്ടി ഉപയോഗിച്ചു നോക്കിയാല്‍ ഇതു മനസ്സിലാക്കാന്‍ പറ്റും. രണ്ട് പ്രശ്നങ്ങളാണ് ഈ ഗവേഷണങ്ങള്‍ക്ക് മുന്നിലുള്ളത്.
1. എപ്പോളൊക്കെയാണ് സംസാരം നീട്ടിയോ താളത്തിലോ നമ്മള്‍ പറയുന്നത്?
2. ഒന്നാമത്തെ ചോദ്യത്തിനുത്തരം ലഭിച്ചുകഴിഞ്ഞാല്‍ എങ്ങനെയാണ് കൃത്രിമമായി അത്തരം നീട്ടിക്കുറുക്കലുകള്‍ സംസാരത്തില്‍ കൊണ്ടു വരുന്നത്?
രണ്ടാമത്തെ ചോദ്യത്തിനുത്തരം ഡി എസ് പി അഥവാ ഡിജിറ്റല്‍ സിഗ്നല്‍ പ്രൊസസ്സിങ്ങ് എന്ന ടെക്നോളജി എന്ന വാക്കിലൊതുക്കാമെങ്കിലും, ഇതു വരെ നടന്നിട്ടുള്ള ഗവേഷണങ്ങള്‍ സൂചിപ്പിയ്ക്കുന്നതു് നാം എത്രത്തോളം ഡി എസ് പി പ്രൊസസ്സിങ്ങ് ഒരു ശബ്ദതരംഗത്തിനുമേല്‍ നടത്തുന്നുവോ അത്രത്തോളം അതിന്റെ സ്വാഭാവികതയ്ക്കു് കുറവു് വരുന്നു എന്നാണു്. അതുകൊണ്ടു തന്നെയാണു്, നേരത്തെ ശേഖരിച്ചു് മനുഷ്യസംസാരശകലങ്ങളെ കൂടിയിണക്കുന്നതുനു് പകരം കൃത്രിമമായി ശബ്ദതരംഗങ്ങളെ സൃഷ്ടിയ്ക്കുന്ന സങ്കേതങ്ങള്‍ വേണ്ടത്ര വിജയിക്കാത്തതും.
എന്റെ അവതരത്തിനിടയില്‍ നിയാം ഭൂഷണ്‍ പറഞ്ഞത്, സംസാരം എന്നത് ഒരുതരത്തില്‍ സംഗീതം തന്നെയാണെന്നാണ്. താളക്രമങ്ങളുടെ ഏറ്റക്കുറച്ചിലുകള്‍ കുറവായിരിയ്ക്കുന്ന ഒരു സംഗീതത്തെ സംഭാഷണമാണെന്ന് കണക്കാക്കാമത്രെ. നിയാം സംഗീതത്തെക്കുറിച്ചും വിശിഷ്യാ ശബ്ദത്തിന്റെ വിവിധ രൂപഭാവങ്ങളെയും കുറിച്ച് ദീര്‍ഘകാലമായി ഗവേഷണം നടത്തുന്ന വ്യക്തിയാണു്. എന്റെ അവതരണത്തിനു ശേഷം ഈ വിഷയത്തി‌ല്‍ അദ്ദേഹവുമായി ഒരു മണിക്കൂറിലേറെ സമയം ഞാന്‍ ഇക്കാര്യങ്ങള്‍ ചര്‍ച്ച ചെയ്തു. 20Hz നും 20KHz നും ഇടയില്‍ മാത്രമല്ല, അതില്‍ കുറഞ്ഞ ആവൃത്തിയിലുള്ള ശബ്ദവും നമുക്ക് കേള്‍ക്കാന്‍ പറ്റില്ലെങ്കിലും സംവേദനക്ഷമമാണ് . കാതുകളല്ലാതെ നമ്മുടെ ശരീരത്തിന്റെ ഓരോ അവയവത്തിനും ഇത്തരം ശബ്ദത്തിനെ മനസ്സിലാക്കാന്‍ കഴിവുണ്ട്. ഇത് തെളിയിക്കാന്‍ വേണ്ടി നിയാം എന്റെ തലയില്‍ രണ്ട് കൊട്ടുകൊട്ടിയിട്ട് അതിന്റെ ശബ്ദം ചെവി ഉപയോഗിച്ചാണോ ശ്രവിച്ചതെന്ന് ചോദിച്ചു. അതുപോലെ തന്നെ തണുപ്പുകാലത്ത് നമ്മുടെ പല്ലുകള്‍ കൂട്ടിമുട്ടുമ്പോഴും...കൊച്ചുകുട്ടികളുടെ ശ്രവണശേഷിയ്ക്ക് കുറഞ്ഞ ആവൃത്തിയുള്ള ശബ്ദങ്ങള്‍ സംവേദനക്ഷമമാണത്രേ..കൊച്ചുകുട്ടികള്‍ അമ്മയെ വിളിയ്ക്കുമ്പോള്‍ തുടങ്ങുമ്പോള്‍ ഉപയോഗിയ്ക്കുന്നത് മകാരത്തിന്റെ രൂപഭേദങ്ങളാണെന്നതിന് ശാസ്ത്രീയമായ ചിലകാരണങ്ങളുണ്ടത്രേ. അതുപോലെ അച്ഛനെ വിളിയ്ക്കാനുപയോഗിയ്ക്കുന്ന പകാരത്തിനും. പയും മയും ഒരേ വര്‍ഗ്ഗാക്ഷരങ്ങളുമാണല്ലോ.. ശബ്ദത്തിന്റെയും മനുഷ്യന്റെ സംഭാഷണശേഷിയുടെയും ഇത്തരം അടിസ്ഥാനവസ്തുകളെക്കുറിച്ച് കൂടുതല്‍ പഠിയ്ക്കുന്നത് ധ്വനിയുടെയും ശ്യാം വികസിപ്പിച്ച് കൊണ്ടിരിയ്ക്കുന്ന ശാരിക എന്ന മലയാളം സംസാരസംശ്ലേഷിണിയുടെയും(Speech Recognizer) പ്രോഗ്രാമ്മിങ്ങിനു് ഉപകാരപ്രദമായിരിയ്ക്കുമെന്ന് അദ്ദേഹം പറഞ്ഞു.

ശബ്ദമലിനീകരണം കൊണ്ടും ഒരേ ശബ്ദം പലയാവര്‍ത്തി ശ്രവിയ്ക്കുന്നതിലൂടെയും നമ്മുടെ ശ്രവണശേഷിയ്ക്ക് തകരാറു് പറ്റാറുണ്ടു്. ഈ പേജില്‍ നിയാം എങ്ങനെ കേള്‍വിയ്ക്കുണ്ടാകുന്ന ഇത്തരം പ്രശ്നങ്ങളെ അതിജീവിയ്ക്കാമെന്നു് വിശദീകരിയ്ക്കുന്നുണ്ടു്. ശബ്ദത്തിന്റെ അതിന്റെ ഒച്ചക്കൂടുതല്‍ കൊണ്ടുണ്ടാകുന്ന വിപത്തുകളെക്കുറിച്ചും വളരെ വിശദമായൊരു ലേഖനം ഇവിടെയുണ്ടു്. കേള്‍വി എന്നത് ഒരു കലയാണെങ്കില്‍ അതാസ്വദിയ്ക്കാന്‍ നമ്മുടെ കാതുകളെ സംരക്ഷിക്കേണ്ടത് അത്യാവശ്യമാണു്.
മാതൃഭൂമി ആഴ്ചപ്പതിപ്പു് ഡിസംബര്‍ 2-8(ലക്കം 40 - പേജ് 60) ല്‍ വന്ന "നമ്മുടെ ആയുസ്സില്‍ ശബ്ദത്തിന്റെ സ്വാധീനം" എന്ന ജീവന്‍ ജോബ് തോമസിന്റെ ശാസ്ത്രലേഖനവും ഇതേ വിഷയത്തിലുള്ളതാണു്.

ശബ്ദത്തെക്കുറിച്ചും നമ്മുടെ ശബ്ദസംവേദന ശേഷി വര്‍ദ്ധിപ്പിയ്ക്കാനും കാതുകളെ പരിശീലിപ്പിയ്ക്കാനുമുള്ള സ്വതന്ത്ര സോഫ്റ്റ്‌വെയറാണു് ഗ്നു സോല്‍ഫേജ്

സംഗീതം ഒരു മഹാസാഗരമാണെങ്കില്‍ സംഭാഷണവും അങ്ങനെത്തന്നെ!!!

കുറിപ്പ്: എന്റെ http://santhoshtr.livejournal.com എന്ന ബ്ലോഗ് പ്ലാനറ്റ് ഫ്ലോസ് ഇന്ത്യ എന്ന സ്വതന്ത്ര സോഫ്റ്റ്‌വെയര്‍ പ്രവര്‍ത്തകരുടെ ബ്ലോഗ് അഗ്രഗേറ്റര്‍ സബ്‌‌സ്ക്രൈബ് ചെയ്യുന്നത് കൊണ്ട്, അതില്‍ ഇനി ഇംഗ്ലീഷില്‍ മാത്രമേ എഴുതുള്ളൂ.

2 comments:

  1. ധ്വനിയും ശാരികയും കൂടുതല്‍ മുന്നേറാന്‍ ഫോസ്.ഇന്‍ സഹായകമാകുമെന്നു് പ്രതീക്ഷിയ്ക്കുന്നു. നിയാമിന്റെ നീരീക്ഷണങ്ങളും സഹായവും ഇവയെ ഒന്നു കൂടി മെല്ലപ്പെട്ടതാക്കാന്‍ സഹായിയ്ക്കുമെന്നു് കൂടി പ്രതീക്ഷിയ്ക്കുന്നു. ഇനിയും മുന്നോട്ടു് മുന്നോട്ടു് ...

    അവസാന വാചകമെഴുതിയപ്പോഴാണു് ഒരാശയം വന്നതു്. എടാ നമുക്കു് പണ്ടത്തെ സാക്ഷരതാ പ്രചാരണത്തിനുപയോഗിച്ചിരുന്നതു് പോലുള്ള നാടന്‍ പാട്ടുകളെഴുതാന്‍ പറ്റുമോ സ്വതന്ത്ര സോഫ്റ്റുവെയര്‍ പ്രചാരണത്തിനു്?

    ReplyDelete

Note: Only a member of this blog may post a comment.

 
live web stats