"കേള്വി ഒരു കലയാണ്. നാക്ക് നമ്മുടെ ചെവിയിലായിരുന്നെങ്കില് ശബ്ദത്തെ രുചിയ്ക്കാമായിരുന്നു" ഫോസ്.ഇന് പരിപാടിയ്ക്കിടയില് ഉണ്ടായ ഒരു സംഭാഷണമദ്ധ്യേ പ്രശസ്ത ഡിസൈനറും കോളമിസ്റ്റൂം സ്വതന്ത്ര സോഫ്റ്റ്വെയര് പ്രചാരകനുമായ നിയാം ഭൂഷണ് എന്നോടു പറഞ്ഞു.
ഫോസ്.ഇന് പരിപാടിയില് എന്റെ ഭാരതീയ ഭാഷാ സംഭാഷണവിശ്ലേഷിണിയെപ്പറ്റിയുള്ള(Speech Synthesizer) അവതരണത്തില് നിയാം ഭൂഷണും ശ്രോതാവായി വന്നിരുന്നു. വാക്കുകളെ ശബ്ദമാക്കുമ്പോള് ശാസ്ത്രം അഭിമുഖീകരിയ്ക്കുന്ന ഒരു വെല്ലുവിളിയാണ് വായിക്കുന്നതിന്റെ താളഭംഗിയും അതിന്റെ സ്വാഭാവികതയും. ധ്വനി എന്ന എന്റെ സോഫ്റ്റ്വെയര് തികച്ചും യാന്ത്രികമായിട്ടാണ് 8 ഭാഷകള് വായിക്കുന്നത്. കേട്ടാല് മനസ്സിലാവുമെങ്കിലും അതിന്റെ റോബോട്ടിക് സംസാരശൈലി പലപ്പോഴും അരോചകമാണെന്നത് സത്യമാണ്. ശബ്ദങ്ങളെ കൂട്ടിയിണക്കിയുള്ള സംസാരവിശ്ലേഷിണികളാണ് ഏറെയും പ്രചാരത്തിലുള്ളത്. അവയില് താളവും സ്വാഭാവികതയും കൊണ്ടു വരുന്നതിനെപ്പറ്റിയുള്ള ഗവേഷണങ്ങള് ഇപ്പോളും പൂര്ണ്ണവിജയത്തിലെത്തിയിട്ടില്ല. പലരും അങ്ങനെയൊരു സംരംഭം പൂര്ണ്ണവിജയം കാണില്ലെന്ന് വാദിയ്ക്കുന്നുണ്ടു താനും. ഈ ഗവേഷണം ലാറ്റിന് ഭാഷകളില് ഏറെക്കുറെ പുരോഗതി നേടിയിട്ടുണ്ട്. ഫെസ്റ്റിവല് എന്ന സോഫ്റ്റ്വെയര് ഇംഗ്ലീഷിനു വേണ്ടി ഉപയോഗിച്ചു നോക്കിയാല് ഇതു മനസ്സിലാക്കാന് പറ്റും. രണ്ട് പ്രശ്നങ്ങളാണ് ഈ ഗവേഷണങ്ങള്ക്ക് മുന്നിലുള്ളത്.
1. എപ്പോളൊക്കെയാണ് സംസാരം നീട്ടിയോ താളത്തിലോ നമ്മള് പറയുന്നത്?
2. ഒന്നാമത്തെ ചോദ്യത്തിനുത്തരം ലഭിച്ചുകഴിഞ്ഞാല് എങ്ങനെയാണ് കൃത്രിമമായി അത്തരം നീട്ടിക്കുറുക്കലുകള് സംസാരത്തില് കൊണ്ടു വരുന്നത്?
രണ്ടാമത്തെ ചോദ്യത്തിനുത്തരം ഡി എസ് പി അഥവാ ഡിജിറ്റല് സിഗ്നല് പ്രൊസസ്സിങ്ങ് എന്ന ടെക്നോളജി എന്ന വാക്കിലൊതുക്കാമെങ്കിലും, ഇതു വരെ നടന്നിട്ടുള്ള ഗവേഷണങ്ങള് സൂചിപ്പിയ്ക്കുന്നതു് നാം എത്രത്തോളം ഡി എസ് പി പ്രൊസസ്സിങ്ങ് ഒരു ശബ്ദതരംഗത്തിനുമേല് നടത്തുന്നുവോ അത്രത്തോളം അതിന്റെ സ്വാഭാവികതയ്ക്കു് കുറവു് വരുന്നു എന്നാണു്. അതുകൊണ്ടു തന്നെയാണു്, നേരത്തെ ശേഖരിച്ചു് മനുഷ്യസംസാരശകലങ്ങളെ കൂടിയിണക്കുന്നതുനു് പകരം കൃത്രിമമായി ശബ്ദതരംഗങ്ങളെ സൃഷ്ടിയ്ക്കുന്ന സങ്കേതങ്ങള് വേണ്ടത്ര വിജയിക്കാത്തതും.
എന്റെ അവതരത്തിനിടയില് നിയാം ഭൂഷണ് പറഞ്ഞത്, സംസാരം എന്നത് ഒരുതരത്തില് സംഗീതം തന്നെയാണെന്നാണ്. താളക്രമങ്ങളുടെ ഏറ്റക്കുറച്ചിലുകള് കുറവായിരിയ്ക്കുന്ന ഒരു സംഗീതത്തെ സംഭാഷണമാണെന്ന് കണക്കാക്കാമത്രെ. നിയാം സംഗീതത്തെക്കുറിച്ചും വിശിഷ്യാ ശബ്ദത്തിന്റെ വിവിധ രൂപഭാവങ്ങളെയും കുറിച്ച് ദീര്ഘകാലമായി ഗവേഷണം നടത്തുന്ന വ്യക്തിയാണു്. എന്റെ അവതരണത്തിനു ശേഷം ഈ വിഷയത്തില് അദ്ദേഹവുമായി ഒരു മണിക്കൂറിലേറെ സമയം ഞാന് ഇക്കാര്യങ്ങള് ചര്ച്ച ചെയ്തു. 20Hz നും 20KHz നും ഇടയില് മാത്രമല്ല, അതില് കുറഞ്ഞ ആവൃത്തിയിലുള്ള ശബ്ദവും നമുക്ക് കേള്ക്കാന് പറ്റില്ലെങ്കിലും സംവേദനക്ഷമമാണ് . കാതുകളല്ലാതെ നമ്മുടെ ശരീരത്തിന്റെ ഓരോ അവയവത്തിനും ഇത്തരം ശബ്ദത്തിനെ മനസ്സിലാക്കാന് കഴിവുണ്ട്. ഇത് തെളിയിക്കാന് വേണ്ടി നിയാം എന്റെ തലയില് രണ്ട് കൊട്ടുകൊട്ടിയിട്ട് അതിന്റെ ശബ്ദം ചെവി ഉപയോഗിച്ചാണോ ശ്രവിച്ചതെന്ന് ചോദിച്ചു. അതുപോലെ തന്നെ തണുപ്പുകാലത്ത് നമ്മുടെ പല്ലുകള് കൂട്ടിമുട്ടുമ്പോഴും...കൊച്ചുകുട്ടികളുടെ ശ്രവണശേഷിയ്ക്ക് കുറഞ്ഞ ആവൃത്തിയുള്ള ശബ്ദങ്ങള് സംവേദനക്ഷമമാണത്രേ..കൊച്ചുകുട്ടികള് അമ്മയെ വിളിയ്ക്കുമ്പോള് തുടങ്ങുമ്പോള് ഉപയോഗിയ്ക്കുന്നത് മകാരത്തിന്റെ രൂപഭേദങ്ങളാണെന്നതിന് ശാസ്ത്രീയമായ ചിലകാരണങ്ങളുണ്ടത്രേ. അതുപോലെ അച്ഛനെ വിളിയ്ക്കാനുപയോഗിയ്ക്കുന്ന പകാരത്തിനും. പയും മയും ഒരേ വര്ഗ്ഗാക്ഷരങ്ങളുമാണല്ലോ.. ശബ്ദത്തിന്റെയും മനുഷ്യന്റെ സംഭാഷണശേഷിയുടെയും ഇത്തരം അടിസ്ഥാനവസ്തുകളെക്കുറിച്ച് കൂടുതല് പഠിയ്ക്കുന്നത് ധ്വനിയുടെയും ശ്യാം വികസിപ്പിച്ച് കൊണ്ടിരിയ്ക്കുന്ന ശാരിക എന്ന മലയാളം സംസാരസംശ്ലേഷിണിയുടെയും(Speech Recognizer) പ്രോഗ്രാമ്മിങ്ങിനു് ഉപകാരപ്രദമായിരിയ്ക്കുമെന്ന് അദ്ദേഹം പറഞ്ഞു.
ശബ്ദമലിനീകരണം കൊണ്ടും ഒരേ ശബ്ദം പലയാവര്ത്തി ശ്രവിയ്ക്കുന്നതിലൂടെയും നമ്മുടെ ശ്രവണശേഷിയ്ക്ക് തകരാറു് പറ്റാറുണ്ടു്. ഈ പേജില് നിയാം എങ്ങനെ കേള്വിയ്ക്കുണ്ടാകുന്ന ഇത്തരം പ്രശ്നങ്ങളെ അതിജീവിയ്ക്കാമെന്നു് വിശദീകരിയ്ക്കുന്നുണ്ടു്. ശബ്ദത്തിന്റെ അതിന്റെ ഒച്ചക്കൂടുതല് കൊണ്ടുണ്ടാകുന്ന വിപത്തുകളെക്കുറിച്ചും വളരെ വിശദമായൊരു ലേഖനം ഇവിടെയുണ്ടു്. കേള്വി എന്നത് ഒരു കലയാണെങ്കില് അതാസ്വദിയ്ക്കാന് നമ്മുടെ കാതുകളെ സംരക്ഷിക്കേണ്ടത് അത്യാവശ്യമാണു്.
മാതൃഭൂമി ആഴ്ചപ്പതിപ്പു് ഡിസംബര് 2-8(ലക്കം 40 - പേജ് 60) ല് വന്ന "നമ്മുടെ ആയുസ്സില് ശബ്ദത്തിന്റെ സ്വാധീനം" എന്ന ജീവന് ജോബ് തോമസിന്റെ ശാസ്ത്രലേഖനവും ഇതേ വിഷയത്തിലുള്ളതാണു്.
ശബ്ദത്തെക്കുറിച്ചും നമ്മുടെ ശബ്ദസംവേദന ശേഷി വര്ദ്ധിപ്പിയ്ക്കാനും കാതുകളെ പരിശീലിപ്പിയ്ക്കാനുമുള്ള സ്വതന്ത്ര സോഫ്റ്റ്വെയറാണു് ഗ്നു സോല്ഫേജ്
സംഗീതം ഒരു മഹാസാഗരമാണെങ്കില് സംഭാഷണവും അങ്ങനെത്തന്നെ!!!
കുറിപ്പ്: എന്റെ http://santhoshtr.livejournal.com എന്ന ബ്ലോഗ് പ്ലാനറ്റ് ഫ്ലോസ് ഇന്ത്യ എന്ന സ്വതന്ത്ര സോഫ്റ്റ്വെയര് പ്രവര്ത്തകരുടെ ബ്ലോഗ് അഗ്രഗേറ്റര് സബ്സ്ക്രൈബ് ചെയ്യുന്നത് കൊണ്ട്, അതില് ഇനി ഇംഗ്ലീഷില് മാത്രമേ എഴുതുള്ളൂ.
Sunday, December 9, 2007
Subscribe to:
Post Comments (Atom)
ധ്വനിയും ശാരികയും കൂടുതല് മുന്നേറാന് ഫോസ്.ഇന് സഹായകമാകുമെന്നു് പ്രതീക്ഷിയ്ക്കുന്നു. നിയാമിന്റെ നീരീക്ഷണങ്ങളും സഹായവും ഇവയെ ഒന്നു കൂടി മെല്ലപ്പെട്ടതാക്കാന് സഹായിയ്ക്കുമെന്നു് കൂടി പ്രതീക്ഷിയ്ക്കുന്നു. ഇനിയും മുന്നോട്ടു് മുന്നോട്ടു് ...
ReplyDeleteഅവസാന വാചകമെഴുതിയപ്പോഴാണു് ഒരാശയം വന്നതു്. എടാ നമുക്കു് പണ്ടത്തെ സാക്ഷരതാ പ്രചാരണത്തിനുപയോഗിച്ചിരുന്നതു് പോലുള്ള നാടന് പാട്ടുകളെഴുതാന് പറ്റുമോ സ്വതന്ത്ര സോഫ്റ്റുവെയര് പ്രചാരണത്തിനു്?