സമ്പൂര്ണ്ണ കമ്പ്യൂട്ടര് സാക്ഷരത നമ്മുടെ ഒരു വലിയ സ്വപ്നമാണല്ലോ. ഇത് കൈവരിക്കണമെങ്കില് കമ്പ്യൂട്ടര് ജനങ്ങളുടെ ഭാഷ സംസാരിച്ചേ മതിയാവൂ. ഈ ദിശയില് പല പ്രൊജക്ടുകളും ഇപ്പൊള് തന്നെ നടക്കുന്നുമുണ്ട്. ഗ്നൂ/ലിനക്സിനെ കൊണ്ട് കുറേ പേര് (ഈ പാവം ഞാനുള്പ്പെടെയുള്ള, അമ്പട ഞാനേ!) മൂന്നു നാലു വര്ഷങ്ങള്ക്കുമുന്പേ മലയാളം പറയിച്ചതാണ്, അത്യാവശ്യം നല്ല രീതിയില് തന്നെ. വിന്ഡോസും ഇപ്പോള് മലയാളം സംസാരിക്കാന് പഠിച്ചു വരുന്നു എന്നാണ് കേള്ക്കുന്നത്. രണ്ടിലും ചില പ്രശ്നങ്ങള് ഇപ്പോഴുമുണ്ട്, അവ തീര്ക്കണം. അതുകഴിഞ്ഞാല്, മലയാളം കമ്പ്യൂട്ടിങ്ങില് അടുത്ത പടി എന്താണ്? ഒരുപാട് കാര്യങ്ങളുണ്ട്. ഒരു മലയാളം നിഘണ്ടു, സ്പെല്ചെക്ക്, ഒരുപാട് ഫോണ്ടുകള്, സോര്ട്ടിംഗിലെ ചില പ്രശ്നങ്ങള്, ശബ്ദം മനസ്സിലാക്കുന്ന സോഫ്റ്റ്വെയര്, കയ്യഷ്ഷരം തിരിച്ചറിയല്, അങ്ങനെ അങ്ങനെ.......
കഴിഞ്ഞ ദിവസം നമ്മുടെ സീ-ഡാക് , ഐടി മിഷനുമായി ചേര്ന്ന് ഒരു ചര്ച്ച സംഘടിപ്പിച്ചു. മലയാളം.com, കേരളം.com തുടങ്ങി മലയാളത്തില് തന്നെയുള്ള ഡൊമെയിന്നാമങ്ങള് കണ്ടിരിക്കുമല്ലോ. ഇതുപോലെ '.in' ഡൊമെയിനിന്റെ സബ്ഡൊമയിനായി മലയാളനാമങ്ങള് ഉപയോഗിക്കുന്നതിനെ കുറിച്ചായിരുന്നു ചര്ച്ച. '.in' ല് മാത്രമേ നമുക്ക് എന്തെങ്കിലും അധികാരമുള്ളൂ, ബാക്കി ഒക്കെ അമേരിക്കയുടെ കയ്യിലാണ്, നമുക്ക് ഒന്നും ചെയ്യാന് പറ്റില്ല!!!!
ഇപ്പോള് തന്നെ ഉള്ള കാര്യമല്ലേ, ഇതിലിത്ര ചര്ച്ചചെയ്യാനെന്തിരിക്കുന്നു? ചില പ്രശ്നങ്ങളുണ്ട്. അവ പരിഹരിക്കപ്പെട്ടാലേ വെറുമൊരു കൌതുകത്തിനുമപ്പുറം ഇത് പ്രായോഗികമായി ഉപയോഗിക്കപ്പെടൂ. അതില് ഒരു പ്രശ്നം സ്പൂഫിംഗ് ആണ്. ഈ പ്രശ്നം ഒന്നു നോക്കാം..
സ്പൂഫിംഗും മലയാളവും
എന്താണണീ സ്പൂഫിംഗ്? ഏറ്റവും ചുരുക്കി പറഞ്ഞാല്, പ്രശസ്തമായ സൈറ്റുകളോടു വളരെ അധികം സാമ്യമുള്ള (കാഴ്ചയിലോ, പേരിലോ ഒക്കെ) മറ്റൊരു സൈറ്റുണ്ടാക്കി നടത്തുന്ന തട്ടിപ്പാണ് സ്പൂഫിംഗ്. കൂടുതല് കാര്യങ്ങള് വിക്കിപീഡിയ പറഞ്ഞുതരും.
ഇനി, മലയാളത്തില് ഇതിന് എന്താണ് ഇത്ര പ്രാധാന്യം? ഒരു ഉദാഹരണം നോക്കാം. "ഓണം.com” എന്ന ഡൊമെയിന് പരിഗണിക്കുക. ഇത് എനിക്ക് രണ്ട് തരത്തില് എഴുതാം... "ഓ+ണ+ം" എന്നും "ഒ+ ാ+ണ+ ം" എന്നും. വ്യത്യാസം മനസ്സിലായില്ലേ? "ഓ" എന്ന ഒറ്റ അക്ഷരമായും "ഒ", " ാ" എന്നിങ്ങനെ രണ്ട് അക്ഷരമായും ഒരേ കാര്യം എഴുതാം. കാഴ്ചയില് രണ്ടും തമ്മില് യാതൊരു വ്യത്യാസവുമില്ല. (ചില ഫോണ്ടൂകളില് ഒരു കുത്തുകുത്തു വൃത്തം കാണും രണ്ടാമത്തതില്, പക്ഷേ ഇത് ഫോണ്ടിനനുസരിച്ചു മാറാം). പക്ഷേ കമ്പ്യൂട്ടറിനെ സംബന്ധിച്ചിടത്തോളം രണ്ടും വ്യത്യസ്തമാണുതാനും. താങ്കള് ഓണം.com (ആദ്യത്തെ രീതിയില്) എന്ന ഒരു സൈറ്റ് തുടങ്ങി, പ്രശസ്തമായി എന്നിരിക്കട്ടെ. എനിക്ക് ഒാണം.com (രണ്ടാമത്തെ രീതിയില്)എന്ന പേരില് മറ്റൊരു സൈറ്റും തുടങ്ങാം. എപ്പടി?
ഇത്തരത്തില് പ്രശ്നമുള്ള അക്ഷരങ്ങള് ഏതൊക്കെയാവാം?
1. ഓ
2. ഔ
3. ഈ
4. ഊ
5. ൈ
6. ോ
7. ൊ
8. ൌ (ഇപ്പൊഴത്തെ യൂണീകോഡനുസരിച്ച് ഔ വിന്റെ ചിഹ്നം )
9. ഐ
10. ററ ('റ്റ' എന്നത് ഏതെങ്കിലും ഫോണ്ടില് ഇങ്ങനെ കൊടുക്കുമോ? ഇല്ലെങ്കില് ഇതു പ്രശ്നമല്ല)
തീര്ന്നോ? ഇതുപോലുള്ള ഉദാഹരണങ്ങള് അറിയാമെങ്കില് അറിയിക്കുക.........................
പ്രശ്നം-2
മറ്റൊരു പ്രശ്നം നോക്കാം... കോര.com എന്ന നാമം പരിഗണിക്കുക, ഇതിനെ ക+ോ+ര എന്നും േ+ക+ാ+ര എന്നും രണ്ടുതരത്തില് എഴുതാം...ഇനി, ആദ്യത്തെ ഉദാഹരണവുമായി ഇതിനെന്താ വ്യത്യാസം? ഇവിടെ പ്രശ്നമുണ്ടാക്കുന്ന രണ്ട് ഭാഗങ്ങളും ('േ' 'ാ' എന്നിവ) വരുന്നത് അടുത്തടുത്തല്ല, മറിച്ച് ഒരക്ഷരത്തിന്റെ ഇരു വശവുമായാണ്. ഒരക്ഷരം എന്നത് പൂര്ണ്ണമായും ശരിയല്ല, കാരണം നടുക്കുള്ള അക്ഷരത്തിനു പകരം (ഇവിടെ 'കോ'-യിലെ 'ക') കൂട്ടക്ഷരങ്ങളും വരാം (ഉദാ: സ്റ്റോ)....ഒരല്പം ആശയക്കുഴപ്പം ഉണ്ടാക്കുന്നതാണ് ഈ പ്രശ്നം. പേരിന്റെ ആദ്യം മാത്രമേ ഈ പ്രശ്നം ഉണ്ടാകൂ... ആലോചിച്ചു നോക്കൂ. സംശയമുണ്ടെങ്കില് ഉദാഹരണങ്ങള് എഴുതി നോക്കുക, മലയാളം അക്ഷരങ്ങള് മാത്രമുള്ള ഉദാഹരണങ്ങളേ എടുക്കാവൂ എന്ന് മാത്രം.
മലയാളവും ആംഗലേയവും ഇടകലര്ന്ന് വന്നാലും, മലയാളവും അക്കങ്ങളും ഇടകലര്ന്ന് വന്നാല് പ്രശ്നം കൂടുതല് ഗുരുതരമാവും. എവിടെയൊക്കെ മലയാളം തുടങ്ങുന്നുവോ അവിടെയൊക്കെ ഈ പ്രശ്നം വരാം എന്നാവും..... മൊത്തം കൂഴക്കിയോ.... കുറേ ഉദാഹരണങ്ങള് എഴുതി നോക്കുക, ആശയക്കുഴപ്പം മാറിക്കിട്ടും....
പ്രശ്നം-3
ഡൊമെയിന് നാമത്തില് zwj, zwnj തുടങ്ങിയ കണ്ട്രോള് ക്യാരക്ടറുകള് അനുവദനീയമല്ല. പിന്നെ നമ്മുടെ ചില്ലിനെ എന്ത് ചെയ്യും? ഒന്നുകില് ചില്ലിന് കോഡ് പോയിന്റ് വേണം, എല്ലെങ്കില് മേല്പറഞ്ഞ രണ്ടും(പോട്ടെ, ഒന്നെങ്കിലും) ഡൊമെയിന് നാമത്തില് അനുവദിക്കണം... മറ്റ് പോംവഴി ഒന്നുമില്ല.
ചില്ല് അല്ലാതെ മറ്റെവിടെയെങ്കിലും ഇത് പ്രശ്നമാകുമോ? ആലോചിക്കേണ്ടതാണ്.
പ്രശ്നം-4
അടുത്തപ്രശ്നം വിവിധ ഭാഷകള്ക്കിടയിലെ അക്ഷരങ്ങള്ക്കിടയിലെ സാമ്യമാണ്. ആംഗലേയത്തിലെ s (എസ്) ഉം നമ്മുടെ ട യും തമ്മില് പരിപൂര്ണ്ണ സാമ്യമുണ്ട്. ഇതും ദുരുപയോഗം ചെയ്യപ്പെടാം. ഇതുപോലുള്ള മറ്റേതൊക്കെ ഉദാഹരണങ്ങളറിയാം? മലയാളവും തമിഴും തമ്മിലുള്ള സാമ്യവും നോക്കണം!!!!
കുറിപ്പുകള്. (.in ന് മാത്രം ബാധകം)
ക. മലയാളം അക്കങ്ങള് ഡൊമെയിന് നാമത്തില് ഉണ്ടാവില്ല. അതുകൊണ്ട് അവയുമായുള്ള സാമ്യം പരിഗണിക്കേണ്ട
ഖ. മലയാളത്തെ ആംഗലേയമൊഴികെയുള്ള ഭാഷകളുമായി കൂട്ടിക്കലര്ത്തി ഡൊമെയിന് നാമം നിര്മ്മിക്കാന് അനുവദിക്കില്ല.
പ്രശ്നങ്ങള് ഇനിയും ഒരുപാടുണ്ട്. അവ പിന്നീട് പറയാം... നമുക്ക് ആദ്യത്തെ രണ്ട് പ്രശ്നങ്ങള്ക്ക് പരിഹാരം നോക്കാം..... കൃത്യമായ പരിഹാരത്തെ കുറിച്ച് ചര്ച്ച ചെയ്യാന് സാങ്കേതികമായ പലകാര്യങ്ങളെയും കുറിച്ച് പറയേണ്ടിയിരിക്കുന്നു. ഇപ്പോള് അതു വിടാം, പ്രശ്നത്തെ ലളിതമാക്കാം. നിങ്ങള്ക്ക് ഒരു പേര് (സ്ട്രിംഗ്) തന്നാല് അതിന് ഇത്തരം പ്രശ്നമുണ്ടോ എന്ന് കണ്ടെത്താന് ഒരു അല്ഗോരിതം പറയാമോ? ഏറ്റവും ലളിതമാവണം, സ്പടിക വ്യക്തതയും വേണം (യാതൊരു ആശയക്കുഴപ്പവുമുണ്ടാക്കാത്തതാവണം എന്നര്ഥം).
ഒരല്പം സാങ്കേതികം
ലോകത്തിലെ വിവിധ ഭാഷകളില് ഡൊമെയിന് നെയിമുകള് നല്കാന് വേണ്ട പ്രവര്ത്തനങ്ങള് നടത്തുന്നത് ഐ.ഡി.എന്. എന്ന പ്രൊജക്ടാണ്. മലയാളം ഉപയോഗിക്കാന് കഴിയണമെങ്കില് യൂണീകോഡ് (യൂനീകോഡ്?) അനിവാര്യമാണല്ലോ? എന്നാല് ഡി.എന്.എസ്. സേര്വറുകള് യൂണീകോഡ് സപ്പോര്ട്ട് ചെയ്യുന്നില്ല. ഇതിനാല് പ്യൂണീകോഡ് എന്ന സങ്കേതത്തിന്റെ സഹായത്തോടെ നമ്മുടെ യൂണീകോഡിനെ ഒരുതരം ആസ്കി ആക്കി മാറ്റുന്നു. ഈ ആസ്കിയാണ് യഥാര്ത്തത്തില് ഡി.എന്.എസ്. സേര്വറുകള് ഉപയോഗിക്കുന്നത്. കണ്ഫ്യൂഷനാകേണ്ട. കേരളം.com എന്ന സൈറ്റ് എടുത്തുനോക്കൂ. സൈറ്റ് ലോഡ് ചെയ്തശേഷം അഡ്രസ്ബാറില് എന്താണ് കാണുന്നത്? അതാണ് പ്യൂണീകോഡ്. ഭാവിയില് ബ്രൌസറുകള് പ്യൂണീകോഡിനു പകരം ശുദ്ധമലയാളം തന്നെ അഡ്രസ്ബാറില് കാണിക്കും എന്ന് പ്രതീക്ഷിക്കാം.
...................തുടരും (ഭീഷണിയാണ്!!)
Monday, December 11, 2006
Saturday, December 09, 2006
ശാസ്ത്രഗതി മാസിക ഇന്റര്നെറ്റില്
കേരള ശാസ്ത്രസാഹിത്യ പരിഷത്ത് പുറത്തിറക്കുന്ന ശാസ്ത്രഗതി മാസിക ഇപ്പോള് വെബില് ലഭ്യമാണ്. kssp.org.in എന്ന വെബ് സൈറ്റില് pdf ഫോര്മാറ്റില് ആണ് ഇത് ലഭിക്കുക. നവംബര്, ഡിസംബര് മാസങ്ങളിലെ മാസികകള് ഇപ്പോള് അവിടെ ഉണ്ട്. പൂര്ണ്ണമായ വിലാസം:
http://www.kssp.org.in/rubrique.php3?id_rubrique=43
http://www.kssp.org.in/rubrique.php3?id_rubrique=43
Wednesday, December 06, 2006
മലയാളം ബ്ളോഗുകള്
വെറുതെ ഇരുന്നു ബോറടിച്ചപ്പോള്, ഇന്റര്നെറ്റില് മലയാളം എന്ന് മലയാളത്തില് തന്നെ ഒന്ന് സേര്ച്ച് ചെയ്തുനോക്കി. അതെന്നെ എത്തിച്ചത് മലയാളം ബ്ളോഗുകളുടെ ലോകത്താണ്. ഒന്നും രണ്ടുമല്ല, അക്ഷരാര്ഥത്തില് തന്നെ നിരവധി ബ്ളോഗുകള്. സാഹിത്യ ഭംഗിയുള്ള, അക്ഷരത്തെറ്റുകളില്ലാത്ത നല്ല മലയാളം... (ഇതു രണ്ടുമില്ലാത്തത് എന്റെ ബ്ളോഗിലാണ്)
കഥകളും നുറുങ്ങുകളുമെല്ലാം ഉണ്ട് ആ ലോകത്തില്. എന്നെ ഏറ്റവും സന്തോഷിപ്പിച്ചത് ബ്ളോഗ് ചെയ്യുന്നവര്ക്കിടയിലെ നെറ്റ്വര്ക്ക് ആണ്.. നല്ല ഒരു സാമൂഹ്യക്കൂട്ടായ്മ അവിടെ നിലവിലുണ്ട്.
അങ്ങനെയാണ് മലയാളത്തില് എന്തെങ്കിലും എഴുതണം എന്ന തോന്നല് എനിക്കുണ്ടായത്. മറ്റൊന്നും എഴുതാന് തോന്നാത്തതിനാല് ഇതു തന്നെ എഴുതാം എന്നു കരുതി.....
കുറിപ്പ് : പിന്നെ ഇവിടെ അക്ഷരതെറ്റുകള് ഒരുപാട് കാണുന്നുവെങ്കില് അത് റെന്ററിലെ പ്രശ്നങ്ങളാണ്. ഞാന് ഗ്നൂ-ലിനക്സ് ആണ് ഉപയോഗിക്കുന്നത്. വിന്ഡോസുകാര് അല്പം വ്യത്യസ്തമായായിരിക്കും ഇത് കാണുന്നത്. കഴിയുന്നതും വിന്ഡോസുകാര്ക്ക് വായിക്കാന് പറ്റുന്നതരത്തിലാണ് ഇപ്പോള് എഴുതുന്നത്.
ആരെങ്കുലും ഈ പേജ് വിന്ഡോസില് കാണുന്നതിന്റെ ഒരു സ്ക്രീന്ഷോട്ട് എടുത്ത് എനിക്ക് അയച്ചു തരുമോ?
കഥകളും നുറുങ്ങുകളുമെല്ലാം ഉണ്ട് ആ ലോകത്തില്. എന്നെ ഏറ്റവും സന്തോഷിപ്പിച്ചത് ബ്ളോഗ് ചെയ്യുന്നവര്ക്കിടയിലെ നെറ്റ്വര്ക്ക് ആണ്.. നല്ല ഒരു സാമൂഹ്യക്കൂട്ടായ്മ അവിടെ നിലവിലുണ്ട്.
അങ്ങനെയാണ് മലയാളത്തില് എന്തെങ്കിലും എഴുതണം എന്ന തോന്നല് എനിക്കുണ്ടായത്. മറ്റൊന്നും എഴുതാന് തോന്നാത്തതിനാല് ഇതു തന്നെ എഴുതാം എന്നു കരുതി.....
കുറിപ്പ് : പിന്നെ ഇവിടെ അക്ഷരതെറ്റുകള് ഒരുപാട് കാണുന്നുവെങ്കില് അത് റെന്ററിലെ പ്രശ്നങ്ങളാണ്. ഞാന് ഗ്നൂ-ലിനക്സ് ആണ് ഉപയോഗിക്കുന്നത്. വിന്ഡോസുകാര് അല്പം വ്യത്യസ്തമായായിരിക്കും ഇത് കാണുന്നത്. കഴിയുന്നതും വിന്ഡോസുകാര്ക്ക് വായിക്കാന് പറ്റുന്നതരത്തിലാണ് ഇപ്പോള് എഴുതുന്നത്.
ആരെങ്കുലും ഈ പേജ് വിന്ഡോസില് കാണുന്നതിന്റെ ഒരു സ്ക്രീന്ഷോട്ട് എടുത്ത് എനിക്ക് അയച്ചു തരുമോ?
Subscribe to:
Posts (Atom)