Monday, December 11, 2006

മലയാളം ഡൊമെയിന്‍നാമങ്ങള്‍

സമ്പൂര്‍ണ്ണ കമ്പ്യൂട്ട‍ര്‍ സാക്ഷരത നമ്മുടെ ഒരു വലിയ സ്വപ്നമാണല്ലോ. ഇത് കൈവരിക്കണമെങ്കില്‍ കമ്പ്യൂട്ട‍ര്‍ ജനങ്ങളുടെ ഭാഷ സംസാരിച്ചേ മതിയാവൂ. ഈ ദിശയില്‍ പല പ്രൊജക്ടുകളും ഇപ്പൊള്‍ തന്നെ നടക്കുന്നുമുണ്ട്. ഗ്നൂ/ലിനക്സിനെ കൊണ്ട് കുറേ പേര്‍ (ഈ പാവം ഞാനുള്‍‍പ്പെടെയുള്ള, അമ്പട ഞാനേ!) മൂന്നു നാലു വര്‍ഷങ്ങള്‍ക്കുമുന്പേ മലയാളം പറയിച്ചതാണ്, അത്യാവശ്യം നല്ല രീതിയില്‍ തന്നെ. വിന്‍ഡോസും ഇപ്പോള്‍ മലയാളം സംസാരിക്കാന്‍ പഠിച്ചു വരുന്നു എന്നാണ് കേള്‍ക്കുന്നത്. രണ്ടിലും ചില പ്രശ്നങ്ങള്‍ ഇപ്പോഴുമുണ്ട്, അവ തീര്‍ക്കണം. അതുകഴിഞ്ഞാല്‍, മലയാളം കമ്പ്യൂട്ടിങ്ങില്‍ അടുത്ത പടി എന്താണ്? ഒരുപാട് കാര്യങ്ങളുണ്ട്. ഒരു മലയാളം നിഘണ്ടു, സ്പെല്‍ചെക്ക്, ഒരുപാട് ഫോണ്ടുകള്‍, സോര്‍ട്ടിംഗിലെ ചില പ്രശ്നങ്ങള്‍, ശബ്ദം മനസ്സിലാക്കുന്ന സോഫ്റ്റ്‍വെയര്‍, കയ്യഷ്ഷരം തിരിച്ചറിയല്‍, അങ്ങനെ അങ്ങനെ.......
കഴിഞ്ഞ ദിവസം നമ്മുടെ സീ-ഡാക് , ഐടി മിഷനുമായി ചേര്‍ന്ന് ഒരു ചര്‍ച്ച സംഘടിപ്പിച്ചു. മലയാളം.com, കേരളം.com തുടങ്ങി മലയാളത്തില്‍ തന്നെയുള്ള ഡൊമെയിന്‍നാമങ്ങള്‍ കണ്ടിരിക്കുമല്ലോ. ഇതുപോലെ '.in' ഡൊമെയിനിന്റെ സബ്ഡൊമയിനായി മലയാളനാമങ്ങള്‍ ഉപയോഗിക്കുന്നതിനെ കുറിച്ചായിരുന്നു ചര്‍ച്ച. '.in' ല്‍ മാത്രമേ നമുക്ക് എന്തെങ്കിലും അധികാരമുള്ളൂ, ബാക്കി ഒക്കെ അമേരിക്കയുടെ കയ്യിലാണ്, നമുക്ക് ഒന്നും ചെയ്യാന്‍ പറ്റില്ല!!!!
ഇപ്പോള്‍ തന്നെ ഉള്ള കാര്യമല്ലേ, ഇതിലിത്ര ചര്‍ച്ചചെയ്യാനെന്തിരിക്കുന്നു? ചില പ്രശ്നങ്ങളുണ്ട്. അവ പരിഹരിക്കപ്പെട്ടാലേ വെറുമൊരു കൌതുകത്തിനുമപ്പുറം ഇത് പ്രായോഗികമായി ഉപയോഗിക്കപ്പെടൂ. അതില്‍ ഒരു പ്രശ്നം സ്പൂഫിംഗ് ആണ്. ഈ പ്രശ്നം ഒന്നു നോക്കാം..

സ്പൂഫിംഗും മലയാളവും
എന്താണണീ സ്പൂഫിംഗ്? ഏറ്റവും ചുരുക്കി പറഞ്ഞാല്‍, പ്രശസ്തമായ സൈറ്റുകളോടു വളരെ അധികം സാമ്യമുള്ള (കാഴ്ചയിലോ, പേരിലോ ഒക്കെ) മറ്റൊരു സൈറ്റുണ്ടാക്കി നടത്തുന്ന തട്ടിപ്പാണ് സ്പൂഫിംഗ്. കൂടുതല്‍ കാര്യങ്ങള്‍ വിക്കിപീഡിയ പറഞ്ഞുതരും.
ഇനി, മലയാളത്തില്‍ ഇതിന് എന്താണ് ഇത്ര പ്രാധാന്യം? ഒരു ഉദാഹരണം നോക്കാം. "ഓണം.com” എന്ന ഡൊമെയിന്‍ പരിഗണിക്കുക. ഇത് എനിക്ക് രണ്ട് തരത്തില്‍ എഴുതാം... "ഓ+ണ+ം" എന്നും "ഒ+ ാ+ണ+ ം" എന്നും. വ്യത്യാസം മനസ്സിലായില്ലേ? "ഓ" എന്ന ഒറ്റ അക്ഷരമായും "ഒ", " ാ" എന്നിങ്ങനെ രണ്ട് അക്ഷരമായും ഒരേ കാര്യം എഴുതാം. കാഴ്ചയില്‍ രണ്ടും തമ്മില്‍ യാതൊരു വ്യത്യാസവുമില്ല. (ചില ഫോണ്ടൂകളില്‍ ഒരു കുത്തുകുത്തു വൃത്തം കാണും രണ്ടാമത്തതില്‍, പക്ഷേ ഇത് ഫോണ്ടിനനുസരിച്ചു മാറാം). പക്ഷേ കമ്പ്യൂട്ടറിനെ സംബന്ധിച്ചിടത്തോളം രണ്ടും വ്യത്യസ്തമാണുതാനും. താങ്കള്‍ ഓണം.com (ആദ്യത്തെ രീതിയില്‍) എന്ന ഒരു സൈറ്റ് തുടങ്ങി, പ്രശസ്തമായി എന്നിരിക്കട്ടെ‍. എനിക്ക് ഒാണം.com (രണ്ടാമത്തെ രീതിയില്‍)എന്ന പേരില്‍ മറ്റൊരു സൈറ്റും തുടങ്ങാം. എപ്പടി?
ഇത്തരത്തില്‍ പ്രശ്നമുള്ള അക്ഷരങ്ങള്‍ ഏതൊക്കെയാവാം?
1. ഓ
2. ഔ
3. ഈ
4. ഊ
5. ൈ
6. ോ
7. ൊ
8. ൌ (ഇപ്പൊഴത്തെ യൂണീകോഡനുസരിച്ച് ഔ വിന്റെ ചിഹ്നം )
9. ഐ
10. ററ ('റ്റ' എന്നത് ഏതെങ്കിലും ഫോണ്ടില്‍ ഇങ്ങനെ കൊടുക്കുമോ? ഇല്ലെങ്കില്‍ ഇതു പ്രശ്നമല്ല)
തീര്‍‍ന്നോ? ഇതുപോലുള്ള ഉദാഹരണങ്ങള്‍ അറിയാമെങ്കില്‍ അറിയിക്കുക.........................

പ്രശ്നം-2
മറ്റൊരു പ്രശ്നം നോക്കാം... കോര.com എന്ന നാമം പരിഗണിക്കുക, ഇതിനെ ക+ോ+ര എന്നും േ+ക+ാ+ര എന്നും രണ്ടുതരത്തില്‍ എഴുതാം...ഇനി, ആദ്യത്തെ ഉദാഹരണവുമായി ഇതിനെന്താ വ്യത്യാസം? ഇവിടെ പ്രശ്നമുണ്ടാക്കുന്ന രണ്ട് ഭാഗങ്ങളും ('േ' 'ാ' എന്നിവ) വരുന്നത് അടുത്തടുത്തല്ല, മറിച്ച് ഒരക്ഷരത്തിന്റെ ഇരു വശവുമായാണ്. ഒരക്ഷരം എന്നത് പൂര്‍ണ്ണ‍മായും ശരിയല്ല, കാരണം നടുക്കുള്ള അക്ഷരത്തിനു പകരം (ഇവിടെ 'കോ'-യിലെ 'ക') കൂട്ടക്ഷരങ്ങളും വരാം (ഉദാ: സ്റ്റോ)....ഒരല്പം ആശയക്കുഴപ്പം ഉണ്ടാക്കുന്നതാണ് ഈ പ്രശ്നം. പേരിന്റെ ആദ്യം മാത്രമേ ഈ പ്രശ്നം ഉണ്ടാകൂ... ആലോചിച്ചു നോക്കൂ. സംശയമുണ്ടെങ്കില്‍ ഉദാഹരണങ്ങള്‍ എഴുതി നോക്കുക, മലയാളം അക്ഷരങ്ങള്‍ മാത്രമുള്ള ഉദാഹരണങ്ങളേ‍ എടുക്കാവൂ എന്ന് മാത്രം.
മലയാളവും ആംഗലേയവും ഇടകലര്‍ന്ന് വന്നാലും, മലയാളവും അക്കങ്ങളും ഇടകലര്‍ന്ന് വന്നാല്‍ പ്രശ്നം കൂടുതല്‍ ഗുരുതരമാവും. എവിടെയൊക്കെ മലയാളം തുടങ്ങുന്നുവോ അവിടെയൊക്കെ ഈ പ്രശ്നം വരാം എന്നാവും..... മൊത്തം കൂഴക്കിയോ.... കുറേ ഉദാഹരണങ്ങള്‍ എഴുതി നോക്കുക, ആശയക്കുഴപ്പം മാറിക്കിട്ടും....

പ്രശ്നം-3
ഡൊമെയിന്‍ നാമത്തില്‍ zwj, zwnj തുടങ്ങിയ കണ്‍ട്രോള്‍ ക്യാരക്ടറുകള്‍ അനുവദനീയമല്ല. പിന്നെ നമ്മുടെ ചില്ലിനെ എന്ത് ചെയ്യും? ഒന്നുകില്‍ ചില്ലിന് കോഡ് പോയിന്റ് വേണം, എല്ലെങ്കില്‍ മേല്‍പറഞ്ഞ രണ്ടും(പോട്ടെ, ഒന്നെങ്കിലും) ഡൊമെയിന്‍ നാമത്തില്‍ അനുവദിക്കണം... മറ്റ് പോംവഴി ഒന്നുമില്ല.
ചില്ല് അല്ലാതെ മറ്റെവിടെയെങ്കിലും ഇത് പ്രശ്നമാകുമോ? ആലോചിക്കേണ്ടതാണ്.

പ്രശ്നം-4
അടുത്തപ്രശ്നം വിവിധ ഭാഷകള്‍ക്കിടയിലെ അക്ഷരങ്ങള്ക്കിടയിലെ സാമ്യമാണ്. ആംഗലേയത്തിലെ s (എസ്) ഉം നമ്മുടെ ട യും തമ്മില്‍ പരിപൂര്‍ണ്ണ സാമ്യമുണ്ട്. ഇതും ദുരുപയോഗം ചെയ്യപ്പെടാം. ഇതുപോലുള്ള മറ്റേതൊക്കെ ഉദാഹരണങ്ങളറിയാം? മലയാളവും തമിഴും തമ്മിലുള്ള സാമ്യവും നോക്കണം!!!!
കുറിപ്പുകള്‍. (.in ന് മാത്രം ബാധകം)
ക. മലയാളം അക്കങ്ങള്‍ ഡൊമെയിന്‍ നാമത്തില്‍ ഉണ്ടാവില്ല. അതുകൊണ്ട് അവയുമായുള്ള സാമ്യം പരിഗണിക്കേണ്ട
ഖ. മലയാളത്തെ ആംഗലേയമൊഴികെയുള്ള ഭാഷകളുമായി കൂട്ടിക്കലര്‍ത്തി ഡൊമെയിന്‍ നാമം നിര്‍മ്മിക്കാന്‍ അനുവദിക്കില്ല.
പ്രശ്നങ്ങള്‍ ഇനിയും ഒരുപാടുണ്ട്. അവ പിന്നീട് പറയാം... നമുക്ക് ആദ്യത്തെ രണ്ട് പ്രശ്നങ്ങള്‍ക്ക് പരിഹാരം നോക്കാം..... കൃത്യമായ പരിഹാരത്തെ കുറിച്ച് ചര്‍ച്ച ചെയ്യാന്‍ സാങ്കേതികമായ പലകാര്യങ്ങളെയും കുറിച്ച് പറയേണ്ടിയിരിക്കുന്നു. ഇപ്പോള്‍ അതു വിടാം, പ്രശ്നത്തെ ലളിതമാക്കാം. നിങ്ങള്‍ക്ക് ഒരു പേര് (സ്ട്രിംഗ്) തന്നാല്‍ അതിന് ഇത്തരം പ്രശ്നമുണ്ടോ എന്ന് കണ്ടെത്താന്‍ ഒരു അല്‍ഗോരിതം പറയാമോ? ഏറ്റവും ലളിതമാവണം, സ്പടിക വ്യക്തതയും വേണം (യാതൊരു ആശയക്കുഴപ്പവുമുണ്ടാക്കാത്തതാവണം എന്നര്‍ഥം).
ഒരല്പം സാങ്കേതികം
ലോകത്തിലെ വിവിധ ഭാഷകളില്‍ ഡൊമെയിന്‍ നെയിമുകള്‍ നല്‍കാന്‍ വേണ്ട‍ പ്രവര്‍ത്തനങ്ങള്‍ നടത്തുന്നത് ഐ.ഡി.എന്‍. എന്ന പ്രൊജക്ടാണ്. മലയാളം ഉപയോഗിക്കാന്‍ കഴിയണമെങ്കില്‍ യൂണീകോഡ് (യൂനീകോഡ്?) അനിവാര്യമാണല്ലോ? എന്നാല്‍ ഡി.എന്‍.എസ്. സേര്‍വറുകള്‍ യൂണീകോഡ് സപ്പോര്‍ട്ട് ചെയ്യുന്നില്ല. ഇതിനാല്‍ പ്യൂണീകോഡ് എന്ന സങ്കേതത്തിന്റെ സഹായത്തോടെ നമ്മുടെ യൂണീകോഡിനെ ഒരുതരം ആസ്കി ആക്കി മാറ്റുന്നു. ഈ ആസ്കിയാണ് യഥാര്‍ത്തത്തില്‍ ഡി.എന്‍.എസ്. സേര്‍വറുകള്‍ ഉപയോഗിക്കുന്നത്. കണ്‍ഫ്യൂഷനാകേണ്ട‍. കേരളം.com എന്ന സൈറ്റ് എടുത്തുനോക്കൂ. സൈറ്റ് ലോഡ് ചെയ്തശേഷം അഡ്രസ്ബാറില്‍ എന്താണ് കാണുന്നത്? അതാണ് പ്യൂണീകോഡ്. ഭാവിയില്‍ ബ്രൌസറുകള്‍ പ്യൂണീകോഡിനു പകരം ശുദ്ധമലയാളം തന്നെ അഡ്രസ്ബാറില്‍ കാണിക്കും എന്ന് പ്രതീക്ഷിക്കാം.
...................തുടരും (ഭീഷണിയാണ്!!)

12 comments:

Shiju said...

സജിത്ത് ഇതിനോട് സാമ്യമുള്ള ഒരു ചര്‍ച്ച ആണ് http://boologaclub.blogspot.com/2006/08/blog-post_115567221858952072.html ഈ ലിങ്കില്‍ നടക്കുന്നത്. സജിത്തിനെപോലെ ഈ വിഷയത്തില്‍ വിവരമുള്ളവര്‍ ഈ ചര്‍ച്ചയില്‍ തീര്‍ച്ചയായും പങ്കെടുക്കണം. കാരണം മലയാള കംപ്യൂട്ടിങ്ങിന്റെ ഭാവിയെ നിര്‍ണ്ണയിക്കുന്ന ചര്‍ച്ച ആണ് അതില്‍ നടക്കുന്നത്.

കെവിൻ & സിജി said...

സജിത്തേ, സ്വാഗതം. ബ്ലോഗിപ്പോഴാണു കാണുന്നതു്. വിശദമായ മറുപടി പിന്നാലെ വരും. ഇപ്പോള്‍ ഇത്രമാത്രം. :-)
പിന്നെ വേഡുവേരിഫിക്കേഷന്‍ വച്ചോളൂ കമന്റുപെട്ടിക്കു്.

സജിത്ത്|Sajith VK said...

ആദ്യം പറഞ്ഞ പട്ടികയില്‍ ള്ള കൂടി ചേര്‍ക്കുന്നു

ദിവാസ്വപ്നം said...

നല്ല പോസ്റ്റ്. സിബു ഇതു കണ്ടില്ലെന്ന് തോന്നുന്നു.

:)

വിചാരം said...

sajiththinum കുടുംബാംഗങ്ങള്‍ക്കും
സ്നേഹവും സന്തോഷവും
കരുണയും ദയയും
നന്മ നിറഞ്ഞ വിചാരങ്ങളും നിറഞ്ഞ
പുതുവത്സരാശംസകള്‍
നേരുന്നു

Anonymous said...

Sajith...ente puthia blog onnu nokkane....

brijviharam.blogspot.com
thanks

SunilKumar Elamkulam Muthukurussi said...

സജിത്ത്, ബാക്കിയെവിടെ? ഒരുപാട്‌ കാലമായില്ലോ തുടരും എന്നുപറഞിട്ട്‌. (മുഴുവനായിട്ടുവേണം, ഒന്നും കൂടെ പഠിക്കാന്‍)
-സു-

സജിത്ത്|Sajith VK said...

സുമില്‍,
ബാക്കി ഒരാഴ്ചക്കകെ ഇടുന്നതായിരിക്കും....
(ഇപ്പൊ, വായിക്കാനൊരാളെങ്കിലുമുണ്ടല്ലോ)....

Manesh Babu K said...

ദയവായി താങ്കളുടെ പുതിയ മലയാളം ബ്ലോഗ് URL emozhi.com -ലും കൂടി സമര്‍പ്പിക്കുക. മലയാളത്തില്‍ ബ്ലോഗുകള്‍ സേര്‍ച്ചുചെയ്യുവാനും, സബ്മിറ്റ് ചെയ്യുവാനും ഇവിടെ അവസരമുണ്ട്. ഓരോ സൃഷ്ടിയും തനത് url ഉം, keyword കളും ഉപയോഗിച്ച് ഈമൊഴിയില്‍ സബ്മിറ്റ് ചയ്യുമല്ലോ..

വിനയന്‍ said...

സജി
എനിക്ക് ഈ ലിനക്സ് അറിഞ്ഞാല്‍ കൊള്ളാമെന്നുണ്ടായിരുന്നു.ഒരു ആഗ്രഹം പറഞെന്നെ യുള്ളൂ.താങ്കളുടെ ഈ പോസ്റ്റ് കണ്ടപ്പോള്‍ മുതല്‍ തുടങ്ങിയതാണ്.

സജിത്ത്|Sajith VK said...

വിനയന്‍, ഗ്നൂ/ലിനക്സ് (അതാണ് ശരിയായ പേര്) പ്രത്യേകിച്ച് പഠിക്കാന്‍ ഒന്നുമില്ല... ഒരു ഉബുണ്ടു സീഡി കണ്ടുപിടിക്കുക..(നെറ്റീന്ന് ഡൌണ്‍ലോഡ് ചെയ്യാം)... ഇത് ഇന്‍സ്റ്റാല്‍ പോലും ചെയ്യാതെ ഉപയോഗിക്കാം...
ഉപയോഗിച്ചുനോക്കൂ...
ഇന്‍സ്റ്റാള്‍ ചെയ്തും ഉപയോഗിക്കാം....

Anonymous said...

പ്രബോധചന്ദ്രന്‍ നായരുടേയും കെ.ജി.സുലോചനയുടേയും ശിഷ്യത്വം സ്വീകരിച്ചിട്ടുണോ?

ഇന്‍ഡിക്‍ ലിസ്റ്റില്‍ ഇക്കാര്യത്തെക്കുറിച്ചു നടന്ന ചര്‍ച്ച വായിച്ചിരുന്നെങ്കില്‍ ചില്ല് എന്‍കോഡിംഗിനെക്കുറിച്ച് ഇങ്ങനെ നിരുത്തരവാദപരമായി സംസാരിക്കാനാകുമായിരുന്നില്ല