எழுத்துருவை ஒருங்குறிக்கு மாற்றுவது எப்படி - 1
பகுதி 1 | பகுதி 2 | பகுதி 3 | பகுதி 4 |
உங்களுக்கு பிடித்த அழகான தமிழ் எழுத்துரு ஒருங்குறி(Unicode) அல்லாத TAB/TAM அல்லது தனிப்பட்ட வேறு குறியேற்றங்கள் இருக்கிறதா? அதை நீங்கள் எளிய முறையில் ஒருங்குறிக்கு மாற்றியமைத்துப் பயன்படுத்த வேண்டுமா? அதற்கான வழிமுறைகளை ஆராயலாம்.
முதலில் எழுத்துரு குறித்த நுட்பங்களை விவாதிக்கும் முன்பாக இது தொடர்பான சில அடிப்படை நுட்பங்கள் பற்றி அறிந்து கொள்ளலாம்.
குறியேற்றங்கள்
கணினியில் அனைத்து வகையான உரையாடல்களும் எண்களாலேயே செய்யப்படுகின்றன என நாம் அறிவோம். அது போல எழுத்துக்களும் எண்களைக் கொண்டே குறிக்கப்படுகின்றன.
ஒரு குறியேற்றம் என்பது, மனிதரால் படித்தறியக் கூடிய எழுத்துக்களுக்கு, கணினியால் புரிந்து கொள்ளக் கூடிய வகையில் பொருத்தமான எண்களை ஒதுக்கித் தருவதே. உதாரணமாக, ஆங்கிலத்தின் 'A' என்ற எழுத்துக்கு ASCII குறியேற்ற அட்டவனைப்படி 65 என்ற எண் ஒதுக்கப்படுகிறது. ஒரு கணினியிலிருந்து இன்னொரு கணினிக்கு தகவல்களை கொண்டு செல்லும் போது இந்த குறியேற்ற அட்டவனையின்படி எழுத்துக்கள் எண்களாய் சேமிக்கப்பட்டு பின் மீண்டும் எழுத்துக்களாய் மாற்றி திரையில் காட்டப்படுகின்றது.
ASCII குறியேற்றம் எல்லா இயங்கு தளங்களிலும் முன்னரே நிறுவப்பட்டு விடுவதால் நீங்கள் ஆங்கில எழுத்துக்களை தட்டச்சிட்டு அந்தக் உரைக் கோப்பினை எந்தக் கணினியில் திறந்தாலும் பிரச்சனை இன்றி படிக்க இயலும். ஆனால் பிற குறியேற்றங்களைப் பொறுத்தவரை அந்த குறியேற்றத்தின் அட்டவனைப்படி எழுத்துருக்கள் நிறுவாத கணினிகளில் அவ்வாறு எழுத்துக்கள் மாற்றிக் காட்டப்படாமல் புரியாத எழுத்துக்களை காட்டும்.
இதை விளக்க, நடைமுறை ஒப்பீடாக 'நல்ல' என்ற தமிழ் வார்த்தையை எடுத்துக் கொள்வோம். இந்த வார்த்தைக்கு தமிழ் அறிந்த அனைவரும் பொருள் விளங்கிக் கொள்வர். அதே சமயம் 'நல்ல' என்று ஒரு தமிழ் அறியாத தெலுங்கு மொழி பேசுபவரிடம் சொன்னால் அதனை தெலுங்கிலே அவர் 'கருப்பு' என பொருள் கொள்வார். 'நல்ல' என்னும் வார்த்தை இரு மொழியிலும் இருப்பதால் பொருள் வேறாயினும் இருவரும் புரிந்து கொள்வர். ஆனால் தகவல் பரிமாற்றத்தில் குழப்பம் ஏற்படும். இருவருமே ஒரே மொழியை பேசுபவர்களாய் இருப்பின் இந்த குழப்பம் நேராது.
அது போல, கணினி தகவல் பரிமாற்றத்தில், பயனர்கள் அனைவராலும் ஒப்புக் கொள்ளப்பட்ட ஒரு குறியேற்றத்தை பயன்படுத்துவதன் மூலம் தகவல் பரிமாற்றக் குழப்பங்கள் தவிர்க்கப்படும்.
இன்றைய தமிழ்க் கணிமை உலகில் பல்வேறு குறியேற்றங்கள் பயன்பாட்டில் உள்ளன. அவற்றுள் சில:
- தாம் (TAM - Tamil Monolingual)
- தாப் (TAB - Tamil Bilingual)
- திஸ்க்கி (TSCII - Tamil Standard Code for Information Interchange)
- ஒருங்குறி (Unicode)
கணினி மயமாக்கப்பட்ட அரசு அலுவலகங்களில் பெரும்பாலும் தாம்/தாப் தகுதரம் பயன்பாட்டில் உள்ளது. அரசு சார் இணையதளங்களில் திஸ்கி பயன்படுத்தப்படுகிறது.
இது தவிர, அச்சு மற்றும் பத்திரிக்கை துறையினர் பல்வேறு தனிப்பட்ட தமிழ் குறியேற்றங்களையும் அதன் அடிப்படையில் அமைந்த எழுத்துருக்களையும் பயன்படுத்துகின்றனர்.
இந்த குறியேற்றங்களின் அட்டவனையை பார்த்தீர்களானால் ஒவ்வொரு தமிழ் எழுத்துக்கும் ஒரு எழுத்தெண் வழங்கப்படுவது தெரியும்.
படம் 1 தாம் அட்டவனை
படம் 2 தாப் அட்டவனை
படம் 3 திஸ்கி அட்டவனை
படம் 4 ஒருங்குறி தமிழ் அட்டவனை
சரி, இன்றைய இடுகையில் குறியேற்றங்கள் பற்றி அறிந்து கொண்டோம். இன்னும் சில எழுத்துரு தொடர்பான நுட்பங்களை பற்றி அடுத்த இடுகையில் அறிவோம்.
பகுதி 1 | பகுதி 2 | பகுதி 3 | பகுதி 4 |
3 கருத்து(க்கள்):
உண்மையிலேயே மிக அற்புதமான மற்றும் மிகவும் தேவையானப்பதிவு
பல தமிழுருக்களால் நான் மிகவும் பாதிக்கப்பட்டுள்ளேன்.. நான் முழுக்க யூனிகோடு பழக்கமுள்ளவன்...
தயவுசெய்து உடன் அடுத்த பதிவை போடவும்
கடைசியில் உள்ள சுட்டி
http://higopi.blogspot.com/2008/08/2.html
என்ற பக்கத்தை காட்டுகிறது
ஆனால் அதை சுட்டினால்
http://blog.higopi.com/2008/08/2.html
வராமல்
http://blog.higopi.com/index.html தான் வருகிறது.
ஏதோ குழப்பம் உள்ளது
நீங்கள் FTP பதிப்பு உபயோகிக்கிறீர்களா :) :)
கூடுதுறை,
நன்றி.
புருனோ,
ஆம். சில நாட்களுக்கு முன் தான் ப்ளாக்கரில் இருந்து FTP பதிப்புக்கு மாறினேன். சுட்டிகளை இப்போது சரியான முகவரிக்கு மாற்றி விட்டேன்
நீங்க சொல்லுங்க