எழுத்துருவை ஒருங்குறிக்கு மாற்றுவது எப்படி - 3
Google Buzz Logo

பகுதி 1பகுதி 2
பகுதி 3பகுதி 4

சென்ற இடுகையில் எழுத்துரு குறித்த நுட்பங்களையும் எழுத்துரு உருவாக்கப்
பயன்படும் மென்பொருள் கருவிகளைப் பற்றியும் பார்த்தோம். அவற்றுள் நாம் பயன்படுத்த தேர்ந்தெடுத்துள்ள ஃபாண்ட் ஃபோர்ஜ் நிறுவுதல் குறித்து இந்த இடுகையில் பார்ப்போம்.

ஃபாண்ட் ஃபோர்ஜ் ஒரு லினக்ஸ் அடிப்படையிலான மென்பொருள். இதனை லினக்ஸ் கணினிகளில் நிறுவ, கீழ்க்கண்ட சுட்டியில் இருந்து RPM கோப்பினை தரவிறக்கம் செய்து நிறுவிக் கொள்ளலாம். உங்கள் இயங்குதளம் உபுண்டு அடிப்படையிலானது எனில், Alien எனும் மென்பொருள் கருவி மூலமாக இந்த RPM கோப்பினை DEB கோப்பாக மாற்றி நிறுவிக் கொள்ளலாம். பதிவிறக்க சுட்டி: http://fontforge.sourceforge.net/


நாங்கள் எல்லாம் விண்டோஸ் பயனாளிகள். இந்த ஃபாண்ட் ஃபோர்ஜ் மென்பொருளை நிறுவிப் பயன்படுத்த எங்களுக்கெல்லாம் வழியே இல்லையா எனக் கேட்கிறீர்களா? வழி இருக்கிறது. CygWin என்று சொல்லக் கூடிய இலவச லினக்ஸ் எமுலேட்டர் மென்பொருளை உங்கள் விண்டோஸ் கணினியில் நிறுவி அதன் மூலம் ஃபாண்ட் ஃபோர்ஜ் மென்பொருளை நிறுவிக் கொள்ளலாம்.

அதற்கெல்லாம் எங்களுக்கு பொறுமையில்லை. விண்டோஸ் கணினியில் தரவிறக்கி எடுத்தவுடன் பயன்படுத்தும் படி எங்களுக்கு நிறுவித் தர இயலுமா என்றால், உங்களுக்கு எளிய வகையில் எல்லாமே ஆயத்த நிலையில் தரவிறக்கம் செய்ய வசதியாய் எனது தளத்தில் ஒரு கோப்பாக பதிவேற்றி வைத்துள்ளேன்.

முதலில் FontForge.7z (~ 45 MB) என்ற சுட்டியை சொடுக்கி 7-Zip கோப்பினை தரவிறக்கம் செய்து கொள்ளுங்கள். இந்த 7-Zip கோப்பினை திறக்க 7-Zip மென்பொருள் வேண்டும். அதை http://www.7-zip.org/ என்ற சுட்டியில் சொடுக்கி தரவிறக்கம் செய்து உங்கள் கணினியில் நிறுவிக் கொள்ளுங்கள்.

இப்போது 7-Zip மூலம் மேலே தரவிறக்கம் செய்த FontForge.7z கோப்பினை திறந்து உங்கள் கணினியின் வண்தகட்டில் உங்களுக்கு தேவையான இடத்தில் நிறுவிக் கொள்ளுங்கள்.

Windows Explorer மூலம் ஃபாண்ட் ஃபோர்ஜ் நிறுவிய இடத்துக்கு சென்றால் Xterm.bat என்றொரு கோப்பு இருக்கும். அதை இருமுறை சொடுக்குங்கள். உங்கள் விண்டோஸ் டாஸ்க் பாரில் கீழ்கண்டவாறு ஒரு X குறி தெரியும். மேலும் ஒரு XTerm சாளரம் திறந்து இருக்கும்.


இந்த XTerm சாளரத்தில் /usr/local/bin/fontforge.exe என்று தட்டச்சிட்டு Enter விசையை அழுத்துங்கள். கீழ் கண்டவாறு ஃபாண்ட் ஃபோர்ஜ் சாளரம் திறக்கும். (நீங்கள் மாற்ற வேண்டிய எழுத்துருக் கோப்பினை XTerm சாளரத்தில் fontforge.exe க்கு அடுத்ததாக கொடுத்தால் அந்த எழுத்துரு ஃபாண்ட் ஃபோர்ஜ் திறந்தவுடன் தெரியும் அல்லது நீங்கள் File -> Open என்ற பட்டி மூலமாகவும் உங்கள் எழுத்துருவை திறக்கலாம்).

இன்றைய இடுகையில் நாம் ஃபாண்ட் ஃபோர்ஜ் நிறுவுதல், பின் அதன் மூலம் ஒரு எழுத்துருவை திறப்பது எப்படி என அறிந்து கொண்டோம். அடுத்த இடுகையில் அந்த எழுத்துருவை எவ்வாறு ஒருங்குறிக்கு மாற்றுவது எனத் தெரிந்து கொள்வோம்.

பகுதி 1பகுதி 2
பகுதி 3பகுதி 4

எழுத்துருவை ஒருங்குறிக்கு மாற்றுவது எப்படி - 2
Google Buzz Logo

பகுதி 1பகுதி 2பகுதி 3பகுதி 4

சென்ற இடுகையில் பல்வேறு தமிழ் குறியேற்றங்கள் குறித்துப் பார்த்தோம் இனி எழுத்துருக்கள் குறித்துப் பார்ப்போம்.

எழுத்துருக்கள்

எழுத்துருக்கள் என்பன ஒரு எழுத்து எந்த வடிவத்தில் காட்சியளிக்க வேண்டும், ஒரு எழுத்துடன் இன்னொரு எழுத்தை சேர்த்தால் எவ்வாறு மாற்றமடையவேண்டும் (உ.ம்: உயிர்+மெய்=உயிர்மெய்) என்பன போன்ற சில விவரங்களை அடக்கிய ஒரு கோப்பு ஆகும். எழுத்துருக்கள் அனைத்துமே ஏதேனும் ஒரு குறியேற்றத்தின் அடிப்படையில் உருவாக்கப்படுகின்றன.

எழுத்து வடிவம் (Glyph)

ஒரு எழுத்து எத்தகைய வடிவத்தை பெறும் என்பதை குறிப்பிடுவதே எழுத்து வடிவம் (Glyph) எனப்படும். உதாரணமாக, ‘அ’ என்ற எழுத்தை கீழ்க்கண்டவாறு பல வித வடிவங்களில் குறிக்கலாம்:
எழுத்து இட அமைப்பு (GPOS - Glyph Positioning)

ஒரு எழுத்து மற்றொரு எழுத்தோடு சேரும் போது எந்த இடத்தில்(புள்ளியில்) இரண்டையும் சேர்க்க வேண்டும் என்ற விதியே எழுத்து இட அமைப்பு (GPOS - Glyph Positioning) எனப்படும். உதாரணமாக மெய்யெழுத்து ‘க’ உடன் உயிர் எழுத்தொலி ‘ஈ’ சேரும்போது கீ என்பது உருவாகிறது, இதில் ஈ ஒலிப்புக்குறிய சுழியானது 'க' என்ற எழுத்தின் மேல் எங்கு அமையவேண்டும் என்ற விதியே GPOS ஆகும்.

க +ீ = கீ

எழுத்து மாற்றமைப்பு (GSUB - Glyph Substitution)

ஒரு எழுத்து மற்றொரு எழுத்தோடு சேரும் போது முற்றிலும் புதிய வேறொரு எழுத்தாக மாற வேண்டும் என்ற விதியே எழுத்து மாற்றமைப்பு (GSUB - Glyph Substitution) எனப்படும். உதாரணமாக ‘ஸ்’ என்ற எழுத்துடன் ‘ரீ’ என்ற எழுத்து இணையும் போது அது முற்றிலும் புதிய ‘ஸ்ரீ’ என்ற எழுத்தாக அமைய வேண்டும். இந்த விதிதான் GSUB என்பது.

ஸ் + ரீ = ஸ்ரீ

இவ்வாறு ஒரு எழுத்துருவானது எழுத்து வடிவம், எழுத்து இட அமைப்பு விதிகள் மற்றும் எழுத்து மாற்றமைப்பு விதிகள் ஆகியவை அடங்கியதாக உள்ளது. ஒரு எழுத்துருவை புதிதாக உருவாக்கவோ அல்லது ஒரு குறியேற்றத்திலிருந்து மற்றொரு குறியேற்றத்துக்கு மாற்றவோ செய்யும்போது நாம் மேற்கண்ட இம் மூன்று நுட்பங்களை கருத்தில் கொள்ள வேண்டும்.

எழுத்துரு வகைகள்

எழுத்துருக்கள் அவற்றை வடிவமைத்த நிறுவனங்கள்/தன்னார்வலர்கள் மற்றும் அவற்றில் பயன்படுத்தப்படும் தொழில்நுட்பம் ஆகியவற்றின் அடிப்படையில் பல வகைகளாக வழங்கப்படுகின்றன. அவற்றுள் சில:
  • TrueType fonts
  • OpenType fonts
  • POSTSCRIPT fonts
  • Bitmapped (bdf, FON, NFNT) fonts
இவற்றுள் பரவலாகப் பயன்படுத்தப்படுவது TrueType மற்றும் OpenType எழுத்துருக்கள் ஆகும். பெரும்பாலான தமிழ் எழுத்துருக்கள் TrueType வடிவில் தான் வழங்கப்படுகின்றன

எழுத்துரு உருவாக்கப் பயன்படும் மென்பொருள்கள்

எழுத்துருக்களை உருவாக்க மற்றும் மாற்றியமைக்க தேவையான மென்பொருள் கருவிகள் பற்றி விவாதிப்போம். இன்றைய கணினி உலகில் கிடைக்கும் எழுத்துரு உருவாக்கும் மென்பொருட்கள் சில:

1) மைக்ரோசாஃப்ட் வோல்ட் (Microsoft VOLT)

இது மைக்ரோசாப்ட் நிறுவனம் இலவசமாய் அளிக்கும் ஒரு மென்பொருள். இலவசம் எனினும் இது கட்டற்ற (Free) தன்மையுடையதோ அல்லது திறவூற்று (Open Source) மென்பொருளோ அல்ல. இந்த மென்பொருளை கீழ்க்கண்ட சுட்டியில் தரவிறக்கம் செய்து கொள்ளலாம்.

http://groups.msn.com/MicrosoftVOLTuserscommunity/homepage.msnw

2) ஃபாண்ட் க்ரியேட்டர் (Font Creator)

இது ஹை-லாஜிக் என்ற நிறுவனம் வழங்கும் வணிக மென்பொருள். 30 நாட்கள் வரை இந்த மென்பொருளைப் இலவசமாக பயன்படுத்திப் பார்க்க முடியும். இது ஒரு தனியுரிமை மென்பொருள். கட்டற்ற (Free) தன்மையுடையதோ அல்லது திறவூற்று (Open Source) மென்பொருளோ அல்ல. இந்த மென்பொருளை கீழ்க்கண்ட சுட்டியில் தரவிறக்கம் செய்து கொள்ளலாம்.

http://www.high-logic.com/download.html

3) ஃபாண்ட் ஃபோர்ஜ் (FontForge)

இது இலவசமாக கிடைக்கும் ஒரு கட்டற்ற (Free) திறவூற்று (Open Source) மென்பொருள். நம்முடைய எழுத்துரு உருவாக்கும்/ஒருங்குறிக்கு மாற்றும் பணிக்கு இந்த மென்பொருள் போதுமானதும் பொறுத்தமானதும் ஆகும். இந்த மென்பொருளை கீழ்க்கண்ட சுட்டியில் தரவிறக்கம் செய்து கொள்ளலாம்.

http://fontforge.sourceforge.net/

இந்த ஃபாண்ட் ஃபோர்ஜ் (FontForge) மென்பொருளை நிறுவுவது எப்படி, இதற்குத் தேவையான இயங்குதளம் முதலானவை பற்றியும், ஃபாண்ட் ஃபோர்ஜ் (FontForge) மென்பொருளைப் பயன்படுத்தி எவ்வாறு ஒரு எழுத்துருவை ஒருங்குறிக்கு மாற்றலாம் என்பதை பற்றியும் அடுத்த இடுகையில் அறியலாம்.

பகுதி 1பகுதி 2பகுதி 3பகுதி 4

எழுத்துருவை ஒருங்குறிக்கு மாற்றுவது எப்படி - 1
Google Buzz Logo

பகுதி 1
பகுதி 2
பகுதி 3
பகுதி 4


உங்களுக்கு பிடித்த அழகான தமிழ் எழுத்துரு ஒருங்குறி(Unicode) அல்லாத TAB/TAM அல்லது தனிப்பட்ட வேறு குறியேற்றங்கள் இருக்கிறதா? அதை நீங்கள் எளிய முறையில் ஒருங்குறிக்கு மாற்றியமைத்துப் பயன்படுத்த வேண்டுமா? அதற்கான வழிமுறைகளை ஆராயலாம்.

முதலில் எழுத்துரு குறித்த நுட்பங்களை விவாதிக்கும் முன்பாக இது தொடர்பான சில அடிப்படை நுட்பங்கள் பற்றி அறிந்து கொள்ளலாம்.

குறியேற்றங்கள்

கணினியில் அனைத்து வகையான உரையாடல்களும் எண்களாலேயே செய்யப்படுகின்றன என நாம் அறிவோம். அது போல எழுத்துக்களும் எண்களைக் கொண்டே குறிக்கப்படுகின்றன.

ஒரு குறியேற்றம் என்பது, மனிதரால் படித்தறியக் கூடிய எழுத்துக்களுக்கு, கணினியால் புரிந்து கொள்ளக் கூடிய வகையில் பொருத்தமான எண்களை ஒதுக்கித் தருவதே. உதாரணமாக, ஆங்கிலத்தின் 'A' என்ற எழுத்துக்கு ASCII குறியேற்ற அட்டவனைப்படி 65 என்ற எண் ஒதுக்கப்படுகிறது. ஒரு கணினியிலிருந்து இன்னொரு கணினிக்கு தகவல்களை கொண்டு செல்லும் போது இந்த குறியேற்ற அட்டவனையின்படி எழுத்துக்கள் எண்களாய் சேமிக்கப்பட்டு பின் மீண்டும் எழுத்துக்களாய் மாற்றி திரையில் காட்டப்படுகின்றது.

ASCII குறியேற்றம் எல்லா இயங்கு தளங்களிலும் முன்னரே நிறுவப்பட்டு விடுவதால் நீங்கள் ஆங்கில எழுத்துக்களை தட்டச்சிட்டு அந்தக் உரைக் கோப்பினை எந்தக் கணினியில் திறந்தாலும் பிரச்சனை இன்றி படிக்க இயலும். ஆனால் பிற குறியேற்றங்களைப் பொறுத்தவரை அந்த குறியேற்றத்தின் அட்டவனைப்படி எழுத்துருக்கள் நிறுவாத கணினிகளில் அவ்வாறு எழுத்துக்கள் மாற்றிக் காட்டப்படாமல் புரியாத எழுத்துக்களை காட்டும்.

இதை விளக்க, நடைமுறை ஒப்பீடாக 'நல்ல' என்ற தமிழ் வார்த்தையை எடுத்துக் கொள்வோம். இந்த வார்த்தைக்கு தமிழ் அறிந்த அனைவரும் பொருள் விளங்கிக் கொள்வர். அதே சமயம் 'நல்ல' என்று ஒரு தமிழ் அறியாத தெலுங்கு மொழி பேசுபவரிடம் சொன்னால் அதனை தெலுங்கிலே அவர் 'கருப்பு' என பொருள் கொள்வார். 'நல்ல' என்னும் வார்த்தை இரு மொழியிலும் இருப்பதால் பொருள் வேறாயினும் இருவரும் புரிந்து கொள்வர். ஆனால் தகவல் பரிமாற்றத்தில் குழப்பம் ஏற்படும். இருவருமே ஒரே மொழியை பேசுபவர்களாய் இருப்பின் இந்த குழப்பம் நேராது.

அது போல, கணினி தகவல் பரிமாற்றத்தில், பயனர்கள் அனைவராலும் ஒப்புக் கொள்ளப்பட்ட ஒரு குறியேற்றத்தை பயன்படுத்துவதன் மூலம் தகவல் பரிமாற்றக் குழப்பங்கள் தவிர்க்கப்படும்.

இன்றைய தமிழ்க் கணிமை உலகில் பல்வேறு குறியேற்றங்கள் பயன்பாட்டில் உள்ளன. அவற்றுள் சில:
  • தாம் (TAM - Tamil Monolingual)
  • தாப் (TAB - Tamil Bilingual)
  • திஸ்க்கி (TSCII - Tamil Standard Code for Information Interchange)
  • ஒருங்குறி (Unicode)
இந்த குறியேற்றங்களில் இன்று இணையத்தமிழில் பரவலாக பயன்படுத்தப்பட்டு வருவது ஒருங்குறி.

கணினி மயமாக்கப்பட்ட அரசு அலுவலகங்களில் பெரும்பாலும் தாம்/தாப் தகுதரம் பயன்பாட்டில் உள்ளது. அரசு சார் இணையதளங்களில் திஸ்கி பயன்படுத்தப்படுகிறது.

இது தவிர, அச்சு மற்றும் பத்திரிக்கை துறையினர் பல்வேறு தனிப்பட்ட தமிழ் குறியேற்றங்களையும் அதன் அடிப்படையில் அமைந்த எழுத்துருக்களையும் பயன்படுத்துகின்றனர்.

இந்த குறியேற்றங்களின் அட்டவனையை பார்த்தீர்களானால் ஒவ்வொரு தமிழ் எழுத்துக்கும் ஒரு எழுத்தெண் வழங்கப்படுவது தெரியும்.

படம் 1 தாம் அட்டவனை

படம் 2 தாப் அட்டவனை

படம் 3 திஸ்கி அட்டவனை

படம் 4 ஒருங்குறி தமிழ் அட்டவனை


சரி, இன்றைய இடுகையில் குறியேற்றங்கள் பற்றி அறிந்து கொண்டோம். இன்னும் சில எழுத்துரு தொடர்பான நுட்பங்களை பற்றி அடுத்த இடுகையில் அறிவோம்.

பகுதி 1
பகுதி 2
பகுதி 3
பகுதி 4

மேதாவி மதன்
Google Buzz Logo

இந்த வார (20 ஆகஸ்ட் 2008) விகடன் இதழில் "ஹாய் மதன்" பகுதியில் வெளியான மதன் பதில்களில் சில:
--------------------------------------------------------------
மா.அண்ணாமலை, சென்னை-1.
Surrender என்ற ஆங்கிலச் சொல்லுக்கு சரண் என்று தமிழில் வருகிறதே! சரண் என்ற சொல் தமிழிலிருந்து ஆங்கிலத்தில் போனதா? இல்லை ஆங்கிலத்திலிருந்து தமிழுக்கு வந்ததா?

இது போல ஒற்றுமையுள்ள பல ஆச்சர்ய வார்த்தைகள் உண்டு! பண்டைய பிரெஞ்சு மொழியிலிருந்து வந்தது. Surrender. Sur-என்றால் 'முடிந்துவிட்டது'. render என்றால் 'கொடுத்துவிடு' அதாவது வாளை! இந்தப் பிரெஞ்சு வார்த்தை லத்தீனிலிருந்து வந்தது. லத்தீனுக்கும் சம்ஸ் கிருதத்துக்கும் நிறைய தொடர்புகள் உண்டு. அப்படியே அது தமிழுக்கும் வந்திருக்கக்கூடும்.

எஸ்.ராஜகோபாலன், சென்னை-7.
உயில் என்பது தமிழ்ச் சொல்லா?

உயில் தமிழ் வார்த்தையாகிவிட்டது என்றாலும், அதன் வேர் பண்டைய சம்ஸ்கிருதம். சம்ஸ்கிருதத்திலிருந்துதான் சிறிது மாறி ஆங்கிலத்தில் 'வில்' (Will) என்று ஆனது. அடிப்படை அர்த்தம் - மகிழ்விக்க. ஆனால், பல உயில்களால் வெட்டுக் குத்து ஏற்படுவதும் உண்டு!

எஸ்.கோபாலன், நங்கநல்லூர்.
அரிசிக்கு ஏன் அரிசி என்று பெயர் வந்தது?

பல சர்வதேச மொழிகளில் அரிசிக்கு ஒரே மாதிரி ஒலிக்கும் பெயர்தான். பிரெஞ்சு மொழியில் ரைஸ் (Riz), இத்தாலியில் ரைஸோ, ஜெர்மனியில் ரெய்ஸ், ரஷ்யாவில் ரைஸ் (Ris). ஆங்கிலத்தில் Rice. தமிழிலும் அதே ஒலியோடு அரிசி! எல்லாவற்றுக்கும் மூலம் சம்ஸ்கிருதம். அதில் - ரையி!

---------------------------------------------------------------

அடேயப்பா! ஒரே வாரத்துல இருக்குற பதினொரு கேள்வியில மூனு கேள்வி சமஸ்கிருதத்துக்கு பில்டப் குடுக்கவே போயிடுச்சி.

அதாவது மெத்தப் படித்த மதன் என்ன சொல்றாருன்னா உலகத்துல மக்கள் பேசுற பல மொழிகளில் இருக்கும் பல வார்த்தைகள் சமஸ்கிருதத்துல இருந்து வந்தது தானாம்.

அப்படிப்பட்ட சமஸ்கிருதத்தை இப்ப யாரு பேச்சு மொழியா பயன்படுத்தறாங்க அதை எழுத எந்த எழுத்துரு பயன்படுது அப்படின்னு எனக்கு ஒரே ஆச்சர்யம்.

எந்த ஒரு வார்த்தையும் தம் தாய்மொழியில் தோன்றியது என பெருமை கொள்வது மனித இயல்பு. உதாரணமாக, என்னைக் கேட்டால் catamaran, betrothal போன்ற ஆங்கில வார்த்தைகள் தமிழில் இருந்து தோன்றியன என ஆதாரங்களுடன் நிறுவ முயற்சிப்பேன். ஒருவேளை மதன் அவர்களின் தாய் மொழி சமஸ்கிருதமாய் இருக்குமோ?

என்ன மக்களே! என்ன சொல்லுறீங்க?