Pages - Menu

Wednesday, October 7, 2020

மலையாளம்-தமிழ் மொழிபெயர்ப்புக் கருவி அறிமுகம்

இந்திய அளவில் ஆங்காங்கே சில எந்திர மொழிபெயர்ப்பு முயற்சிகள் நடைபெற்றுவருகின்றன. அவ்வகையில் உலக மொழிபெயர்ப்பு தினத்தில் "பேச்சி" என்ற புதிய மொழிபெயர்ப்புக் கருவியின் முன்னோட்டப் பதிப்பு வெளிவந்துள்ளது. இந்திய மொழிகளை எல்லாம் தமிழில் மொழிபெயர்த்துக் காட்டவைக்கும் முயற்சியாக இது உருவாக்கப்படுகிறது. முதல் கட்டமாக மலையாளம் மொழியைத் தமிழில் எழுத்துபெயர்த்து அதற்கு இணையான தமிழ்ச் சொற்களைக் கொடுத்து மூலமொழியின் சாரம் மாறாமல் தமிழில் எழுதிக் காட்டுகிறது. மேலும் இந்தி உட்பட சுமார் பத்து இந்திய மொழிகளையும் எழுத்துப் பெயர்த்து தமிழில் காட்டுகிறது.

மொழிபெயர்ப்பு என்பது மனிதன் தோன்றிய காலந்தொட்டே வளர்ந்து வரக்கூடிய கலை. மக்கள்தொகை அதிகரிப்பாலும், பொருளாதார வளர்ச்சியினாலும் ஒருவர் ஒன்றிற்கும் மேற்பட்ட மொழிகளில் ஊடாடவேண்டிய தேவை ஏற்படுகிறது. இக்காலக்கட்டத்தில் தொழில்நுட்ப உதவியுடன் மொழிபெயர்ப்புகள் செய்யும் சூழல்களும் வளர்ந்து வருகின்றன. Machine Aided Translation எனப்படும் எந்திர உதவியுடன் மொழிபெயர்க்கும் கருவிகள் பல சந்தைகளில் உள்ளன. அவை கலைச்சொற்களை மொழிபெயர்க்கவோ, வாக்கியப் பிழைகளைச் சீர்செய்யவோ, பழைய மொழிபெயர்ப்புகளிலிருந்து மாதிரிகளை எடுக்கவோ எனப் பயன்படுகின்றன. இவற்றிற்கெல்லாம் ஒருபடி மேலே எந்திர மொழிபெயர்ப்புக் கருவிகளும் கடந்த பத்தாண்டுகளில் கூகிள், மைக்ரோசாப்ட் போன்ற பெருநிறுவனங்கள் உருவாக்கிவருகின்றன. அவை மொழிபெயர்க்க உதவி மட்டும் செய்யாமல் முழுமையான மொழிபெயர்ப்பையே அளிக்கவல்லவை. தமிழ் உட்படப் பல இந்திய மொழிகளுக்கும் இந்த வசதிகள் இருந்தாலும் அவை முழுமையான மொழிபெயர்ப்பாக இல்லாமல் உள்ளன. காரணம் எந்திரவழிக் கற்றல் முறையில் செயல்படுவதாலும், அனைத்து மொழிகளுக்கும் ஒரே கட்டமைப்பைக் கொண்டிருப்பதாலும் இவை முழுமை அடைவதில்லை. இவ்விடத்தில் இந்திய மொழிகளுக்குள் விதிகளடிப்படையில் மொழிபெயர்க்க முடியும் என்று பேச்சி திட்டம் தொடங்குகிறது.

2013 இல் நண்பர் ஜோதிஜியுடன் நடந்த உரையாடல் எந்திர மொழிபெயர்ப்பிற்கான ஆர்வத்தைத் தூண்டியது. 2014 ஆம் ஆண்டு வாணி பிழைதிருத்தி ஆய்வு இலக்கை எட்டியவுடன் பிற இந்திய மொழிகளில் தொடங்கிய முயற்சி இது. விக்கிப்பீடியாவில் நண்பரொருவர்க்கு மலையாளக் கட்டுரைகளைத் தமிழில் எழுத்துப்பெயர்த்து கட்டுரைகளை எழுத உருவாக்கிய சிறு கருவி இன்று மொழிபெயர்ப்புக் கருவியாக மேம்பட்டுள்ளது. http://apps.neechalkaran.com/translate
பேச்சியில், சுமார் நான்காயிரத்திற்கும் மேற்பட்ட மலையாளம்-தமிழ் பெயர்ச்சொற்களையும் முந்நூற்றுக்கும் மேற்பட்ட வினை இணைச்சொற்களையும் கொண்டுள்ளன. மேலும் சுமார் 150 மலையாளம் தமிழ் இலக்கண விகுதிகளும் கொண்டுள்ளதால் எளிய மலையாள வாக்கியங்களை முழுமையாக மொழிபெயர்க்கிறது. தற்போதைக்கு இணையான தமிழ் விகுதிகளைக் கூட்டல் குறியுடனே தருகிறது, வாணியின் சொல்லாக்க நுட்பத்தை(morphological generator) எதிர்காலத்தில் இணைக்கும் போது முழுமையான வாக்கியவடிவம் பெறும். இதன் மூலம் மலையாளம் அறிந்து ஆனால் வாசிக்கத் தெரியாத தமிழர்களுக்குப் பெரிதும் பயன்படும். கூடுதலாகத் தொடர்ந்து இதனை மேம்படுத்தி வருவதால் எதிர்காலத்தில் முழுமையான மலையாளம் தமிழ் மொழிபெயர்ப்புக் கருவியாக இது உருவாகும். புழக்கத்திலுள்ள தமிழ்ச் சொற்களில் பல பரவலாக மலையாளத்திலும் பயன்படுவதாலும் இருமொழிகளுக்கும் இலக்கண ஒற்றுமை பெரிதும் இருப்பதாலும் இந்த மொழிபெயர்ப்பு மற்ற மொழிகளைவிட ஒப்பீட்டளவில் எளிதாகிறது.


விக்சனரி, விக்கிப்பீடியா போன்ற திட்டங்களில் உள்ள இணைமொழிப் படைப்புகளும், பல மொழிகளில் வெளிவரும் மத்திய அரசின் செய்திக் குறிப்புகளும் இந்த மொழிபெயர்ப்பு ஆய்வுகளுக்குப் பயன்பட்டன. மேலும் சில விக்கிப்பீடிய நண்பர்கள், மலையாளத் தமிழ் ஆர்வலர்கள் உதவுகின்றனர். மலையாளம் -தமிழ் தற்கால அகராதியொன்றை வெளியிடவும், பிற இந்திய மொழிகளுக்கான எந்திர மொழிபெயர்ப்பை உருவாக்கவும் திட்டமுள்ளது. ஆர்வமுள்ளவர்கள் இணைந்தும் பங்களிக்கலாம். செய்திகளை வெளியிட்ட தமிழ் இந்து, தினமலர், தினகரன் ஊடகங்களுக்கு நன்றி. ஆலோசனைகளையும் கருத்துக்களையும் தெரிவிக்கலாம்.

5 comments:

  1. தமிழ்க் கணினியனுக்கு வாழ்த்துகள்...

    ReplyDelete
  2. தமிழ்கடலில் மூழ்கி தமிழ் முத்துக்களை வாரிவழங்கும் நீச்சல்காரனுக்கு நல்வாழ்த்துக்கள்..வாழ்கவளமுடன் தொடரட்டும் தங்கள் பணி..
    வேலன்.

    ReplyDelete
  3. நல்வாழ்த்துகள்..

    ReplyDelete
  4. இப்போது தான் மின் அஞ்சல் வழியாக முழுமையாகப் படித்தேன். என் இணைப்பு உள்ளே சென்ற போது எனக்கே நான் எழுதியது புதிதாகத் தெரிந்தது. நன்றி. அன்பு. வாழ்த்துகள். தமிழ் ஆங்கிலம் மொழி மாற்றியை உருவாக்கி விட்டால் போதும். தமிழ் வாழும்.

    ReplyDelete
  5. உங்களுடைய முயற்சி, ஆர்வம் & உழைப்பு பிரமிக்க வைக்கிறது. உங்களைப் போலச் சிலரால் தான் தமிழ் இன்னும் பல படிகள் முன்னே செல்கிறது.

    ஒவ்வொரு கட்டுரைக்கும் உங்கள் பிழை திருத்தும் வசதியைப் பயன்படுத்துகிறேன்.

    ReplyDelete

"கற்றது கையளவு கல்லாதது உலகளவு"
உங்கள் ஊக்கத்துடன், உங்களுக்குத் தெரிந்த இடுகை சார்ந்த விசயத்தையும் பகிர்ந்துகொள்ளுங்கள்.
இந்தத் தளத்தில் NCcode நீட்சி பொருத்தப்பட்டுள்ளது