शनिवार, 5 मार्च 2016

मशीनी अनुवाद और उसकी समस्याएं


म्प्यूटर सॉफ्टवेयर की सहायता से किसी भाषा (कम्प्यूटर भाषा नहीं) के पाठ या वाक् को अनुवाद करने को मशीनी अनुवाद कहते है। मशीनी अनुवाद में मानव का उपयोग एक सहायक के रूप में किया जाता है तथा अधिकांश कार्य कम्प्यूटर प्रोग्राम द्वारा संचालित किया जाता हैं इसे एक विशिष्ट कम्प्यूटर प्रोग्राम से संचालित किया जाता है। वैसे मशीनी अनुवाद को अभिव्यक्ति का मशीनीकरण भी कहा जा सकता है। मशीनी अनुवाद को मशीन की सहभागिता के आधार पर चार भागों में बांटा जा सकता है;
   (1)   शब्दकोश आधारित मशीनी अनुवाद
   (2)   नियम अथवा स्थानांतरण आधारित मशीनी अनुवाद
   (3)   उदाहरण आधारित मशीनी अनुवाद
   (4)   सांख्यिकीय मशीनी अनुवाद
यांत्रिक अनुवाद की सामान्य प्रक्रिया में स्रोत भाषा के पाठ को कम्प्यूटर आधारित सॉफ्टवेयर में इनपुट के रूप में दाखिल या लोड किया जाता है। जिसके बाद मशीन यानी सॉफ्टवेयर की अपनी स्मृति (TM- Translation memory) की सहायता से वाक्य दर वाक्य अनुवाद किया जाता है।
आजकल उपलब्ध सॉफ्टवेयरों में SDL-TRADOS, Wordfast, memo-Q, TO3000, Atril Dejavu, Across, Fluency, Word finder आदि प्रमुख हैं साथ ही गूगल का अपना ट्रांसेलटर टूलकिट भी उपलब्ध हैं टूल्स के नाम से लोकप्रिय इन सभी अनुवाद मशीनों में एक अनुवाद समृति होती हैं जिसके आधार पर यह Tool शब्द या वाक्य के लिए अनुवाद का प्रस्ताव करता हैं जिसमें संदर्भनुसार परिवर्तन करके या प्रस्ताव के सटीक होने पर उसे स्वकार किया जाता है। हम जैसे-जैसे इस पर अनुवाद करते जाते है यह अपनी TM को बढ़ाता जाता है और इस प्रकार से ये काम करता है। 



इतिहास:-
17वी सदी के आरंभ में रेने दैस्कतैर्स व लैब्निन नाम के दर्शन शास्त्रियों ने भिन्न भाषिक संरचनाओं की भिन्न माषिक अभिव्यक्ति को एक ही भाषिक प्रतीक द्वारा प्रस्तुत करने के लिए संख्यात्मक अभियांत्रिकी दृष्टि से एक सार्वमौलिक भाषा का प्रस्ताव रखा था। 1933 में जार्ज आर्ट नाम के फ्रेंच विद्वान ने पेपर टेप के माध्यम से मिकेनिकल ब्रेल नाम अनुवाद यंत्र के लिए एक स्वचालित द्विभाषी कोष बनाया था। ट्रोयास्की और स्मिर्नोव नामेक रूसी विद्वानों ने 1944 में मास्की में अनुवाद यंत्र का प्रस्ताव दिया था। 1939 में पहली बार बेल लैब द्वारा न्यूयार्क विश्वमेले में पहले इलेक्ट्रॉनिक वाक् संश्लेषक यंत्र का प्रदर्शन हुआ। पहली प्रोग्रमिंग भाषा कोमिट का 1912 में MIT द्वारा किया गया। 1954 में IBM ने सिस्ट्रॉन नामक मशीती प्रणाली प्रस्तुत की। 1868 में पेटर टोया ने पहली मशीनी अनुवाद कंपनी लाटसेक (LATSEC) की शुरूआत की। 1969 में चालर्स कीर्न और बर्नार्ड स्कॉट ने मशीनी अनुवाद प्रणाली लोगोस (LOGOS) का विकास किया। 1980 के दशक में जापान में पिवोट (PIVOT) तंत्र का विकास हुआ। 1989 में यूरोपीय आयोग द्वारा यूरो (EUROTRA) नामक मशीनी अनुवाद परियोजना की स्थापना हुई, जिसे यूरोपीय समुदाय की नौ आधिकारिक भाषाओं के लिए बनाया गया था। तब से लेकर अब तक मशीनों द्वारा अनुवाद के लिए अनेक प्रयास किए जाते रहे है। आजकल गूगल ट्रांसलेट सर्वाधिक भाषाओं के युग्म में सहायता उपलब्ध कराता है।
भारत में मशीनी अनुवाद की शुरूआत 1983 से मानी जाती है। जब तमिल विवि में रूसी-तमिल TUMTS अनुवाद यंत्र की शुरूआत हुई। यह सीमित क्षमता वाला यंत्र था आज सी-डैक नोएडा, ‘‘आन्ग्लभारती मॉट’’ हैदराबाद अनुसार सी डैक पुणें - मंत्र व आईआईटी मुंबई मात्रा व इन्फोसेट अनुवादक पर कार्यरत हैं।


मशीनी अनुवाद के लाभ:-
मशीनी अनुवाद को लगातार सुधारा जा रहा है। ये टूल्स लगातार बेहतर होते जा रहें है। गूगल जैसे ऑनलाइन टूल पर 9 (उर्दू सहित)  भारतीय भाषाएं उपलब्ध हैं ऊपर बताए गए टूल्स के अलावा भारतीय टूल्स भी उपलब्ध है जो मूलतः सरकारी संस्थानों द्वारा विकसित किए गए हैं। इन सभी टूल्स (मशीनों) से अनुवाद प्रक्रिया में कई तरह के लाभ मिले है।
  •  इससे अनुवाद प्रक्रिया में लगने वाले समय में काफी बचत हो सकती है।
  • यदि कुछ ऑन लाइन टूल्स को हटा दें तो अधिकोश ऑफलाइन कार्य करते हैं जिनको दिन के किसी भी समय उपयोग किया जा सकता है।
  • इनके लाइसेंस या उच्चीकरण के व्यय के अतिरिक्त इनमें कोई अन्य खर्च नहीं आता है।
  • इनमें से ऑफलाइन टूल्स मे निजता पूरी तरह से सुरक्षित रहती है।
  • हर एक प्रोग्राम कई भाषाओं (आपकी इच्छानुसार) के युग्मों के लिए काम करता है।
  •  इनसे अनुवाद करके सुधार करवाना एक सस्ता विकल्प है।
  • भाषा को कतई न जानने वाले के लिए यह एक खिड़की खोलने जैसा है क्योंकि यह कम से कम एक भाव तो स्पष्ट कर ही देता है।
  • मशीनी अनुवाद हमें हमारी अनुवाद शैली को एक जैसा बनाए रखने में मदद करता है।
  •  ये टूल्स अब इतने विकसित हो गए है कि इनको इस प्रकार से संयोजित किया जा सकता है। कि ये मशीन से पकड़ी जा सकने वाली त्रुटियों के होने पर सूचित कर दे।  इन टूल्स का लाभ यह भी है कि ये अधिकांश फाइल फार्मेट्स का समर्थन करते है तथा अनुवाद के पश्चात तैयार (Exported) फाइल यानी आउटपुट को ठीक वैसा ही प्रस्तुत करते है जैसा फार्मेट इनपुट का था।
  • Trados 2015 जैसे कुछ Tool अब .pdf फाइलों को भी पढ़कर उनको संपादित करने या अनुवाद करने योगय स्थिति में ला देते है।

मशीनी अनुवाद की समस्याएं:-
मशीनी अनुवाद के माध्यम से अनुवादकों को काफी सुविधाएं हासिल हुई और इस व्यवसाय में पेशवर अनुवादक इन टूल्स का काफी उपयोग भी कर रहे हैं, इसने अनुवाद की प्रक्रिया और पेशे को काफी लाभ पहुचाया है। लेकिन इन टूल्स के माध्यम से अनुवाद करते समय कई समस्याओं का सामना करना पड़ता है।
  •  मशीन अनुवाद मानवीय मेघा और तर्क शक्ति के सामने नहीं ठहर सकता। किसी भाषा के एक शब्द के भिन्न-भिन्न संदर्भो में भिन्न-भिन्न वाक्यों में अर्थ भिन्न-भिन्न होते है। ऐसे में मावना विहीन मशीन यह तय नहीं कर सकती कि सही अनुवाद क्या होगा।
  •  किसी भी तरह से मशीनी अनुवाद का अर्थ स्वचालित अनुवाद नहीं है। इसके लिए मशीन को चलाने के लिए मानव की उपस्थिति नियंत्रक रूप में आवश्वक है।
  • सभी मशीनों की अनुवाद स्मृति धीरे-धीरे विकसित होती जाती है। (उनके उपयोग के साथ) ऐसी स्थिति में मशीन वास्तव आपको अनुवादों के सुझाव देती है, सटीक अनुवाद नहीं ।
  • व्याकरण के स्तर पर दो भाषाएं सर्वथा भिन्न हो सकती है। अंग्रेजी-हिन्दी को ही ले लीजिए-
-    How far had you gone?
-    तुम कितनी दूर तक गए थे?
-    तुम कहां तक गए थे?
-    तुम कितनी दूर तक चले गए थे?
-    कितनी दूर तुम चले गए थे?  आदि
  • इस तरह से थोड़े-थोड़े अंतरों के कई सारे (विकल्प हो सकते है।) उनमें से पूरे स्रोत के आधार पर सही पाठ को तो मानव ही चुन सकता है, जिसे व्याकरण का ज्ञान होगा (जिसे दोनो भाषाओं का वही इसमें से सही अनुवाद चुन सकता है)। एक और उदाहरण देखिए -
  • Old जो कि एक विशेषण है। इसके कुछ उपयोग old man, Old friend, 3 year’s old हो सकते हैं। मशीन के अनुवाद के विकल्प क्रमशः पुराना आदमी, पुराना मित्र, 3 वर्ष पुराना, बूढ़ा आदमी, 3 वर्षीय देगी। अब यह मानव तय करेगा कि किसके लिए क्या उपयुक्त है।
  • मशीनी अनुवाद को लेकर लोगों के मन में धारणा है कि मशीन के अनुवाद में वही प्रक्रिया शामिल होती है जो कि मानव द्वारा अनुवाद में प्रयोग की जाती है। लेकिन मशीन यानी अनुवाद टूल की अनुवाद स्मृति अपने भीतर पहले से उपलब्ध (यदि हो तों) अभाव होता है।
  • भाषाओं का विजातीय होना की मशीनी अनुवाद की एक मुख्य समस्या है। प्रत्येक भाषा अपनी निजी प्रकृति की धारक होती है। जिसके अनुसार उसकी संरचना होती है। उदाहरण के हिन्दी व अंग्रेजी दोनो ही विजातीय भाषाएं है और इसी कारण दोनों की संरचनाएं भिन्न है। संरचना की इस भिन्नता के कारण ही मशीनी अनुवाद में समस्या पैदा होती है।
  • सार्वमौमिक व्याकरण का अभाव होना भी मशीनी अनुवाद की एक समस्या है। चॉमस्की ने अनेक सार्वभौमिक व्याकरणों का निर्माण किया लेकिन आज भी मशीनी अनुवाद के लिए आवश्यक सार्वभौमिक व्याकरण अर्थात सारी भाषाओं पर आधारित नियमों से संबद्ध एक समान व्याकरण उपलब्ध नहीं हो पाया है। यही वह कारण है कि जिसके चलते मशीनी अनुवाद में समस्याएं आती है।
  • एक ही शब्द के कई पर्यायवाची होते है इसी कारण अनुवाद स्मृति में स्रोत भाषा के किसी एक शब्द के लिए लक्ष्य भाषा में अनेक शब्दों के होने के कारण मशीनों के लिए सही व सटीक शदर व चुनाव कर पाना समस्याप्रद हो जाता है। इसका सटीक उदाहरण गूगल ट्रांसलेट है जिस पर यदि एक साधारण सा वाक्य रखा जाए-
  -    How are you?
         तो निम्नलिखित विकल्प मिलते हैं -
         -     तुम कैसे हो?
         -     आप कैसे है?
         -     तुम कैसी हो?
         -     आप कैसी हैं?
         -     कैसे हैं?
         -     कैसे हो?
ऐसे में अंतिम चुनाव तो मानव ही करेगा।
  • मशीनी अनुवाद के विकास के लिए यह आवश्यक हो जाता है कि भाषा संबंधी नियमों का निर्माण होता रहे। इसके लिए भाषा वैज्ञानिकों की आवश्यकता होती है। मशीनी अनुवाद के क्षेत्र में विकास करने वाले अभी भी अधिकांशतः कम्प्यूटर वैज्ञानिक है और भाषा वैज्ञानिकों का नितांत अभाव रहा हैं इसी कारण इन मशीनों टूल्स का पूरी तरह व्यवहारिक हो पाने की प्रक्रिया धीमी है।
  • जैसा कि ऊपर बताया (लाभ खंड मे) कि इससे (मशीनी अनुवाद से) समय की बचत होती है। लेकिन कम्प्यूटर की मैमोरी सीमित होने के कारण एकत्रित होने वाले आंकड़ें के भार के चलते यह धीमा होता जाता है और अनुवाद की गति प्रभावित होती है। वही पद गूगल ट्रांसलेट जैसे साधन के उपयोग के लिए ऑनलाइन होता आवश्यक है। क्योंकि उनका सारा संग्रह उनके सर्वरों पर रहता है।
  • सारे विश्व में हर एक क्षेत्र में मशीनों में विकास हेतु निरंतर शोध चल रहा है। ठीक उसी तरह से अनुवाद के लिए मशीनों पर भी निरंतर शोध व विकास जारी है। इस संबंध में नए-नए सॉफ्टवेयर सामने आ रहे है। पुराने लगातार उच्चीकृत व बेहतर किए जा रहे है। समस्या, लक्ष्य भाष की प्रकृति को समतना भी है भाषा से संबधित समस्त अनुप्रयोग(Functions) को एक ही स्मृति (Memory) में रखा पाना भी एक कठिन कार्य है। यह विकास इनके संग्रहण की क्षमता को भी बढ़ा रहा है।
  • कृत्रिम मेघा के विकास द्वारा मशीन को भी मानव की मेधा की तरह कृत्रिम मेघा प्रदान करने का प्रयास जारी है। इस पर भाषा तथा कम्प्यूटर वैज्ञानिक संयुक्त रूप से प्रयासरत है। इसमें होने वाला विलंब भी एक बड़ी समस्या है।
  • मानव अनुवाद करते समय सम्पूर्ण वाक्य पर या पाठ पर ध्यान रखा जाता है न कि छोटी भाषाई इकाई पर। कृत्रिम अनुवाद मशीन पूरे वाक्य यहां तक कि पूरे अनुच्छेद का शामिल कर सकती है। लेकिन एक साथ एक बार में लिया गया स्रोत पाठ जितना बड़ा होगा, हासिल लक्ष्य पाठ के वास्तविक अनुवाद से उतना अधिक दूर होने का जोखिम होगा।
  • मशीनों के साथ उनके सॉफ्टवेयर आदि की परिचालन संबंधी समस्याएं भी होती हैं। समय-समय पर उनका उच्चीकरण किया जाना बेहद अहम होता है अन्यथा लाइसेंस प्रदाता की ओर से समय-समय पर किये जाने वाले अपग्रेडों के अपडेट न होने के कारण सॉफ्टवेयर के सही काम करने की संभावनाएं कम होती जाती हैं। क्योंकि लाइसेंस प्रदाता उपयोग करने वालों की प्रतिक्रिया के आधार पर समय-समय पर अपने सॉफ्टवेयर में कम या अधिक परिवर्तन करते रहते हैं।
  • कम्प्यूटर पर काम करने में डाटा संबंधी जोखिम भी इन समस्याओं में शामिल हैं, जैसे हार्ड ड्राइव का क्रैश कर जाना या मूल सॉफ्टवेयर का खराब हो जाना आदि।
  • जैसा कि मैने ऊपर बताया अनुवाद संबंधी अनेक टूल्स उपलब्ध हैं, ऐसे में पेशेवर अनुवाद की शुरुआत करने वाले को सही टूल के चुनाव को लेकर भ्रम हो सकता है।
  •  इन टूल्स के पूरी विशेषताओं के सही उपयोग के लिए प्रशिक्षण न लेने पर इनको सही तरीके से चलाने में समस्याएं आ सकती हैं, अतः इनका सही प्रशिक्षण भी आवश्यक हो जाता है।


उपरोक्त तथ्यों के प्रकाश में यह समझना और जानना बेहद जरूरी है कि अनुवाद को पेशे के तौर पर अपनाने के लिए यह जरूरी है कि आप आज के युग के साथ कदम से दम मिला कर चलें और सूचना प्रौद्योगिकी व इंटरनेट के इस युग में सभी उपलब्ध संसाधनों से न सिर्फ परिचित रहें बल्कि उनके अच्छे जानकार भी बनें।
अनुवाद के सैद्धांतिक पक्ष को जान कर व समझ कर आप अनुवाद के मूल के जानकार बनेंगे जो कि इसका कला पक्ष है लेकिन साथ ही कम्प्यूटर के इस युग में सभी पेशेवर लोगों को नवीनतम तकनीकों, मशीनों आदि की जानकारी आपको इस पेशे में बनाए रखने के लिए समान महत्व की साबित होगी।

सारे लाभों और सीमाओं के साथ यह समझना होगा कि मशीनी अनुवाद, मानव की उस जिद का नतीजा है जो उसे किसी भी क्रिया को सरल, सहज व सबके लिए सुलभ कराने से जुड़ी है। इसी जिद के कारण विभिन्न वैज्ञानिक अविष्कार होते हैं तथा मानव नई-नई तकनीकों के माध्यम से अपने आसपास के वातावरण को अपने लिए और सहज बनाता जाता है।
   
धन्यवाद!