Sat. Nov 17th, 2018

अभिकलनात्मक अनुवाद

डॉ. पद्मा पाटील
वर्तमान समय में अनुवाद की भूमिका अत्यन्त महत्वपूर्ण हो गयी है । विश्व साहित्य, वैज्ञानिक, तकनीकी, ऐतिहासिक, सामाजिक, राजनीतिक , सांप्रदायिक आदि सभी का वैश्विक संदर्भ समझना हों तो अनुवाद सहायक होता है । सभी देशों की भाषा जनसामान्य तक पहुँचाने का एक ही माध्यम है, अनुवाद । भाषा परिवर्तनशील है और यह परिवर्तन कई कारणों से होता है । फलतः भाषा में नए शब्दों का निर्माण भी होता है । नए शब्द या तो उसी भाषा के आधार पर या दूसरी भाषा से अनूदित होकर प्रयोग में लाए जाते हैं । इस परिवर्तन से भाषा की अभिव्यंजना शक्ति, माधुर्य तथा ओज की दृष्टि से उँची उठ सकती है या नीचे भी जा सकती है । अनुवाद और भाषाविज्ञान का सीधा संबंध है । मशीनी

डॉ. पद्मा पाटील

अनुवाद तो भाषाविज्ञान की देन है । आज सूचना प्रौद्योगिकी के बढ़ते युग में संगणकसाधित अनुवाद का महत्व और बढ़ गया है । अतः मशीनी अनुवाद करते समय भाषा विज्ञान की दृष्टि से बहुत सावधानी रखनी होती है । वर्तमान मशीनी युग समाज को वैज्ञानिक दृष्टिकोण प्रदान कर रहा है । संगणकीकरण ने कार्य तथा चिंतन की नई धारा रखी है । उपलब्ध संसाधन और कम समय में अधिक ज्ञान आत्मसात करने से संपूर्ण मानव–सभ्यता के विकास में विस्तार होता जा रहा है और इसमें ‘अनुवाद’ महत्वपूर्ण है । इसके माध्यम से विपणन एकीकृत हो जा रहा है । विगत अनेक वर्षों से इस कार्य को एक दिशा और गति मिलती जा रही है । अनुवाद एक भाषा के वाचिक और लिखित पाठ को अन्य भाषा के वाचिक और लिखित पाठ में ढालने या रूपांतरित करने की प्रक्रिया है । मानव अनुवादक लक्ष्य और स्रोत भाषाओं की संरचना, व्याकरण के नियमों, अभिव्यक्ति, संस्कृति, शैली द्वारा इसे पूर्ण रूप देने का प्रयास करता है । ऐसे में संगणक जैसे मशीन का प्रवेश होना महत्वपूर्ण बात है । मानवानुवाद के साथ अभिकलित्रसाधित/संगणकसाधित या मशीनी अनुवाद ने भाषा प्रौद्योगिकी जगत में एक अनोखी पहल की है । आज अनेक भाषिक अनुप्रयोग विकसित किए जा रहे हैं । अभिकलनात्मक मशीनी अनुवाद की संकल्पना का उद्गम स्रोत अत्यंत पुराना है । यह ‘भाषा प्रौद्योगिकी’ का एक अभिन्न भाग है ।
पहले प्रौद्योगिकी का स्वरूप भी देखते हैं । ‘चीजों अथवा कार्यों को बनाने अथवा करने का तरीका । ’ यह अर्थ दो संदर्भों में प्रयुक्त किया जाता है । संकुचित अर्थ केवल औद्योगिकी प्रक्रियाओं से जुड़ा है । विस्तृत अर्थ सभी पदार्थों के साथ होनेवाली सभी प्रक्रियाओं से जुड़ा है । प्रौद्योगिकी का ज्ञान व्यावहारिक ज्ञान होता है, जिसे प्रायः सीखना पड़ता है । यही ‘प्रायोगिक विज्ञान’ अथवा ‘हस्तचालित कौशल’ कहा जा सकता है । इसलिए कहा जा सकता है, ‘विशिष्ट सैद्धान्तिक ज्ञान का व्यावहारिक ज्ञान में रूपान्तरण ।’ इस ज्ञान शाखा का संबंध यांत्रिकीय कला अथवा प्रयोजनमूलक विज्ञान या दोनों के समन्वित रूप में होता है । प्रौद्योगिकी का शाब्दिक अर्थ कला अथवा हस्तकला है । अपने समस्त रूप में प्रौद्योगिकी वह साधन है जिसके माध्यम से मनुष्य अपने परिवेश पर अपना अधिकार रख सकता है । वह मानव को अपने परिवेश के प्रति सजगता बरतने का पाठ सिखाती है । प्रायः किसी आवर्ती कार्यकलाप पर लागू औद्योगिक प्रक्रियाओं के योजनाबद्ध ज्ञान या कार्य को प्रौद्योगिकी कहते हैं । प्रौद्योगिकी विज्ञान और अभियांत्रिकी सम्बद्ध होती है । विज्ञान के माध्यम से मनुष्य को दुनिया, अन्तरिक्ष, पदार्थ, ऊर्जा और संबंधित क्रियाओं का वास्तविक ज्ञान मिलने की सहायता होती है । अभियांत्रिकी से तात्पर्य है, वस्तुनिष्ठ ज्ञान का उपयोग करके आयोजन, अभिकल्पना और अपेक्षित वस्तुओं के अभिकल्पन माध्यमों का निर्माण करना । प्रौद्योगिकी से तटृअरी है, योजनाओं को परिचालित करने के लिए औजारों अथवा अधुनातन तकनीकों का व्यवहार करना । मनुष्य जीवन सुखमय, परिष्कृत बनाने में जितनी चीजों का उपयोग किया जाता है, वे सभी प्रौद्योगिकी के अंतर्गत आ सकती हैं – जैसे अभिकलित्र/संगणक (computer), परिकलित्र (calculator), विविध यंत्र, आरामदायी वस्तुएं, टी.वी.फ्रिज आदि अनेक ।
संगणक का दूसरा नाम अभिकलित्र है । अभिकलित्र अभिकलन करता है यानि संगणक संगणन । पाँचवीं पीढ़ी का संगणक कृत्रिम बुद्धि पर आधारित है । मनुष्य ने अपने कार्य, उसके प्रकार, क्षेत्र, उपयोगिता आदि को केंद्र में रख कर अपना कार्य आसान करने संगणक या अभिकलित्र के लिए अनेक क्रमादेश (Programme) बनाए । अपने कठिन से कठिन कार्य इस के माध्यम से पूर्ण करना प्रारम्भ किया और अब ऐसी स्थिति है कि मनुष्य जीवन का कोई क्षेत्र ऐसा नहीं कि जहाँ अभिकलित्र या संगणक उपयोग होता नहीं हों । अनुवाद के क्षेत्र में संगणक/अभिकलित्र प्रौद्योगिकी ने काफी गति की है । अनेक संस्थाओं तथा विश्वविद्यालयों, सरकारी और गैरसरकारी संस्थाओं ने अनेक परावस्तुएं (Softwares) विकसित की हैं । इनके आधार से अब कार्यालयीन, वैज्ञानिक, तकनीकी आदि सामग्री के अनुवाद किए जा रहे हैं । कभी मानव सहायता करनी पड रही है । पर भविष्य में अभिकलनात्मक अनुवाद जरूर सम्पूर्ण सफलता की सीमा को लांघ सकेगा ।
अभिकलनात्मक मशीनी अनुवाद की पृष्ठभूमि ः
सामान्यतः अभिकलनात्मक या संगणकीय अनुवाद को मशीनी अनुवाद कहा जाता है । इस प्रक्रिया में भाषाओं का महत्त्व अक्षुण्ण है । पर मशीन से जुड़ने के लिए भाषाओं का प्राकृतिक भाषा संसाधन (Natural Language) रूप होना जरूरी है । अनेक संस्थाएं इसमें कार्य कर रही हैं । संगणक के साथ भाषाओं के इस रूप को सम्बद्ध करने से ही अभिकलनात्मक अनुवाद संकल्पना सफल होती जा रही है । मशीनी मानव सभ्यता के विकास में विज्ञान और प्रौद्योगिकी का बड़ा योगदान है । यह विकास प्रक्रिया काफी परिवर्तनशील रही है । यह परिवर्तन और विकास का माध्यम प्रायः भाषा ही रहती है । मानव जीवन के विविध क्रियाकलाप भाषा से जुड़े रहते हैं । भाषा राष्ट्रीय और अंतर्राष्ट्रीय सद्भाव जागृत करने का सशक्त माध्यम होती है । भाषा का सामाजिक स्वरूप आधुनिक युग में अधिक समृद्ध और व्यापक बना है । इसे समृद्ध तथा व्यापक बनाने में विज्ञान और प्रौद्योगिकी का बड़ा योगदान रहा है ।
मशीनी अनुवाद की संकल्पना को प्रौद्योगिकी की दृष्टि से समझना अधिक प्रासंगिक होगा । लेखन पद्धति, छपाई मशीन, निजी संगणक पर्सनल कंप्यूटर जैसे मार्गों से गुजरकर आज साफ्टवेयर एवं इंटरनेट की दुनिया में प्रवेश कर चुकी है । रेने देस्कर्तेस और लैब्निज नामक दर्शनशास्त्री ने १७ वीं शताब्दी के प्रारंभ में भिन्न भाषिक संरचनाओं की भिन्न भाषिक अभिव्यक्ति को एक ही भाषिक प्रतीक द्वारा अभिव्यक्त करने के लिए संख्यात्मक तथा अभियांत्रिकी दृष्टि से एक सार्वभौमिक भाषा का प्रस्ताव रखा । २२ जुलाई १९३३ को फ्रेंच विद्वान जार्ज आर्ट्स्रौनि द्वारा पेपर टेप का प्रयोग कर ‘मेकैनिकल ब्रेन’ नामक अनुवाद यंत्र के लिए एक स्वचालित द्विभाषी कोश बनाया गया । ट्रोयंस्किइ और स्मिर्नोव नामक रूसी विद्वानों ने पहली बार मशीन से अनुवाद करनेवाले यंत्र का प्रस्ताव दिया । यह यंत्र शब्दधातु शृंखला को अन्य भाषाओं में रूपांतरित करता था जिसका प्रदर्शन ३१ जुलाई १९४४ को मास्को में कर दिया गया । इस यंत्र से केवल एक हजार शब्दों तक का काम ही होता था । ट्रोयंस्किइ ने इसके साथ एक और प्रस्ताव दिया था जिसमें द्विभाषी कोश में व्याकरणिक संरचना को व्यवहृत करने की विधि भी सम्मिलित थी । इन्होंने अनुवाद प्रक्रिया के तीन चरणों का उल्लेख किया जिसमें मशीनयंत्र का कार्य केवल दूसरे सोपान पर था । १९३९ ई.में बेल लैब द्वारा न्यूयार्क विश्व मेले में प्रथम इलेक्ट्रानिक वाक्संश्लेषण यंत्र का प्रदर्शन हुआ था । जुलाई १९४९, न्यूयार्क में एन्ड्रेव.डी.बूथ और वारेन वीवर के बीच एक मत बना था कि विद्युत्यिकी संगणक या अभिकलित्र (इलेक्ट्रानिक कंप्यूटर) का अनुवाद के लिए प्रयोग करने के कुछ सुझाव दिये गए । इसके अनुसार सूचना सिद्धांतों के आधार पर प्राकृतिक भाषा के तत्त्वों के महत्व पर विचार किया गया । इस ज्ञापन के बाद शीघ्र ही १९५१ ई. में बार हिलेल ने एक सर्वेक्षण प्रस्तुत किया । ७ से २० जून १९५२ तक एम.आई.टी. (Massachusetts Institute of Technology) में बार हिलेल द्वारा मशीनी अनुवाद पर एक सम्मेलन करवाया गया जिसमें १८ शोधार्थियों ने सहभागिता दर्ज की थी । एम.आई.टी. ने ‘कोमिट’ नामक प्रोग्रामिंग भाषा का विकास किया । आई.बी.एम. (International Business Machine : IBM) ने ७ जनवरी १९५४ को न्यूयार्क के मुख्य कार्यालय में जार्ज टाउन(आई.बी.एम.द्वारा सिस्ट्रान (SYSTRAN) नामक मशीनी अनुवाद प्रणाली को प्रस्तुत किया जिसकी क्षमता २५० शब्दों और ६ व्याकरणिक नियमों का प्रयोग कर रसायनशास्त्र के ४९ रूसी से अंग्रेजी में अनुवाद करना था । इसमें शब्दानुवाद की प्रमुखता रही । कालांतर में इसे ‘त्यथ’ प्रणाली सिस्टम कहा जाने लगा । गणितज्ञ डा‘. वारेन ने अनुभव किया कि संगणक की तार्किक प्रणाली का उपयोग भाषिक विश्लेषण, संश्लेषण और संसाधन के लिए किया जा सकता है । प्रारम्भ में यह कार्य अक्षरों और शब्दों तक ही सीमित रहा । इसके लिए सरकार द्वारा प्रचुर धनराशि उपलब्ध की गयी । परिणामस्वरूप १९५५ में संयुक्त राष्ट्र, रूस और पश्चिमी यूरोप में इससे संबंधित कार्य सम्पन्न हुए । १९५८ में मशीनी अनुवाद पर प्रथम सोवियत सम्मेलन का आयोजन हुआ । इसमें ५० संस्थानों के ३४० प्रतिभागियों की उपस्थिति रही थी । आई.बी.एम. प्रणाली का १९५९ में प्रारम्भ हुआ और इसके अंतर्गत यू.एस.एफ. की शुरूआत हुई और सिस्ट्रान प्रणाली जनता के लिए पहली बार प्रदर्शित की गयी । कैलिफोर्निया विश्वविद्यालय द्वारा लॉस एंजलिस में १९६० ई. में ‘मशीनी अनुवाद’ पर एक राष्ट्रीय परिचर्चा का आयोजन हुआ जिसमें अनुवाद की गुणवत्ता पर टिप्पणी की गई । १९६३ ई. में सिस्ट्रॉन प्रणाली का संस्थापन कार्य हुआ । इनके कारण अभिकलनात्मक/संगणकसाधित÷ मशीनी अनुवाद के क्षेत्र की संभावनाएँ बढ़ने लगी । परंतु अनुवाद की गुणवत्ता की कमी के कारण आक्षेप भी लिए जाते थे । परिणामतः १९६४ ई. में संयुक्त राष्ट्र सरकार द्वारा ALPAC (automatic Language Processing advisory committee)नामक समिति का गठन हुआ जिसमें सात संगणक वैज्ञानिकों का सहभाग रहा । १९६६ ई. में यह कहा गया कि मशीनी अनुवाद संभव नहीं । इसमें आधारभूत भाषा–विश्लेषण सिद्धांतों का अभाव है, इसलिए मशीनी अनुवाद की गुणवत्ता पर प्रश्न उठाए गए । परिणामतः शोध एवं विकास (Reserch and Development) समूह ने अमेरिका और अन्य संलग्न देशों में वित्तीय सहायता देने पर प्रतिबंध लगाए । फिर भी धीमी ही सही पर विकास की गति जारी रही । इसी समय एलिजा (ELIZA)नामक पहली बातचीत करनेवाली प्रणाली का विकास हुआ । १९६७ में न्यूजर्सी में हिडेन मार्कोव मॉडल (Hidden Markow Model : HMM) का विकास किया गया जो सतत वाक् अभिज्ञान (Continuous Speech Recognition) की बुनियाद स्वरूप प्रमाणित हुई । १९६८ में पेटर टोमा ने पहली मशीनी अनुवाद कंपनी ‘लैंग्वेज आटोमेटेड ट्रांसलेशन सिस्टम एण्ड इलेक्ट्रानिक कम्यूनिकेशन’( Language Automated Translations System and Electronic  Communications : LATSEC) का प्रारम्भ किया । प्रो. डेविड डी. हेज ने रैंड कारपोरेशन, कैलीफोर्निया द्वारा डिपेंडेंसी विश्लेषक नामक एक क्रमादेश तैयार किया जो पद व्याख्या करने में सफल हुआ । १९६९ में न्यूयार्क के मिडलटाउन में चार्ल्स् बीर्न और बर्नार्ड स्काट ने मशीनी अनुवाद प्रणाली लोगोस (LOGOS) का विकास किया । १९७३ में ल्यूनार (LUNAR) नामक एक प्रश्न विशेषज्ञ प्रणाली (Question Expert System)विकसित की गई । १९७८ में आर्पा (Advance Research Project Agency : ARPA) के नेटवर्क स्पीच कंप्रेशन परियोजना द्वारा इंटरनेट पर प्रथम वाचिक शब्द का प्रसारण किया । इस काल में विकसित अन्य प्रणालिया ये हैं, नियम आधारित अभिगम ः अंतरभाषिक और अंतरण, मौसमसंबंधी सूचनाओं के प्रसारण के लिए ‘टाममेटो’ (TAUMMATEO) प्रणाली जो ३० मिलियन शब्दों का अनुवाद सहजता से करती थी । १९८० में पैन अमेरिकन स्वास्थ्य संगठन प्रणाली (Pan American Health Organization : PAHO) द्वारा स्पेनैम (Spanish-English Machine Translation : SPANAM) एवं इंगस्पेन (English- Spanish : ENGSPAN) प्रणाली भी विकसित की गयी । साथ ही भाषाविज्ञान के क्षेत्र में भी कई व्याकरणिक नमूनों माडलों का विकास हुआ । जैसे, प्रजनक व्याकरण, व्यवस्थापरक व्याकरण, कारक व्याकरण, संबंधपरक व्याकरण, तुलनात्मक व्याकरण आदि । जेम्स के. बेकर द्वारा १९८२ में वाक् अभिज्ञान प्रौद्योगिकी के व्यावसायीकरण के लिए ड्रेगन प्रणाली का विकास किया गया । १९८३ ई. में मशीनी अनुवाद साफ्टवेयर, ‘स्वचालित भाषा संसाधन प्रणाली’ (Automated Language Processing system) बनाई गयी । दारपा ने ( Defense advanced Research Projects Agency : DARPA) ने १९८५ ई. में वाक् अभिज्ञान क्रमादेश का प्रारम्भ किया । जापान ने १९८६ ई. में बहुभाषिक वाक् अनुवाद हेतु ए.टी.आर. निर्वचन टेलीकम्यूनिकेशन शोध प्रयोगशाला (ATR Interpreting Telecommunication Research Laboratories)का निर्माण किया । कार्नेगी मेलान विश्वविद्यालय (Carnegie Mellon University) में १९९७ ई.में श्रुतलेखन के सामान्य प्रयोजन के लिए ‘ड्रेगन डिक्टेट’ नामक प्रथम वाक् से पाठ प्रणाली का विकास हुआ । दारपा (DARPA) द्वारा मानवमशीन अंतरक्रिया के लिए वाक् भाषिक प्रणाली (Spoken Language System) का विकास किया गया । १९९१ में आई.बी.एम. अनुवाद प्रबंधक , १९९२ में AIR-ITL ने ‘वाक् अनुवाद उन्नत अनुसंधान संघ’( Consortium for speech Translation  Advanced Research) स्थापना हुई । १९९४ में ‘चयनित काम्प्युसर्व चैट मंच’ के अंतर्गत निःशुल्क सिस्ट्रान मशीनी अनुवाद (Free Systran Machine Translation) उपलब्ध हुआ । अन्य अनेक क्रमादेश विकसित होते रहे, (ALPS), पी.सी. अनुवादक (PC-Translator), एटलस (ATLAS), एसट्रांसैक (ASTRANSAC), डूएट (DUET), जैसी व्यावसायिक (Commercial) प्रणाली का विकास, न्यूमैक्सिको में ज्ञान आधारित प्रणाली का विकास, रासेटा (ROSSETA) नामक अंतरभाषिक प्रणाली का विकास, टर्मबैंक (Termbank) और शब्दावली प्रबंधन जैसे अनुवाद उपकरणों का विकास । जापान में १९८० के दशक में पिवोट (PIVOT) तंत्र का विकास हुआ । इससे अंग्रेजी, जापानी, कोरियन, फ्रेंच तथा स्पेनिश में अनुवाद करना संभव हुआ । आई.बी.एम. के जर्मनी, स्पेन, इजराइल तथा अमेरिका में विभिन्न शोध केंद्रों में अंग्रेजी–जर्मन, जर्मन–अंग्रेजी, अंग्रेजी–स्पेनिश अनुवाद तंत्रों का प्रोटोटाईप प्रणाली तैयार करने एल.एम.टी. परियोजना (१९८५–८६) प्रारंभ की गई । यूरोपीय आयोग द्वारा १९८९ ई.में यूरोट्रा  नामक मशीनी अनुवाद परियोजना स्थापन की गई । ‘अंतरराष्ट्रीय मशीनी अनुवाद परिषद्’ (IAMT) की स्थापना हुई । इसके अलावा अनुवाद स्मृति, कार्पस आधारित अभिगम, इंटरनेट के लिए प्रणाली विकास, उदाहरण आधारित अभिगम, स्थानीयीकरण, कोशीय संसाधन, अनुवाद कार्यस्थल का विकास हुआ । जापान के ‘जेटेक’ रिपोर्ट (१९९२) से मशीनी अनुवाद विषयक शोध के कारण अमेरिका में वित्तीय सहयोग प्रारम्भ हुआ । आज जापान में सी.आई.सी.सी. (Centre for the International Corporation of Computerization : CICC) द्वारा जापानी, कोरियन चीनी आदि भाषाओं में परस्पर अनुवाद की अंतरराष्ट्रीय परियोजना शुरु है । साथ ही भाषाविज्ञान के क्षेत्र में कई नमूने विकसित किए गए । कोशीय–प्रकार्यात्मक व्याकरण , कान्सट्रेंट आधारित रूपवाद, तर्क प्रोग्रामिंग , डेफिनिट क्लाउज व्याकरण, स्लाट व्याकरण, हेड–ड्रिवेन पदबंध संरचना व्याकरण, सामान्यीकृत पदबंध संरचना व्याकरण, कोटिकृत व्याकरण, अधिकार और अनुबंध व्याकरण, डिपेंडेंसी व्याकरण, मिनींग टेक्सट माडल, सूचना सिद्धांत, प्रिंसिपल एवं पैरामीटर, वृक्ष संलग्न प्रणाली, मानटेग व्याकरण, व्याकरण । २००० में कोरियन–अंग्रेजी वाक् से वाक् अनुवाद यंत्र की प्रोटोटाईप प्रणाली एम.आई.टी. (Massachusetts Institute of Technology : MIT) के लिकंल्न प्रयाेगशाला में यंग–शुक  और क्लीफार्ड वीन्सटाईन द्वारा विकसित की गयी । २००१ ई. में चीली देश में बोली जानेवाली क्रोशियन भाषा के लिए कार्नेगी मेलान विश्वविद्यालय के भाषा–प्रौद्योगिकी संस्थान के जेमी कारबोनेल  ने वाक् से वाक् अनुवाद प्रणाली तैयार की । जैव चिकित्सक अभियंता थियोडोर बर्जर और जिमषिह ने ‘तंत्रिकीय संजाल वाक् अभिज्ञान प्रणाली’ का विकास किया । २००२ में एक एजेंट आधारित न्यूजरीडर प्रणाली का विकास हुआ जिसमें आलेखों का अनुवाद कर उसे एमपीघ श्रव्य फाइल के रूप में परिवर्तित करना संभव हुआ था । २००८ ई. में रोड चिह्न, ट्रैफिक चिह्नों को तत्काल अनुवाद करने की सुविधा प्रदान की गई । २००९ ई. में जापानी से अंग्रेजी डाक्यूमेंटेशन अनुवाद क्रमादेश/प्रोग्राम की अंतिम कापी बनाई गई ।
भारत में मशीनी अनुवाद सर्वथा नवीन है । इस क्षेत्र में हो रहे शोध और विकास को आज लगभग दो दशक बीत चुके हैं । मशीनी अनुवाद के क्षेत्र में भारत के प्रयास को निम्न लिखित अनुप्रयोगों में देखा जा सकता है :
आई.आई.टी., सीडैक, पुणे और टीडीआइएल तथा अन्य संस्थाओं द्वारा किए गए कार्य :
मशीनी अनुवाद प्रणाली की सहायता से अनुवादकों को अपना कार्य अधिक तेजी से करने में सहायता मिली है ।
भारत में विभिन्न संस्थाओं/संगठनों द्वारा विकसित अंग्रेजी, हिन्दी तथा अन्य भाषाओं संबंधी विकसित मशीन अनुवाद प्रणालियाँ इस प्रकार हैं :
मंत्र–राजभाषा :
सी–डैक, पुणे ने ’मंत्र’ (Mantra) नामक मशीनी अनुवाद प्रणाली विकसित की है । यह प्रशासनिक, वित्तीय एवं कृषि क्षेत्र के अंग्रेजी पत्रों का हिन्दी अनुवाद करती है । मुख्यतः यह सरकारी कामकाज में इस्तेमाल होनेवाली भाषा का अनुवाद करने के लिए बनाया गया है । राज्यसभा में अनुवाद के लिए इस तकनीक का कई सालों से इस्तेमाल हो रहा है । गजट सूचना कार्यालयीन ज्ञापन, परिपत्रकें, कार्यालयीन पत्राचार वगैरा का अनुवाद होता है । मंत्र( राजभाषा (Machine assisted Translation tool : MANTRA Rajbhasha) नामक परियोजना को ‘प्रगत संगणन विकास केन्द्र, (C-DAC) पुणे ने ‘प्रौद्योगिकी’ के अंतर्गत राजभाषा विभाग, गृह मंत्रालय, भारत सरकार द्वारा विकसित किया है । इसे भारत सरकार द्वारा निधि उपलब्ध किया गया है । भारतीय संसद के उच्च सदन राज्यसभा सचिवालय के लिए १९९९ में डा. हेमन्त दरबारी और डा. महेन्द्र कुमार सी. पाण्डेय के निर्देशन में इसे सी/डैक, पुणे द्वारा विकसित किया गया है । यह प्रणाली प्रशासनिक दस्तावेजों, ज्ञापन, कार्यालय अध्यादेश, परिपत्र, अधिसूचना, प्रतिवेदन, प्रारूपण आदि को अंग्रेजी से हिंदी में अनुवाद करती है । वर्तमान में यह प्रणाली अंग्रेजी/बंग्ला, अंग्रेजी/तेलुगु, अंग्रेजी/गुजराती, हिंदी/बंगाली और हिंदी/अंग्रेजी, हिन्दी–नेपाली भाषा-युग्मों के लिए कार्य कर रही है । अंग्रेजी और हिंदी व्याकरण को प्रस्तुगत करने के लिए कोशीयकृत वृक्ष संलग्न व्याकरण का प्रयोग किया जाता है तथा पार्सिंग व प्रजनन के लिए वृक्ष संलग्न का प्रयोग होता है । यह प्रणाली संस्था तथा राजभाषा, गृह मंत्रालय की वेबसाइट्स पर उपलब्ध है ।
अनुसारक :
प्रो. राजीव संगल के निर्देशन में प्रारंभ हुई यह परियोजना सूचना प्रौद्योगिकी विभाग, संप्रेषण और सूचना प्रौद्योगिकी मंत्रालय, भारत सरकार, के भारतीय भाषाओं के लिए प्रौद्योगिकी विकास  परियोजना के अंतर्गत वित्तपोषित है । यह तेलुगु, कन्नड़, पंजाबी, मराठी और बंग्ला से हिंदी में अनुवाद प्रणाली के विकास हेतु बनाई गई है । पाणिनि व्याकरण के सिद्धांतों का प्रयोग करते हुए यह स्रोत भाषा से लक्ष्यं भाषा में लोकल वर्ड ग्रुप का प्रतिचित्रण कर, बच्चों की कहानियों का अनुवाद करती है । यह अनुवाद प्रणाली लैंग्वेज एक्सेसर कहलाती है, क्योंकि यह प्रमुख रूप से भारतीय भाषाओं के बीच भाषा को एक्सेस करती है । इसका उद्गम भारतीय प्रौद्योगिकी संस्थान, कानपुर, १९९५ में हुआ, फिर बाद में स्कूल आफ ह्यूमेनिटी, हैदराबाद विश्वविद्यालय और अंतरराष्ट्रीय सूचना प्रौद्योगिकी संस्थान, हैदराबाद के भाषा÷प्रौद्योगिकी अनुसंधान केंद्र में परिवर्तित हुआ । यह प्रणाली संस्था की वेबसाइट http;//www.iiit.net/Itrc/Anusaaraka/anu-home.html पर उपलब्ध है ।
बेबीलान १०ः
‘बेबीलान १०’ चर्चित अनुवाद परावस्तु है । अंग्रेजी/हिंदी के साथ अन्य भारतीय भाषाओं में भी अनुवाद किया जा सकता है । परावस्तु/साफ्टवेयर धारापति/आनलाइन एवं अधारापति/आफलाइन दोनों रूपों में मौजूद होता है । इस साफ्टवेयर का मुख्य पृष्ठ खुलने पर विविध विकल्प दिखाई देते हैं । स्रोत भाषा Source Language तथा लक्ष्य भाषा Target language के विकल्प को चुनने के बाद नीचे अनुवाद Translate पर क्लिक करने से अनुवाद की शुरुआत होती है । यह एक अंतरराष्ट्रीय आनलाइन एवं आफलाइन परियोजना है । इसमें कई भाषाओं के साथ हिंदी भी शामिल है ।
स्टार्स २१ः
इसकी एक खासियत है कि इसके मुख्य पृष्ठ पर जाते ही अन्य बेबीलान, बिंग ट्रांसलेटर, गूगल ट्रांसलेटर आदि के द्वारा भी हम अनुवाद कर सकते हैं । अन्य सभी परावस्तुओं के उपकरण/टूल्स इस पृष्ठ पर मौजूद हैं । इससे हम एक साथ अन्य परावस्तुओं में अनुवाद कार्य को कर अधिक सुविधाएं प्राप्त कर सकते हैं ।
आंग्लभारती ः
अंग्रेजी से भारतीय भाषाओं में अनुवाद करने वाली मशीन साधित अनुवाद प्रणाली हेतु १९९१ में भारतीय प्रौद्योगिकी संस्थान, कानपुर द्वारा ‘आंग्लभारती परियोजना’ आरंभ की गई थी । भारत में यंत्रानुवाद क्षेत्र में किया जानेवाला यह पहला कार्य था । इसका पहला प्रोटोटाईप अंग्रेजी से तमिल के लिए बनाया गया और बाद में इसे अंग्रेजी से हिंदी के लिए भी प्रयोग लिया जाने लगा । भाषिक नियम अभिगम और संदर्भ निरपेक्ष व्याकरण का प्रयोग कर इस प्रणाली का कुछ विशेष क्षेत्रों / जैसे ः स्वास्थ्य अभियान, नियमित कार्यालयी पत्राचार आदि में प्रयोग किया जाता है । बाद में इसमें उदाहरण आधारित अभिगम के साथ पश्च संपादन की व्यवस्था भी जोड दी गयी । सोपान २ में आंग्ल भारती ।। विकसित की गई ।
अनुभारती ः
१९९५ में प्रो. सिन्हा ने ‘अनुभारती’ प्रविधि का आरंभ किया । २००४ में चरण/२ के अंतर्गत अनुभारती/ ।। विकसित की गई । अनुभारती/ ।। का ढाँचा सामान्यीकृत पदानुक्रमिक उदाहरण आधारित एवं टेम्पलेट आधारित है । भूतकालिक अनुभव से उदाहरण आधारित अभिगम के रूप में यह ज्ञान को भंडारित करती है तथा भविष्य में इसका प्रयोग करने के लिए मानव अभिगम प्रक्रिया को अपनाती है । संगणकसाधित/मशीनसाधित अनुवाद के लिए विकसित यह ‘अनुभारती प्रौद्योगिकी’ विविध उदाहरण एवं कार्पस आधारित अभिगम और प्रारंभिक व्याकरणिक विश्लेषण के संयोजन के साथ एक संकरित उदाहरण आधारित अभिकलित्र/मशीनी अनुवाद अभिगम है । यह अनुवाद प्रणाली हिंदी से अन्य भाषाओं में अनुवाद करने के लिए विकसित की गई है । आंग्लभारती/ ।। संकरण के लिए कच्चा उदाहरण आधार के अतिरिक्त सामान्यीकृत उदाहरण आधार का प्रयोग करती है ।
बिंग ट्रांसलेटर :
यह भी एक चर्चित अनुवाद परावस्तु है । बिंग डॉट कॉम का पृष्ठ खुलने पर अनुवादक विकल्प को चुनने के साथ जिस भाषा से अनुवाद करना है और जिस भाषा में करना है उस भाषा को चुनता है । फिर अनुवाद/Translation इस विकल्प पर क्लिक करने से अनुवाद की प्रक्रिया आरंभ हो जाती है । गूगल की तरह ही माइक्रोसाफ्ट ने भी अनुवाद र ट्रांसलेशन की तकनीक पर काफी काम किया है । उसके खोज इंजन/सर्च इंजन में धारापथी अनुवाद/ऑनलाइन ट्रांसलेशन की सुविधा है । इस परावस्तु की विशेषताएँ इस प्रकार हैं । १.अनुवाद/ट्रांसलेशन की शुद्धता गूगल से थोड़ी कम २. हिंदी से अंग्रेजी और अंग्रेजी से हिंदी अनुवाद/ट्रांसलेशन संभव ३.वेब पेजों का अनुवाद/ट्रांसलेशन भी किया जा सकता है ।
संपर्क ः
‘संपर्क’ नामक परियोजना के अंतर्गत अंतरराष्ट्रीय सूचना/प्रौद्योगिकी संस्थान, हैदराबाद द्वारा एक मशीनी अनुवाद प्रणाली का विकास किया गया है, जो चार भाषा युग्मों हिंदी से पंजाबी, पंजाबी से हिंदी, उर्दू से हिंदी और तेलुगु से तमिल में अनुवाद करता है । भारत के पूर्व राष्ट्रपति डा. ए.पी.जे. अब्दुल कलाम द्वारा ३० मार्च २०११ को इसके प्रथम सेट का उद्घाटन हुआ है । वर्ष २००९ में इस परियोजना के अंतर्गत भारतीय भाषाओं के मध्य विकसित होने वाली अनुवाद प्रणालियों के लिए संस्थाओं के संघ निर्मित किए गए हैं । इनके नाम हैं, अंतरराष्ट्रीय सूचना/प्रौद्योगिकी संस्थान, हैदराबाद, हैदराबाद विश्वविद्यालय, प्रगत संगणन विकास केंद्र (नोएडा, पुणे), भारतीय प्रौद्योगिकी संस्थान, कानपुर, भारतीय प्रौद्योगिकी संस्थान, खड़गपुर, अन्ना विश्वविद्यालय  के.बी.सी. अनुसंधान केंद्र, चेन्नई , भारतीय विज्ञान संस्थान, बंगलौर, भारतीय सूचना प्रौद्योगिकी संस्थान, इलाहाबाद, जाधवपुर विश्वविद्यालय, तमिल विश्वविद्यालय ।
आई एम् ट्रांसलेटर :
यह भी एक चर्चित अनुवाद परावस्तु है । आई एम् ट्रांसलेटर का पृष्ठ खुलने पर अनुवादक विकल्प को चुनने के साथ जिस भाषा से अनुवाद करना है और जिस भाषा में करना है उस भाषा को चुनना पड़ता है । फिर अनुवाद Translation विकल्प पर क्लिक करने से अनुवाद की प्रक्रिया आरंभ हो जाती है ।
अनुवादक :
सुपर इंफोसाफ्ट प्राईवेट लिमिटेड, दिल्ली द्वारा श्रीमती अंजली रावचौधरी के निर्देशन में विकसित अंग्रेजी से हिंदी अनुवाद करने वाला अनुवादक ५० पश्च संपादन में सहायक है । इसके अंदर प्रशासनिक, कार्यालयी, भाषावैज्ञानिक, तकनीकी क्षेत्रों से संबंधित कोश रखे गए हैं । इस साफ्टवेयर को विंडो के किसी भी आपरेटिंग प्रणाली पर चलाया जा सकता है । यह प्रणाली वैबसाइट पर उपलब्ध है ।
वल्र्ड लिंगो ट्रांसलेटर :
यह अनुवाद परावस्तु है । अन्य अनुवाद अनुप्रयोगों की तरह ही ‘वल्र्ड लिंगो ट्रांसलेटर’ अनुवाद कार्य सम्पन्न करता है । पृष्ठ खुलने पर अनुवादक विकल्प को चुनने के साथ जिस भाषा से अनुवाद करना है और जिस भाषा में करना है Translate from, Translate to उस भाषा को चुना जाता है । फिर अनुवाद Translate विकल्प पर क्लिक करने से अनुवाद की प्रक्रिया आरंभ हो जाती है ।
यू.एन.एल. आधारित मशीनी अनुवाद प्रणाली
भारतीय प्रौद्योगिकी संस्थान, मुंबई द्वारा ‘यूनिवर्सल नेटवर्किंग लैंग्वेज’  आधारित यह प्रणाली प्रो. पुष्पक भट्टाचार्या के निर्देशन में विकसित की गई है । यह यूनिवर्सल नेटवर्किंग लैंग्वेज रूपवाद (Formalism) को अंग्रेजी/हिंदी और बंगाली अनुवाद के लिए अंतरभाषा के रूप में प्रयोग करती है । यह एक अंतरराष्ट्रीय परियोजना है, जिसका लक्ष्य सभी प्रमुख मानव भाषाओं के लिए एक अंतरभाषा का निर्माण करना है । अन्य दो प्रणालियों यू.एन.एल. से हिंदी और हिंदी से यू.एन.एल. का प्रदर्शन इसकी साइट पर किया जा चुका है ।
अनुवाद हाईब्रिड मशीनी अनुवाद
इस प्रणाली को डा.बंदोपाध्याय के निर्देशन में कंप्यूटर विज्ञान इंजीनियरिंग विभाग, जाधवपुर विश्वविद्यालय  द्वारा वर्ष २००४ में विकसित किया गया । यह प्रणाली उदाहरणआधारित मशीनी अनुवाद अभिगम का प्रयोग कर अंग्रेजी समाचारों के शीर्षक को बंगाली में अनुवाद करती है । वर्तमान में यह प्रणाली वाक्य स्तर तक कार्य कर रही है । यह प्रणाली संस्था की वेबसाइट http://www.jadavpur.edu/ पर उपलब्ध है ।
मात्रा २ :
सामान्य रूप में प्रयुक्त की जानेवाली भाषा का अनुवाद /ट्रांसलेशन करने के लिए एनसीएसटी, सी/डैक, मुंबई आदि के सहयोग से विकसित ‘मात्रा २’ प्राजेक्ट छोटे वाक्यों के अनुवाद/ट्रांसलेशन में बेहतर उपलब्धि/रिजल्ट देता है । MaTra को दो प्रकार से प्रयुक्त किया जा सकता है । स्वचालित स्वरूप में यह प्रणाली बहुत ही अच्छा अनुवाद उपलब्ध कराता है जिसे बाद में उपयोगकर्ता द्वारा संपादित किया जा सकता है । हस्तचालित स्वरूप में उपयोगकर्ता GUI का प्रयोग करता है । इस उपकरण का उपयोग खबरों के अनुवाद / ट्रांसलेशन में काफी अच्छा होता है । कविता मोहनराज के निर्देशन में अंग्रेजी/हिंदी में अनुवाद करनेवाली मानवसाधित अंतरण आधारित मात्रा (MaTra) अनुवाद प्रणाली का विकास २००४ में ज्ञान आधारित कंप्यूटर अनुभाग के प्राकृतिक भाषा समूह द्वारा राष्ट्रीय साफ्टवेयर प्रौद्योगिकी केन्द्र  में किया गया है । अब यह प्रगत संगणन विकास केंद्र (C-DAC) मुंबई नाम से पहचाना जाता है । समाचारों, वार्षिक प्रतिवेदनों और तकनीकी पदबंधों के क्षेत्र में कार्य करनेवाली यह प्रणाली अंग्रेजी परसर्गों का हिंदी परसर्गों में प्रतिरूप करती है । इसे भारतीय भाषाओं के प्रौद्योगिकी विकास  द्वारा विकास निधि उपलब्ध हुआ है । यह प्रणाली संस्था के साइट http://www.ncst.ernet.in/matra / पर उपलब्ध है ।
शक्तिः
कार्नेगी मेलान विश्वविद्यालय, भारतीय विज्ञान संस्थान, बंगलौर और अंतरराष्ट्रीय सूचना प्रौद्योगिकी संस्थान, हैदराबाद के सहयोग से अनुवाद प्रणाली विकसित की गयी है । इस प्रणाली में भाषावैज्ञानिक विश्लेषण के साथ-साथ सांख्यिकी पद्धति का प्रयोग किया गया है । यह तीन लक्ष्य भाषाओं हिंदी, मराठी और तेलुगु के लिए कार्य करता है ।
संस्कृत सुबंत अभिज्ञानक और विश्लेषक
जवाहरलाल नेहरू विश्वविद्यालय, नई दिल्ली के संस्कृत अध्ययन केन्द्र के एम. फिल. डिग्री के अंतर्गत शोधार्थी सुभाष चंद्रा द्वारा यह आनलाइन उपकरण तैयार किया गया है, जिसे इसकी वेबसाइट http://sanskrit.jnu.ac.in/subanta/rsubanta.jsp  से प्राप्त किया जा सकता है ।
अभिकलनात्मक या मशीनी अनुवाद ः
अभिकलनात्मक या मशीनी अनुवाद प्रणाली प्राकृतिक भाषा संसाधन अनुप्रयोगों में से एक है । इसके विकास हेतु वाक् और पाठ दोनों स्तरों पर अनेक प्रकार के मापांक, उपकरण और साफ्टवेयर की आवश्यकता होती है । इनका विकास या निर्माण कार्य अनेक संस्थाओं में चल रहा है एवं विभिन्न परियोजनाओं के अंतर्गत इन्हें विकास निधि उपलब्ध होता है । भारतीय भाषाओं के लिए प्रौद्योगिकी विकास  परियोजना के अंतर्गत अभिकलनात्मकरसंगणकीय या मशीनी अनुवाद के लिए कई उपकरणों का विकास किया गया है । स्रोत (समानांतर : Parallel ) कारपोरा, बहुभाषिक कोश, कोशीय स्रोत), ज्ञान उपकरण (भाषा संसाधन उपकरण, अनुवाद स्मृति उपकरण), अनुवाद सहायक प्रणाली ( बहुभाषिक सूचना एक्सेस आदि ), मानव/मशीन अंतरापृष्ठ प्रणाली (संप्रतीक अभिज्ञान प्रणाली, वाणी अभिज्ञान प्रणाली, पाठ से वाक् प्रणाली), स्थानीयीकरण , भाषा/प्रौद्योगिकीय मानव स्रोत विकास (प्राकृतिक भाषा संसाधन और अभिकलनात्मक भाषावि में मानवशक्ति का विकास) मानकीकरण के क्षेत्र में विकास किया जा चुका है ।
भारतीय भाषा संस्थान, मैसूर द्वारा पाठ कारपोरा विकसित किया गया है । भारतीय भाषाओं में पाठगत (Texual) कारपोरा के संकलन हेतु का कारपोरा विकास कार्य अनेक संस्थाओं में चल रहा है । भारतीय भाषा संस्थान, मैसूर द्वारा ‘कथाभारती’, भारतीय क्लासिक अनुवाद हेतु ‘अनुकृति’ डाटाबेस का निर्माण और ‘भाषा–भारती’ नामक ग्रंथालय स्रोतों का अंकीकरण, प्रगत संगणन विकास केंद्र (C-DAC), नोएडा द्वारा ‘ज्ञान निधि’ नामक समानान्तर पाठगत कारपोरा का निर्माण, ई.एम.एल.ई.  द्वारा लिखित एवं वाचिक डाटा का संग्रह किया जा रहा है । वाचिक कारपोरा के संकलन हेतु के कार्य निम्नलिखित संस्थाओं में चल रहे हैं । प्रगत संगणन विकास केंद्र , कोलकाता तथा पुणे द्वारा असमी और मणिपुरी भाषा में वाक्–संश्लेषक और स्वचालित वाक्–अभिज्ञान प्रणाली का निर्माण और असमिया ओपन आफिस –कार्यालयीन पत्राचार कार्पोरा , एच.पी. लैब  द्वारा पाठ से वाक् प्रणाली के लिए हिंदी और अंग्रेजी डाटाबेस निर्माण, स्वरचालित वाक्अभिज्ञान प्रणाली के लिए असमी और भारतीय अंग्रेजी डाटाबेस का निर्माण । संप्रति अंतरराष्ट्रीय सूचना-प्रौद्योगिकी संस्थान, हैदराबाद के संयुक्त तत्वावधान में मराठी, तमिल और तेलुगु का डाटाबेस कार्य जारी । भारतीय प्रौद्योगिकी संस्थान, मुंबई में ‘वाणी’ नामक पाठ से वाक् प्रणाली का निर्माण, सी.एफ.एस.एल चंडीगढ़ द्वारा अंग्रेजी और हिंदी के लिए वक्ता अभिज्ञान डाटाबेस का निर्माण, आई.सी.एस. हैदराबाद द्वारा संवादात्मक वाणी प्रतिक्रिया  प्रणाली का विकास किया जा रहा है । भारतीय प्रौद्योगिकी संस्थान, मद्रास में हिंदी और तेलुगु समाचार बुलेटिन का निर्माण, टाटा अनुसंधान संस्थान , मुंबई द्वारा वाक्–अभिज्ञानक, वाक्–संश्लेषक, भाषा÷मॉडलिंग और वाक्डा/टाबेस का निर्माण कार्य शुरु है । लखनऊ द्वारा हिंदी वाक्–संश्लेषक का निर्माण, वेबल मीडियाट्रानिक्स , कोलकाता द्वारा हिंदी, बंगाली वाक् संश्लेषक का निर्माण किया जा रहा है । प्रगत संगणन विकास केंद्र, नोएडा तथा वैज्ञानिक एवं तकनीकी शब्दावली आयोग, नई दिल्ली द्वारा हिंदी विश्वकोश, अंग्रेजी–हिंदी शब्दकोश, भारत भाषा शब्दकोश, संस्कृत–हिंदी इलैक्ट्रानिक द्विभाषी शब्दकोश निर्माण कार्य प्रारंभ हो रहा है । नागरी प्रचारणी सभा, वाराणसी द्वारा प्रकाशित हिंदी विश्वकोश का आनलाइन प्रदर्शन केंद्रीय हिंदी संस्थान, आगरा एवं प्रगत संगणन विकास केंद्र की संयुक्त परियोजना के अंतर्गत किया जा चुका है । भारतीय प्रौद्योगिकी संस्थान, मुंबई ‘हिंदी शब्द संजाल’ के लिए कार्य कर रहा है । ‘अक्षर’, ‘शब्दमाला’, ‘शब्दरत्न’, ‘आलेख’, ‘भारती’, ‘मल्टीवर्ड ’ आदि शब्द संसाधन के साथ–साथ ‘जिस्ट’ तकनीक (ग्राफिक एंड इंडियन स्क्रिप्ट टर्मिनल–सी–डैक, पुणे) पर कई हार्डवेयर युक्तियों का विकास किया जा चुका है । पाठ–संसाधन के क्षेत्र में संस्कृत विद्वानों के प्रयोग के लिए ‘संस्कृत शब्द संसाधक’ और ‘संस्कृत संलेखन प्रणाली’ विकसित की जा रही है । संस्कृत भाषा के लिए ‘देशिका’ नामक सॉफ्टवेयर पैकेज विकसित किया गया है जो प्राचीन भारतीय विज्ञान के सिद्धांतों पर आधारित है । संस्कृत–हिंदी मशीनी अनुवाद का विकास किया जा रहा है । सी.बी.एस.ई के माध्यमिक और उच्च माध्यमिक विद्यालयों के सूचना–प्रौद्योगिकी पाठ्यक्रम में भारतीय भाषाओं को स्थान देने में भी सूचना–प्रौद्योगिकी मंत्रालय का योगदान है । बी.ए. और एम.ए. स्तर पर प्रयोजनमूलक हिंदी के लिए भी सूचना–प्रौद्योगिकीय पाठ्यक्रम निर्मित किए जा रहे हैं । बनस्थली विद्यापीठ द्वारा मशीन पठित रूप में ‘ओ’ स्तर के लिए हिंदी कंप्यूटर कोर्सवेयर का विकास हो चुका है । हिन्दी विभाग, शिवाजी विश्वविद्यालय, कोल्हापुर(महाराष्ट्र में २०१६–१७ वर्ष में एम.ए.‘भाषा प्रौद्योगिकी’ पाठ्यक्रम शुरु हो चुका है । विश्वविद्यालय अनुदान आयोग द्वारा बारहवीं पंचवार्षिक योजनांतर्गत हिन्दी विभाग के आधुनिकीकरण तथा सक्षमीकरण के लिए रु. ५४ लाख मंजूर हुये हैं । मराठी हिन्दी पदबंध , लोकोक्ति कोश कार्य तथा साहित्य कृतियों पर आधारित लघुपट निर्माण कार्य सम्पन्न हो रहा है । भारतीय प्रौद्योगिकी संस्थान, कानपुर द्वारा भारतीय परंपरा को केंद्र में रखकर ‘उपनिषद् और ‘भगवदगीता’ के संपूर्ण पाठ को एक उन्नत वेबसाइट के माध्यम से प्रस्तुत किया गया है ।
मानव–मशीन अंतरापृष्ठ प्रणाली के विकास के अंतर्गत केंद्रीय इलेक्ट्रानिक इंजीनियरिंग अनुसंधान संस्थान, नई दिल्ली द्वारा सुर, अनुतान जैसे स्वन गुण से युक्ति ‘हिंदी वाणी’ नामक पाठ से वाक् परिवर्तन साफ्टवेयर विकसित किया गया है । अमेरिका द्वारा एक ऐसे तंत्र का विकास किया जा रहा है, जो वाचिक भाषा को संकेत में परिवर्तित कर शीघ्रता से अनुवाद करने में सक्षम है । अनुवाद सहायक प्रणाली के विकास के अंतर्गत ‘प्रबंधिका’ नामक कार्पस प्रबंधक, ‘लेखिका’ भारतीय भाषा शब्द संसाधक का विकास हुआ है । आंग्लभारती मिशन के अंतर्गत मशीनसाधित मशीनी अनुवाद के विकास के लिए अंग्रेजी से भारतीय भाषाओं में अनुवाद के लिए कार्य प्रारम्भ किया गया है । इनमें भारतीय प्रौद्योगिकी संस्थान, मुंबई आंग्ल–मराठी और आंग्ल–कोंकणी पर, भारतीय प्रौद्योगिकी संस्थान, गुवाहाटी आंग्ल–असमी और आंग्ल–मणिपुरी पर, सी–डैक, पुणे आंग्ल–सिंधी, आंग्ल–उर्दू और आंग्ल–कश्मीरी पर, सी–डैक, कोलकाता आंग्ल–बंग्ला पर, सी–डैक, तिरूवनंतपुरम आंग्ल–मलयालम पर, थापर अभियांत्रिकी एवं प्रौद्योगिकी संस्थान, पंजाब आंग्ल–पंजाबी पर, जवाहरलाल नेहरू विश्वविद्यालय, नई दिल्ली, आंग्ल–संस्कृत पर कार्यरत हैं । माइक्रोसाफ्ट द्वारा माइक्रोसाफ्ट शोध–मशीनी अनुवाद (MicrosoftResearch Machine Translation : MSR-MT) नामक एक डाटा–चालित (Data Driven) अनुवाद प्रणाली विकसित की गई है । इस प्रणाली के पद–विच्छेदक (Parser) सात भाषाओं अंग्रेजी, फ्रेंच, जर्मन, कोरियन, जापानी, चीनी और स्पेनिश एवं जेनरेटर (Generator) पांच भाषाओं अंग्रेजी, फ्रेंच, जर्मन, जापानी और स्पेनिश में उपलब्ध है । माइक्रोसाफ्ट अनुवादक प्रौद्योगिकी द्वारा बिंग अनुवादक (Bing Translator) नामक सेवा उपलब्ध कराई गई है, जो पूरे पाठ या वेबपृष्ठ को विभिन्न भाषाओं में अनुवाद करती है । स्थानीयीकरण (Localization) हेतु विभिन्न साफ्टवेयर एवं प्लेटफार्म पर निजी क्षेत्रों और कंपनियों द्वारा प्रयास चल रहे हैं । सी–डैक, माड्यूलर, इंफोटेक द्वारा अनेक भारतीय भाषा प्रोसेसिंग साफ्टवेयर पैकेज विकसित किए गए हैं । सोनाटा, शिखर, साफ्टेक, वेब दुनिया, इंड–लिनक्स, सरल साफ्ट आदि ।
भाषा की तकनीकी तेजी से बढ़ रही है । अनुवाद के लिए संगणक का प्रयोग हो रहा है । हिंदी के वैज्ञानिकों के साथ साहित्यकारों तथा अनुवादकों को इस दिशा में समय के साथ चलने की जरूरत है । संगणक में भाषा संसाधन के लिए विकसित भाषा–विश्लेषण नमूनों/ माडलों और भाषिक अनुप्रयोगों द्वारा संगणक और भाषा दोनों क्षेत्रों के वैज्ञानिकों को चिंतन के लिए एक ही वैचारिक पृष्ठभूमि देने का अवसर प्रदान किया जा रहा है । मशीनी अनुवाद की संकल्पना, वर्तमान में निश्चित ही अधिक सशक्त बनती जाएंगी । निष्कर्षतः अभिकलनात्मक/मशीनी अनुवाद के लिए विश्व के कई देशों और संस्थानों, विश्वविद्यालयों में कार्य चल रहे हैं और उसमें बहुत विकास होता जा रहा है । आज मानव अभिकलनात्मक/संगणकीय/मशीनी अनुवाद पर निर्भर रह सकता है ।
लेखिका परिचय
अध्यक्ष, हिंदी विभाग, शिवाजी विश्वविद्यालय, कोल्हापुर
संसाधन विशेषज्ञ, सबरगमुवा विश्वविद्यालय, श्रीलंका, भारतीय विद्या संस्थान, वेस्ट इंडीज
तुरिन विश्वविद्यालय, इटली

संदर्भ संकेतः
( डॉ.पाटील पद्मा, ‘भाषा, साहित्य और प्रौद्योगिकी’, ’शोध’ पत्रिका, हिन्दी विभाग, शिवाजी विश्वविद्यालय, कोल्हापुर, २०१३
(विविध वेबसाइट ः सी –डैक, पुणे, नोएडा, बंगलोर, गोहाटी ।

आप हमें फ़ेसबुक, ट्विटर और यूट्यूब पर फ़ॉलो भी कर सकते हैं.

Leave a Reply

avatar
  Subscribe  
Notify of