সফটওয়্যার

অনুবাদ ব্যবস্থায় এআই- এর ব্যবহারে মাইক্রোসফটের ঐতিহাসিক মাইলফলক অর্জন

By Baadshah

March 23, 2018

অতি সম্প্রতি মাইক্রোসফটের একদল গবেষক জানিয়েছেন তারা ‘মেশিন ট্রান্সলেটরে’ কৃত্রিম বুদ্ধিমত্তা (এআই) ব্যবহার করে চীনা থেকে ইংরেজি ভাষায় অনুবাদের ক্ষেত্রে মানুষের সমান নির্ভুল দক্ষতা অর্জন করেছেন। প্রতিষ্ঠানটির এশিয়া ও যুক্তরাষ্ট্রের ল্যাবের গবেষকরা জানিয়েছেন, তাদের এ অনুবাদ ব্যবস্থা ‘নিউজটেস্ট ২০১৭’ শীর্ষক লেখার পরীক্ষায় মানুষের সমান দক্ষতা অর্জন করেছে। এ অনুবাদ ব্যবস্থার উন্নয়নে এ শিল্পখাত সংশ্লিষ্ট পেশাদার ও অ্যাকাডেমিক পার্টনাররা অংশগ্রহণ করেছেন। ডব্লিউএমটি১৭ – গবেষণা সম্মেলনে এ অনুবাদ ব্যবস্থার ফলাফল উন্মোচন করা হয়। এ ফলাফলের যথার্থতা যাচাইয়ে বাইরে থেকে দোভাষী মূল্যায়নকারীদের নিয়োগ দেয়া হয়, যারা মাইক্রোসফটের ফলাফলের সাথে মানুষের করা অনুবাদের ফলাফলের তুলনামূলক মূল্যায়ন করে দেখেন। মেশিন অনুবাদের সমস্যা সমাধানে গবেষকরা গত চার দশক ধরে কাজ করছে। এছাড়াও, গবেষকরা জানিয়েছেন, এ মাইলফলক অর্জনই প্রমাণ করে মেশিন অনুবাদ এক্ষেত্রে একটি যুগান্তকারী সমাধান। মাইক্রোসফট রিসার্চ এশিয়ার সহকারী ব্যবস্থাপনা পরিচালক মিং ঝৌ এবং এ প্রকল্পে কাজ করা ন্যাচারাল ল্যাঙ্গুয়েজ প্রসেসিং গ্রুপের প্রধান জানিয়েছেন, ডাটাসেটের ক্ষেত্রে মানুষের সমতুল্য হবার মাইলফলক অর্জেন আমরা রোমাঞ্চিত। তবে, এক্ষেত্রে এখনও অনেক প্রতিকূলতাই সামনে রয়েছে যেমন, রিয়াল-টাইম নিউজ স্টোরিতে ফলাফল যাচাইয়ের ব্যবস্থা।

ডুয়াল লার্নিং, ডেলিবারেশন, জয়েন্ট ট্রেইনিং এবং অ্যাগ্রিমেন্ট রেগুলারাইজেশন

যদিও, অ্যাকাডেমিক রিসার্চার ও গবেষকরা অনুবাদের ওপর বহুবছর ধরেই কাজ করছে। তবে, তারা সম্প্রতি ডিপ নিউরাল নেটওয়ার্কস শীর্ষক ট্রেইনিং এআই সিস্টেম ব্যবহার করে গুরুত্বপূর্ণ সাফল্য অর্জন করেছেন। যা তাদের সুযোগ করে দিয়েছে আরও আগের চেয়েও বৃহত্তর প্রেক্ষিতে স্বতঃস্ফূর্ত ও স্বাচ্ছন্দ্যপূর্ণ অনুবাদে। যেটা স্ট্যাটিস্টিক্যাল মেশিন অনুবাদ নামে পরিচিত। ডাটাসেটে মানুষের সমতুল্য দক্ষতা অর্জনের মাইলফলক অর্জনে সংখ্যা যোগ করার ক্ষেত্র পাশাপাশি, প্রশিক্ষণ পদ্ধতি ব্যবহার করে অনুবাদ ব্যবস্থাকে আরও নিখুঁত করতে বেইজিং ও ওয়াশিংটনের রেডমন্ডে মাইক্রোসফটের তিনটি গবেষণা দল একসাথে কাজ করেছে। অনেকক্ষেত্রেই এ পদ্ধতি একদম সঠিক না হওয়া পর্যন্ত মানুষের উচ্চারণভঙ্গি অনুসরণ করবে । মেশিন অনুবাদে মাইক্রোসফট আরেকতি যে পদ্ধতি ব্যবহার করেছে সেটু হচ্ছে ডুয়াল লার্নিং। এটা এক ধরনের তথ্য যাচাইয়ের মতো কাজ করে। প্রতিবার সিস্টেমে চীনা ভাষা থেকে ইংরেজি ভাষায় অনুবাদের জন্য কোনো বাক্য দেয়া হলে, গবেষণা দল বাক্যকে আবার ইংরেজি থেকে চীনা ভাষায় অনুবাদ করেন। স্বয়ংক্রিয়ভাবে অনুবাদের ক্ষেত্রে যথার্থতা নির্ণয়ে মানুষ সাধারণত এ পদ্ধতিই ব্যবহার করে। এর পাশাপাশি, এটা সিস্টেমকে সুযোগ করে দিবে নিজ থেকে ভুল ঠিক করে নেয়ার। ডুয়াল লার্নিং পদ্ধতিও উদ্ভাবন করেছে মাইক্রোসফটেরর গবেষণা দল। এ উদ্ভাবন অন্যান্য কাজের ক্ষেত্রেও কৃত্রিম বুদ্ধিমত্তাগত সহায়তায় ব্যবহারযোগ্য। অন্য একটি পদ্ধতি হচ্ছে, ডেলিবারেশন নেটওয়ার্কস। এটা মানুষের নিজের লেখা বারবার পড়ার মাধ্যমে সম্পাদনা ও সংশোধন করার মতো। গবেষকরা মেশিনকে শিক্ষা দিয়েছেন ত্রুটিহীন হওয়ার আগ পর্যন্ত অনুবাদের ক্ষেত্রে কিভাবে একই বাক্যের পুনরাবৃত্তি করতে হয়। আরেকটি পদ্ধতি হচ্ছে, মেশিন অনুবাদে ইংরেজি থেকে চীনা এবং চীনা থেকে ইংরেজি ভাষার অনুবাদ ব্যবস্থায় জয়েন্ট ট্রেইনিং কৌশল ব্যবহার করা হয়েছে। এ পদ্ধতি ব্যবহার করা হয় ইংরেজি থেকে চীনা ভাষার অনুবাদের ক্ষেত্রে নতুন ইংরেজি বাক্য অনুবাদ করে চীনা ভাষায় নতুন বাক্যের সাথে জোড়া লাগানোর ক্ষেত্রে। এই একই প্রক্রিয়া ঘটে ইংরেজি থেকে চীনা ভাষায় অনুবাদের ক্ষেত্রে। এতে করে দুই ধরনের অনুবাদেই দক্ষতা ক্রমান্বয়ে বাড়তে থাকবে। মেশিন অনুবাদে ব্যবহৃত আরেকটি পদ্ধতি হচ্ছে, অ্যাগ্রিমেন্ট রেগুলারাইজেশন। এ পদ্ধতির মাধ্যমে, সিস্টেম বাম থেকে ডান কিংবা ডান থেকে বামে পড়ার মাধ্যমে অনুবাদ করতে পারে। এ কৌশল যদি একই অনুবাদের ক্ষেত্রে ব্যবহৃত হয় তবে, তবে এটা অনুবাদের ফলাফলকে বিশ্বাসযোগ্য করে তুলে। অনুবাদের সঠিক ছন্দ ধরে রাখার ক্ষেত্রে এ কৌশল অত্যন্ত কার্যকরী।