অনুবাদ ব্যবস্থায় এআই- এর ব্যবহারে মাইক্রোসফটের ঐতিহাসিক মাইলফলক অর্জন

অতি সম্প্রতি মাইক্রোসফটের একদল গবেষক জানিয়েছেন তারা ‘মেশিন ট্রান্সলেটরে’ কৃত্রিম বুদ্ধিমত্তা (এআই) ব্যবহার করে চীনা থেকে ইংরেজি ভাষায় অনুবাদের ক্ষেত্রে মানুষের সমান নির্ভুল দক্ষতা অর্জন করেছেন। প্রতিষ্ঠানটির এশিয়া ও যুক্তরাষ্ট্রের ল্যাবের গবেষকরা জানিয়েছেন, তাদের এ অনুবাদ ব্যবস্থা ‘নিউজটেস্ট ২০১৭’ শীর্ষক লেখার পরীক্ষায় মানুষের সমান দক্ষতা অর্জন করেছে। এ অনুবাদ ব্যবস্থার উন্নয়নে এ শিল্পখাত সংশ্লিষ্ট পেশাদার ও অ্যাকাডেমিক পার্টনাররা অংশগ্রহণ করেছেন। ডব্লিউএমটি১৭ – গবেষণা সম্মেলনে এ অনুবাদ ব্যবস্থার ফলাফল উন্মোচন করা হয়। এ ফলাফলের যথার্থতা যাচাইয়ে বাইরে থেকে দোভাষী মূল্যায়নকারীদের নিয়োগ দেয়া হয়, যারা মাইক্রোসফটের ফলাফলের সাথে মানুষের করা অনুবাদের ফলাফলের তুলনামূলক মূল্যায়ন করে দেখেন। মেশিন অনুবাদের সমস্যা সমাধানে গবেষকরা গত চার দশক ধরে কাজ করছে। এছাড়াও, গবেষকরা জানিয়েছেন, এ মাইলফলক অর্জনই প্রমাণ করে মেশিন অনুবাদ এক্ষেত্রে একটি যুগান্তকারী সমাধান। মাইক্রোসফট রিসার্চ এশিয়ার সহকারী ব্যবস্থাপনা পরিচালক মিং ঝৌ এবং এ প্রকল্পে কাজ করা ন্যাচারাল ল্যাঙ্গুয়েজ প্রসেসিং গ্রুপের প্রধান জানিয়েছেন, ডাটাসেটের ক্ষেত্রে মানুষের সমতুল্য হবার মাইলফলক অর্জেন আমরা রোমাঞ্চিত। তবে, এক্ষেত্রে এখনও অনেক প্রতিকূলতাই সামনে রয়েছে যেমন, রিয়াল-টাইম নিউজ স্টোরিতে ফলাফল যাচাইয়ের ব্যবস্থা।

ডুয়াল লার্নিং, ডেলিবারেশন, জয়েন্ট ট্রেইনিং এবং অ্যাগ্রিমেন্ট রেগুলারাইজেশন

যদিও, অ্যাকাডেমিক রিসার্চার ও গবেষকরা অনুবাদের ওপর বহুবছর ধরেই কাজ করছে। তবে, তারা সম্প্রতি ডিপ নিউরাল নেটওয়ার্কস শীর্ষক ট্রেইনিং এআই সিস্টেম ব্যবহার করে গুরুত্বপূর্ণ সাফল্য অর্জন করেছেন। যা তাদের সুযোগ করে দিয়েছে আরও আগের চেয়েও বৃহত্তর প্রেক্ষিতে স্বতঃস্ফূর্ত ও স্বাচ্ছন্দ্যপূর্ণ অনুবাদে। যেটা স্ট্যাটিস্টিক্যাল মেশিন অনুবাদ নামে পরিচিত। ডাটাসেটে মানুষের সমতুল্য দক্ষতা অর্জনের মাইলফলক অর্জনে সংখ্যা যোগ করার ক্ষেত্র পাশাপাশি, প্রশিক্ষণ পদ্ধতি ব্যবহার করে অনুবাদ ব্যবস্থাকে আরও নিখুঁত করতে বেইজিং ও ওয়াশিংটনের রেডমন্ডে মাইক্রোসফটের তিনটি গবেষণা দল একসাথে কাজ করেছে। অনেকক্ষেত্রেই এ পদ্ধতি একদম সঠিক না হওয়া পর্যন্ত মানুষের উচ্চারণভঙ্গি অনুসরণ করবে । মেশিন অনুবাদে মাইক্রোসফট আরেকতি যে পদ্ধতি ব্যবহার করেছে সেটু হচ্ছে ডুয়াল লার্নিং। এটা এক ধরনের তথ্য যাচাইয়ের মতো কাজ করে। প্রতিবার সিস্টেমে চীনা ভাষা থেকে ইংরেজি ভাষায় অনুবাদের জন্য কোনো বাক্য দেয়া হলে, গবেষণা দল বাক্যকে আবার ইংরেজি থেকে চীনা ভাষায় অনুবাদ করেন। স্বয়ংক্রিয়ভাবে অনুবাদের ক্ষেত্রে যথার্থতা নির্ণয়ে মানুষ সাধারণত এ পদ্ধতিই ব্যবহার করে। এর পাশাপাশি, এটা সিস্টেমকে সুযোগ করে দিবে নিজ থেকে ভুল ঠিক করে নেয়ার। ডুয়াল লার্নিং পদ্ধতিও উদ্ভাবন করেছে মাইক্রোসফটেরর গবেষণা দল। এ উদ্ভাবন অন্যান্য কাজের ক্ষেত্রেও কৃত্রিম বুদ্ধিমত্তাগত সহায়তায় ব্যবহারযোগ্য। অন্য একটি পদ্ধতি হচ্ছে, ডেলিবারেশন নেটওয়ার্কস। এটা মানুষের নিজের লেখা বারবার পড়ার মাধ্যমে সম্পাদনা ও সংশোধন করার মতো। গবেষকরা মেশিনকে শিক্ষা দিয়েছেন ত্রুটিহীন হওয়ার আগ পর্যন্ত অনুবাদের ক্ষেত্রে কিভাবে একই বাক্যের পুনরাবৃত্তি করতে হয়। আরেকটি পদ্ধতি হচ্ছে, মেশিন অনুবাদে ইংরেজি থেকে চীনা এবং চীনা থেকে ইংরেজি ভাষার অনুবাদ ব্যবস্থায় জয়েন্ট ট্রেইনিং কৌশল ব্যবহার করা হয়েছে। এ পদ্ধতি ব্যবহার করা হয় ইংরেজি থেকে চীনা ভাষার অনুবাদের ক্ষেত্রে নতুন ইংরেজি বাক্য অনুবাদ করে চীনা ভাষায় নতুন বাক্যের সাথে জোড়া লাগানোর ক্ষেত্রে। এই একই প্রক্রিয়া ঘটে ইংরেজি থেকে চীনা ভাষায় অনুবাদের ক্ষেত্রে। এতে করে দুই ধরনের অনুবাদেই দক্ষতা ক্রমান্বয়ে বাড়তে থাকবে। মেশিন অনুবাদে ব্যবহৃত আরেকটি পদ্ধতি হচ্ছে, অ্যাগ্রিমেন্ট রেগুলারাইজেশন। এ পদ্ধতির মাধ্যমে, সিস্টেম বাম থেকে ডান কিংবা ডান থেকে বামে পড়ার মাধ্যমে অনুবাদ করতে পারে। এ কৌশল যদি একই অনুবাদের ক্ষেত্রে ব্যবহৃত হয় তবে, তবে এটা অনুবাদের ফলাফলকে বিশ্বাসযোগ্য করে তুলে। অনুবাদের সঠিক ছন্দ ধরে রাখার ক্ষেত্রে এ কৌশল অত্যন্ত কার্যকরী।

সফটওয়্যার

অনুবাদ ব্যবস্থায় এআই- এর ব্যবহারে মাইক্রোসফটের ঐতিহাসিক মাইলফলক অর্জন

By Baadshah

March 23, 2018