“কম্পিউটারের ভবিষ্যৎ যদি কণ্ঠস্বর হয়, তাহলে যারা কথা বলতে পারেন না তাদের কী হবে?”- এই প্রশ্নই মাথায় এসেছিল অভিষেক সিংয়ের। জবাবে তিনি বানিয়েছেন এক অ্যাপ যা অ্যামাজন অ্যালেক্সাকে সাইন ল্যাঙ্গুয়েজের জবাব দেওয়ার ক্ষমতা দেবে। সিংয়ের প্রকল্পের একটি ক্যামেরাভিত্তিক ব্যবস্থা ব্যবহার করা হয়েছে বিভিন্ন ইশারা শনাক্ত করবে ও এগুলোকে কথ্য ও লিখিত ভাষায় রূপান্তর করবে।
নির্মাতা সিংয়ের মতে, ভবিষ্যৎ হোম ডিভাইসগুলো শ্রবণপ্রতিবন্ধী ব্যবহারকারীদের কথা চিন্তা করে বানানো উচিৎ। শেষ কয়েক বছরে অ্যামাজন, গুগল আর অ্যাপলের বানানো ভয়েস অ্যাসিস্ট্যান্টগুলোর জনপ্রিয়তা বেড়েছে বলে উল্লেখ করা হয় বিবিসি’র প্রতিবেদনে।
স্মার্ট অডিও রিপোর্টের এক গবেষণায় জানা যায়, যুক্তরাষ্ট্রে স্মার্ট স্পিকারের ব্যবহার স্মার্টফোন আর ট্যাবলেটকে ছাড়িয়ে গিয়েছে। কিন্তু কণ্ঠস্বরে নিয়ন্ত্রিত ডিভাইস বাড়তে থাকায় ভবিষ্যতে শ্রবণপ্রতিবন্ধী সম্প্রদায়ের সমস্যা সৃষ্টির শঙ্কা উঠেছে।
সিং বলেন, “যদি এই ডিভাইসগুলো আমাদের বাসা ও বিভিন্ন কাজের যোগাযোগের কেন্দ্রে পরিণত হয়, তাহলে যারা কথা বলতে বা শুনতে পারেন না তাদের জন্যও কিছুটা ভাবা দরকার।” তিনি মেশিন-লার্নিং প্ল্যাটফর্ম টেনসরফ্লো ব্যবহার করে একটি এআই-কে প্রশিক্ষণ দিয়েছেন। এতে এআই ব্যবস্থাটিকে সাইন ল্যাঙ্গুয়েজ সম্পর্কে মৌলিক জ্ঞান দিতে একটি ওয়েবক্যামের সামনে বিভিন্ন ইশারা দিয়ে প্রশিক্ষণ দেওয়া হয়েছে।
এই সিস্টেম একবার নির্মাতার হাতের ইশারা দেখে জবাব দিতে সক্ষম হওয়ার পর তিনি এটি গুগলের টেক্সট থেকে কথায় রূপান্তরের সফটওয়্যারে ওই শব্দগুলো পড়ার জন্য দেন। অ্যামাজন ইকো এতে জবাব দেয় আর কথার মাধ্যমে দেওয়া এর জবাব স্বয়ংক্রিয়ভাবে কম্পিউটারের মাধ্যমে লেখায় পরিণত হয়, যা ব্যবহারকারী পড়ে নিতে পারেন।