Monday, January 19, 2026

কণ্ঠই হবে ভবিষ্যৎ ইন্টারফেস: অডিও প্রযুক্তিতে নতুন দিগন্ত খুলছে ওপেন এআই


প্রতীকী ছবিঃ মানুষের (সংগৃহীত)

স্টাফ রিপোর্ট: PNN

কৃত্রিম বুদ্ধিমত্তার পরবর্তী ধাপ হিসেবে অডিও প্রযুক্তিকে সামনে নিয়ে আসতে বড় বাজি ধরেছে ওপেনএআই। শুধু চ্যাটজিপিটির কণ্ঠ আরও স্বাভাবিক করা নয়, বরং পুরোপুরি অডিও-নির্ভর একটি ব্যক্তিগত ডিভাইস তৈরির প্রস্তুতিতে নেমেছে প্রতিষ্ঠানটি। সাম্প্রতিক এক প্রতিবেদনে জানা গেছে, গত দুই মাসে ওপেনএআই তাদের একাধিক ইঞ্জিনিয়ারিং, পণ্য ও গবেষণা দল একীভূত করেছে, যার মূল লক্ষ্য নতুন প্রজন্মের অডিও মডেল তৈরি করা। এই উদ্যোগের ফল হিসেবে প্রায় এক বছরের মধ্যে একটি অডিও-ফার্স্ট ডিভাইস বাজারে আনার পরিকল্পনা রয়েছে।

এই পদক্ষেপ আসলে পুরো প্রযুক্তি শিল্পের ভবিষ্যৎ দিকনির্দেশনার প্রতিফলন। ধীরে ধীরে স্ক্রিনের গুরুত্ব কমে গিয়ে অডিওই হয়ে উঠছে প্রধান ইন্টারফেস। ইতোমধ্যে যুক্তরাষ্ট্রের এক-তৃতীয়াংশের বেশি ঘরে স্মার্ট স্পিকার ব্যবহার হচ্ছে। মেটা সম্প্রতি তাদের রে-ব্যান স্মার্ট চশমায় এমন একটি ফিচার যুক্ত করেছে, যেখানে একাধিক মাইক্রোফোন ব্যবহার করে কোলাহলপূর্ণ পরিবেশেও কথোপকথন স্পষ্ট শোনা যায়। অন্যদিকে গুগল সার্চ রেজাল্টকে কথোপকথনভিত্তিক অডিও সারাংশে রূপ দেওয়ার পরীক্ষা চালাচ্ছে, আর টেসলা গাড়িতে যুক্ত করছে এক্সএআই-এর চ্যাটবট ‘গ্রোক’, যা কণ্ঠের মাধ্যমে নেভিগেশন থেকে শুরু করে গাড়ির তাপমাত্রা নিয়ন্ত্রণ পর্যন্ত করতে পারবে।

এই দৌড়ে শুধু বড় প্রযুক্তি প্রতিষ্ঠানই নয়, নতুন স্টার্টআপগুলোরও অংশগ্রহণ রয়েছে। তবে সবার পথ মসৃণ হয়নি। স্ক্রিনবিহীন ‘হিউম্যান এআই পিন’ বিপুল অর্থ ব্যয় করেও ব্যর্থতার উদাহরণ হয়ে দাঁড়িয়েছে। আবার ‘ফ্রেন্ড এআই’ নামের একটি পেনড্যান্ট, যা সারাক্ষণ কথোপকথন রেকর্ড করে সঙ্গ দেওয়ার দাবি করে, তা গোপনীয়তা ও ব্যক্তিগত স্বাধীনতা নিয়ে উদ্বেগ সৃষ্টি করেছে। এছাড়া দুই হাজার ছয় সালের দিকে বাজারে আসতে পারে এমন একটি এআই রিং তৈরির কাজও চলছে, যেখানে ব্যবহারকারী আক্ষরিক অর্থেই হাতে কথা বলতে পারবেন।

ডিভাইসের ধরন ভিন্ন হলেও মূল ধারণা এক — অডিওই হবে ভবিষ্যতের নিয়ন্ত্রণ মাধ্যম। ঘর, গাড়ি, এমনকি মানুষের শরীরও ধীরে ধীরে ইন্টারফেসে পরিণত হচ্ছে।

ওপেনএআই-এর নতুন অডিও মডেল, যা দুই হাজার ছয় সালের শুরুতে আসতে পারে, সেটি আরও মানবিক কণ্ঠে কথা বলতে পারবে, কথোপকথনের মাঝখানে বাধা সামলাতে পারবে এবং ব্যবহারকারী কথা বলার সময়ও প্রতিক্রিয়া জানাতে সক্ষম হবে। বর্তমান মডেলগুলো যেখানে সীমাবদ্ধ, সেখানে এটি হবে বড় অগ্রগতি। একই সঙ্গে ওপেনএআই একাধিক ডিভাইসের একটি পরিবার তৈরির কথাও ভাবছে, যার মধ্যে স্মার্ট চশমা বা স্ক্রিনবিহীন স্মার্ট স্পিকার থাকতে পারে, যেগুলো কেবল যন্ত্র নয়, বরং সঙ্গীর মতো আচরণ করবে।

বিশ্লেষকদের মতে, এই পরিকল্পনার পেছনে ওপেনএআই-এর হার্ডওয়্যার উদ্যোগে যুক্ত হওয়া সাবেক অ্যাপল ডিজাইন প্রধান জনি আইভের দর্শনও কাজ করছে। তিনি দীর্ঘদিন ধরেই ডিভাইস আসক্তি কমানোর পক্ষে ছিলেন এবং অডিও-ফার্স্ট নকশাকে অতীতের প্রযুক্তিগত ভুল সংশোধনের সুযোগ হিসেবে দেখছেন।

সব মিলিয়ে, ওপেনএআই-এর এই পদক্ষেপ ইঙ্গিত দিচ্ছে, ভবিষ্যতের এআই শুধু দেখা যাবে না, বরং শোনা যাবে, আর সেই শোনাই হতে পারে মানুষের প্রযুক্তি ব্যবহারের প্রধান অভিজ্ঞতা।

Super Admin

PNN

প্লিজ লগইন পোস্টে মন্তব্য করুন!

আপনিও পছন্দ করতে পারেন