ভিজ্যুয়াল সিস্টেম - তারা কিভাবে কাজ করে এবং কিভাবে তারা কাজ করে
যেহেতু রোবটগুলি মানুষের মতো জীবন্ত প্রাণী নয়, তাদের চোখ এবং মস্তিষ্ক নেই এবং চাক্ষুষ তথ্য গ্রহণ করার জন্য, তাদের ভিজ্যুয়াল সিস্টেম নামে বিশেষ প্রযুক্তিগত সংবেদনশীল ডিভাইসের প্রয়োজন।
ভিজ্যুয়াল সিস্টেম অনুমতি দেয় রোবট কাজের বস্তু এবং দৃশ্যের ছবি গ্রহণ করুন, রূপান্তর করুন, প্রক্রিয়া করুন এবং ডিজিটাল ডিভাইসগুলির একটি সেট ব্যবহার করে তাদের ব্যাখ্যা করুন, যাতে রোবট অ্যাকুয়েটর এই ডেটা অনুসারে পর্যাপ্তভাবে কাজটি সম্পাদন করতে পারে।
খুব সংবেদনশীল সিস্টেমের তুলনায়, এটি এমন দৃষ্টি সিস্টেম যা একটি রোবটকে স্বাভাবিকভাবে কাজ করার জন্য 90% পর্যন্ত ভিজ্যুয়াল তথ্য সরবরাহ করতে সক্ষম। এইভাবে, মেশিন দৃষ্টি বাস্তবায়নের সমস্যাটি বেশ কয়েকটি ধাপে সমাধান করা হয়: তথ্য প্রাপ্ত হয়, প্রক্রিয়া করা হয়, তারপর সেগমেন্ট করা হয় এবং বর্ণনা করা হয়, তারপর স্বীকৃত এবং ব্যাখ্যা করা হয়।
একটি ডিজিটাল ইমেজ আকারে প্রদত্ত মূল তথ্য প্রাক-প্রক্রিয়াজাত করা হয়, এটি থেকে শব্দ অপসারণ করা হয়, একটি দৃশ্য বা বস্তুর পৃথক উপাদানের ছবির গুণমান উন্নত করা হয়।তথ্যটি তারপরে বিভক্ত করা হয় — দৃশ্যটি শর্তসাপেক্ষে এমন অংশে বিভক্ত যেগুলি পৃথক উপাদান হিসাবে স্বীকৃত, যার প্রত্যেকটি স্বীকৃত হতে পারে এবং তারপরে আগ্রহের বিষয়গুলি হাইলাইট করা হয়।
নির্বাচিত বস্তুগুলি বৈশিষ্ট্যগত পরামিতি দ্বারা পরীক্ষা করা হয়, যা তথ্যের বিন্যাস সহ বর্ণনা করা হয়, তাই পরামিতি দ্বারা প্রয়োজনীয় বস্তু নির্বাচন করা সম্ভব। প্রয়োজনীয় বস্তু চিহ্নিত করা হয় এবং প্রোগ্রাম ব্যবহার করে চিহ্নিত করা হয়। অবশেষে, চিহ্নিত বস্তুগুলিকে ব্যাখ্যা করা হয় এবং চিহ্নিত করা হয় এক বা অন্য গ্রুপের স্বীকৃত বস্তুর অন্তর্গত, তারপরে তাদের চাক্ষুষ চিত্রগুলি প্রতিষ্ঠিত হয়।
প্রযুক্তিগত দৃষ্টি ব্যবস্থায়, ইমেজ তথ্য, অপটোইলেক্ট্রনিক রূপান্তরকারী এবং ভিডিও সেন্সরগুলির সাহায্যে, বৈদ্যুতিক সংকেত আকারে উপস্থাপিত হয়। এটি মূলত একটি প্রাথমিক রূপান্তর। সাধারণত, একটি অপটিক্যাল ক্যামেরা, একটি সংবেদনশীল উপাদান, একটি স্ক্যানিং ডিভাইস ব্যবহার করে চিত্রটি পড়া হয়, যার পরে সংকেতটি প্রশস্ত করা হয়।
এইভাবে প্রাপ্ত তথ্য শ্রেণিবদ্ধভাবে প্রক্রিয়া করা হয়। প্রথমত, ছবিটি ভিডিও প্রসেসর দ্বারা প্রক্রিয়া করা হয়। এখানে, মূল প্যারামিটারটি হল ছবির রূপরেখা, যা এটি তৈরি করা পয়েন্টগুলির সেটের স্থানাঙ্ক দ্বারা সেট করা হয়। এছাড়াও, সিস্টেমের অংশ কম্পিউটারটি রোবটের জন্য নিয়ন্ত্রণ সংকেত তৈরি করে।
ভিডিও সেন্সরগুলি বিশেষ তারগুলি ব্যবহার করে দৃষ্টি সিস্টেমের অন্যান্য অংশের সাথে সংযুক্ত থাকে, যেমন অপটিক্যাল কেবল, যার মাধ্যমে তথ্য উচ্চ ফ্রিকোয়েন্সিতে এবং সর্বনিম্ন ক্ষতির সাথে প্রেরণ করা হয়।
ভিডিও সেন্সরগুলিতে বিন্দু, এক-মাত্রিক, বা দ্বি-মাত্রিক সেন্সিং উপাদান থাকতে পারে।পয়েন্ট-সংবেদনশীল উপাদানগুলি বস্তুর ছোট অংশ থেকে দৃশ্যমান বিকিরণ গ্রহণ করতে সক্ষম, এবং একটি সম্পূর্ণ রাস্টার চিত্র পেতে, এটি সমতল বরাবর স্ক্যান করা প্রয়োজন।
এক-মাত্রিক সেন্সরগুলি আরও জটিল, তারা পয়েন্ট উপাদানগুলির একটি লাইন নিয়ে গঠিত যা স্ক্যান করার সময় বস্তুর সাপেক্ষে সরে যায়। 2D উপাদানগুলি মূলত বিচ্ছিন্ন বিন্দু উপাদানগুলির একটি ম্যাট্রিক্স।
অপটিক্যাল সিস্টেম সংবেদনশীল উপাদানের উপর একটি চিত্র প্রজেক্ট করে, সেন্সর দ্বারা আচ্ছাদিত কাজের এলাকার আকার আগে থেকেই নির্ধারণ করা হয়। অপটিক্যাল সিস্টেমে একটি সামঞ্জস্যযোগ্য অ্যাপারচার লেন্স রয়েছে যাতে আগত আলোর পরিমাণ এবং ফোকাস তীক্ষ্ণতা লেন্স থেকে বিষয় পরিবর্তনের দূরত্বের সাথে সামঞ্জস্য করা যায়।
সলিড-স্টেট ট্রান্সডুসার থেকে ভিডিকন ভ্যাকুয়াম টিউব-ভিত্তিক টেলিভিশন ক্যামেরা পর্যন্ত বিভিন্ন অপটোইলেক্ট্রনিক ডিভাইস ভিডিও সেন্সর হিসেবে কাজ করতে পারে। প্রযুক্তিগত দৃষ্টিভঙ্গির ভিত্তি হল কৃত্রিম বুদ্ধিমত্তার আশ্রয় নেওয়ার প্রয়োজন ছাড়াই এই সেন্সরগুলি থেকে তথ্যের উপলব্ধি এবং প্রাক-প্রক্রিয়াকরণ।
এটি সিস্টেমের সর্বনিম্ন স্তর। এর পরে বিশ্লেষণ, বর্ণনা এবং স্বীকৃতি - এখানে আধুনিক কম্পিউটার এবং জটিল অ্যালগরিদমিক সফ্টওয়্যার ব্যবহার করা হয় - মধ্যম স্তর। সর্বোচ্চ স্তরটি ইতিমধ্যেই কৃত্রিম বুদ্ধিমত্তা।
কার্যত শিল্প রোবট মধ্যে প্রথম-প্রজন্মের ভিশন সিস্টেমগুলি বিস্তৃত, যা ফ্ল্যাট ইমেজ এবং সাধারণ আকারের বস্তুগুলির সাথে কাজ করার পর্যাপ্ত গুণমান প্রদান করে। এগুলি অংশগুলি সনাক্ত করতে, বাছাই করতে এবং স্থাপন করতে, অংশগুলির মাত্রা পরীক্ষা করতে, একটি অঙ্কনের সাথে তাদের তুলনা করতে ব্যবহৃত হয়।
একটি দৃষ্টি সিস্টেমের একটি সাধারণ বাস্তবায়ন এই মত দেখায়. রোবটের কাজের ক্ষেত্র, যেখানে অংশগুলি অবস্থিত, তা প্রদীপ দিয়ে আলোকিত হয়।কাজের ক্ষেত্রের উপরে একটি পর্যবেক্ষণ মোবাইল টিভি ক্যামেরা রয়েছে, যেখান থেকে ভিডিও তথ্য প্রযুক্তিগত দৃষ্টি সিস্টেমের প্রধান ইউনিটে তারের দ্বারা খাওয়ানো হয়।
প্রধান ইউনিট থেকে, তথ্য (প্রক্রিয়াজাত আকারে) রোবট নিয়ন্ত্রণ ইউনিটে খাওয়ানো হয়। প্রযুক্তিগত দৃষ্টি সিস্টেমের সফ্টওয়্যার থেকে প্রাপ্ত তথ্যের সাথে কঠোরভাবে যন্ত্রটি অংশগুলির বাছাই করা, পাত্রে তাদের সুশৃঙ্খলভাবে প্যাকিং করে।
![]()
বুদ্ধিমান এবং অভিযোজিত রোবটগুলি যেগুলি আজ সক্রিয়ভাবে বিকাশ করা হচ্ছে, দ্বিতীয় এবং তৃতীয় প্রজন্মের সিস্টেমের উপর ভিত্তি করে, ত্রিমাত্রিক চিত্র এবং আরও জটিল বস্তুর সাথে কাজ করতে, আরও সঠিক পরিমাপ করতে এবং বস্তুগুলিকে আরও সাবধানে এবং দ্রুত চিনতে সক্ষম।
বর্তমানে বৈজ্ঞানিক ও প্রযুক্তিগত গবেষণার প্রধান দিক হ'ল দৃষ্টি সিস্টেম এবং সফ্টওয়্যার এবং তাদের অ্যালগরিদমিক সহায়তার উন্নতি, বিশেষ কম্পিউটার তৈরি করা, সেইসাথে মৌলিকভাবে নতুন দৃষ্টি সিস্টেম তৈরি করা, যেহেতু রোবোটিক্সের ব্যবহার ক্রমবর্ধমান চাহিদা এবং এর ক্ষেত্র। শিল্প বাস্তবায়ন ক্রমাগত প্রসারিত হয়.
আজ, রোবটের জন্য আরও উন্নত সংবেদনশীল ডিভাইস তৈরি করা হচ্ছে, যা রোবটের কাছে যতটা সম্ভব বাহ্যিক তথ্য প্রেরণ করতে সক্ষম। এটি এখন স্পষ্ট যে জটিল সেন্সরগুলি, নীতিগতভাবে, দৃশ্য এবং চিত্রগুলি সামগ্রিকভাবে উপলব্ধি করতে পারে, যার অর্থ ভবিষ্যতে রোবটগুলি অতিরিক্ত বাহ্যিক উদ্দীপনা ছাড়াই কাজের ক্ষেত্রের জায়গায় স্বাধীনভাবে উদ্দেশ্যমূলক ক্রিয়া তৈরি করতে সক্ষম হবে।