মেশিন দৃষ্টি কি এবং এটি কিভাবে সাহায্য করতে পারে?
মেশিন ভিশন কীভাবে কাজ করে তা বোঝা আপনাকে মেশিন ভিশন উত্পাদন বা প্রক্রিয়াকরণে নির্দিষ্ট অ্যাপ্লিকেশন সমস্যার সমাধান করে কিনা তা নির্ধারণ করতে সহায়তা করতে পারে।
মানুষ প্রায়শই বুঝতে পারে না যে মেশিন (কম্পিউটার, কৃত্রিম) দৃষ্টি একটি উত্পাদন লাইন বা প্রক্রিয়ার জন্য কী করতে পারে এবং কী করতে পারে না। এটি কীভাবে কাজ করে তা বোঝা লোকেদের সিদ্ধান্ত নিতে সাহায্য করতে পারে যে এটি একটি অ্যাপ্লিকেশনে সমস্যার সমাধান করবে কিনা। তাই কম্পিউটার দৃষ্টি ঠিক কি এবং এটি আসলে কিভাবে কাজ করে?
কৃত্রিম দৃষ্টি একটি আধুনিক প্রযুক্তি যা ডিজিটাল প্রক্রিয়া ব্যবহার করে একটি মেশিন দ্বারা ব্যাখ্যা করা এবং ব্যবহার করা যেতে পারে এমন তথ্য তৈরি করার জন্য ভৌত জগতের চিত্রগুলি অর্জন, প্রক্রিয়াকরণ এবং বিশ্লেষণ করার সরঞ্জাম অন্তর্ভুক্ত করে।
শিল্পে কৃত্রিম দৃষ্টির ব্যবহার
কম্পিউটার দৃষ্টি বলতে স্বয়ংক্রিয়ভাবে বস্তুর পরিদর্শন ও বিশ্লেষণ করতে এক বা একাধিক ক্যামেরার ব্যবহার বোঝায়, প্রায়শই শিল্প বা উৎপাদন পরিবেশে। ফলস্বরূপ ডেটা তারপর প্রক্রিয়া বা উত্পাদন কার্যক্রম নিয়ন্ত্রণ করতে ব্যবহার করা যেতে পারে।
প্রতিটি কাজের জন্য সঠিক সিদ্ধান্ত নেওয়ার জন্য মেশিনগুলিকে প্রয়োজনীয় তথ্য দিয়ে এই প্রযুক্তি বিস্তৃত কাজগুলিকে স্বয়ংক্রিয় করে।
শিল্পে কৃত্রিম দৃষ্টিভঙ্গির ব্যবহার উত্পাদন প্রক্রিয়াগুলির স্বয়ংক্রিয়তাকে অনুমতি দেয়, যা প্রতিটি পর্যায়ে গুণমান নিয়ন্ত্রণ এবং বৃহত্তর নমনীয়তার ব্যবহারের মাধ্যমে আরও ভাল উত্পাদন ফলাফলের দিকে পরিচালিত করে।
বর্তমানে, শিল্প কৃত্রিম দৃষ্টি ব্যবহার উল্লেখযোগ্যভাবে উত্পাদন প্রক্রিয়া উন্নত হয়েছে. এটি স্বয়ংচালিত এবং খাদ্য, ইলেকট্রনিক্স এবং লজিস্টিক থেকে শিল্পের প্রায় সমস্ত ক্ষেত্রে কম খরচে উচ্চ মানের পণ্য প্রাপ্ত করা সম্ভব করেছে।
একটি সাধারণ ব্যবহার একটি অ্যাসেম্বলি লাইন হবে যেখানে ক্যামেরাটি এমন একটি অংশে সঞ্চালিত হওয়ার পরে যা একটি চিত্র নেয় এবং প্রক্রিয়া করে। ক্যামেরা একটি নির্দিষ্ট বস্তুর অবস্থান, তার রঙ, আকার বা আকৃতি এবং বস্তুর উপস্থিতি পরীক্ষা করার জন্য প্রোগ্রাম করা যেতে পারে।
মেশিন ভিশন স্ট্যান্ডার্ড 2D ম্যাট্রিক্স বারকোড অনুসন্ধান এবং ডিকোড করতে পারে বা এমনকি মুদ্রিত অক্ষরও পড়তে পারে। পণ্যটি পরীক্ষা করার পরে, একটি সংকেত সাধারণত উত্পন্ন হয় যা পরবর্তী পণ্যটির সাথে কী করতে হবে তা নির্ধারণ করে। অংশটিকে একটি পাত্রে ফেলে দেওয়া যেতে পারে, একটি শাখা পরিবাহকের কাছে পাঠানো যেতে পারে, বা অন্যান্য সমাবেশ ক্রিয়াকলাপে প্রেরণ করা যেতে পারে এবং পরিদর্শনের ফলাফলগুলি সিস্টেমে ট্র্যাক করা হয়।
যাই হোক না কেন, কম্পিউটার ভিশন সিস্টেম একটি বস্তুর চেয়ে অনেক বেশি তথ্য প্রদান করতে পারে সহজ অবস্থান সেন্সর.
কম্পিউটার দৃষ্টি সাধারণত ব্যবহৃত হয়, উদাহরণস্বরূপ, এর জন্য:
- QA,
- একটি রোবট নিয়ন্ত্রণ (মেশিন),
- পরীক্ষা এবং ক্রমাঙ্কন,
- রিয়েল-টাইম প্রক্রিয়া নিয়ন্ত্রণ,
- তথ্য সংগ্রহ,
- মেশিন পর্যবেক্ষণ,
- বাছাই এবং গণনা।
অনেক নির্মাতারা পরিদর্শন কর্মীদের পরিবর্তে স্বয়ংক্রিয় কম্পিউটার দৃষ্টি ব্যবহার করে কারণ এটি পুনরাবৃত্তিমূলক পরিদর্শনের জন্য আরও উপযুক্ত। এটি দ্রুত, আরও উদ্দেশ্যমূলক এবং চব্বিশ ঘন্টা কাজ করে।
কম্পিউটার ভিশন সিস্টেম প্রতি মিনিটে শত শত বা হাজার হাজার যন্ত্রাংশ পরিদর্শন করতে পারে এবং মানুষের তুলনায় আরো সামঞ্জস্যপূর্ণ এবং নির্ভরযোগ্য পরিদর্শন ফলাফল প্রদান করতে পারে৷ ত্রুটিগুলি হ্রাস করে, রাজস্ব বৃদ্ধি করে, কম্পিউটার দৃষ্টির সাথে সম্মতি এবং অংশগুলি ট্র্যাক করার সুবিধা দিয়ে, নির্মাতারা অর্থ সঞ্চয় করতে পারে এবং তাদের লাভ বাড়াতে পারে৷
মেশিন ভিশন কিভাবে কাজ করে
একটি বিচ্ছিন্ন ফটোসেল হল শিল্প অটোমেশনের ক্ষেত্রে সবচেয়ে সহজ সেন্সরগুলির মধ্যে একটি। আমরা এটিকে "বিচ্ছিন্ন" বা ডিজিটাল বলার কারণ হল এর শুধুমাত্র দুটি অবস্থা রয়েছে: চালু বা বন্ধ।
একটি বিচ্ছিন্ন ফটোসেল (অপটিক্যাল সেন্সর) পরিচালনার নীতি হল একটি আলোক রশ্মি প্রেরণ করা এবং আলো একটি বস্তু দ্বারা প্রতিফলিত হচ্ছে কিনা তা নির্ধারণ করা। কোন বস্তু না থাকলে, আলো ফোটোসেল রিসিভারে প্রতিফলিত হয় না। একটি বৈদ্যুতিক সংকেত, সাধারণত 24 V, রিসিভারের সাথে সংযুক্ত থাকে।
বস্তুটি উপস্থিত থাকলে, সংকেতটি চালু করা হয় এবং একটি ক্রিয়া সম্পাদন করতে নিয়ন্ত্রণ ব্যবস্থায় ব্যবহার করা যেতে পারে। বস্তুটি মুছে ফেলা হলে, সংকেত আবার বন্ধ করা হয়।
যেমন একটি সেন্সর এছাড়াও এনালগ হতে পারে. দুটি রাজ্যের পরিবর্তে, i.e. বন্ধ এবং চালু, এটি তার রিসিভারে কত আলো ফিরে আসছে তা নির্দেশ করে একটি মান ফেরত দিতে পারে। এটি 256 মান ফেরত দিতে পারে, 0 (মানে আলো নেই) থেকে 255 (অর্থাৎ প্রচুর আলো)।
একটি বস্তুকে লক্ষ্য করে একটি বর্গক্ষেত্র বা আয়তক্ষেত্রাকার বিন্যাসে সাজানো হাজার হাজার ক্ষুদ্র এনালগ ফটোসেল কল্পনা করুন।এটি সেন্সর যে অবস্থানের দিকে নির্দেশ করছে তার প্রতিফলনের উপর ভিত্তি করে বস্তুর একটি কালো এবং সাদা চিত্র তৈরি করবে। এই চিত্রগুলির পৃথক স্ক্যান পয়েন্টগুলিকে "পিক্সেল" বলা হয়।
অবশ্যই, ছবি তৈরি করতে হাজার হাজার ক্ষুদ্র ফটোইলেকট্রিক সেন্সর ব্যবহার করা হয় না। পরিবর্তে, লেন্সটি আলোক আবিষ্কারকগুলির একটি সেমিকন্ডাক্টর অ্যারেতে চিত্রটিকে ফোকাস করে।
এই ম্যাট্রিক্স আলো-সংবেদনশীল সেমিকন্ডাক্টর ডিভাইসের অ্যারে ব্যবহার করে যেমন সিসিডি (চার্জ কাপলড ডিভাইস) বা CMOS (পরিপূরক মেটাল-অক্সাইড-সেমিকন্ডাক্টর)। এই ম্যাট্রিক্সের পৃথক সেন্সরগুলি পিক্সেল।
একটি কম্পিউটার ভিশন সিস্টেমের চারটি প্রধান উপাদান
একটি কম্পিউটার ভিশন সিস্টেমের চারটি প্রধান উপাদান হল:
- লেন্স এবং আলো;
- ইমেজ সেন্সর বা ক্যামেরা;
- প্রসেসর;
- একটি শারীরিক ইনপুট/আউটপুট (I/O) সংযোগ বা অন্য যোগাযোগ পদ্ধতির মাধ্যমে ফলাফল স্থানান্তর করার একটি উপায়।
কম্পিউটার ভিশন কালার পিক্সেল স্ক্যানিং ব্যবহার করতে পারে এবং প্রায়ই পিক্সেলের অনেক বড় অ্যারে ব্যবহার করে। সফ্টওয়্যার সরঞ্জামগুলি একে অপরের আকার, প্রান্তের অবস্থান, গতি এবং উপাদানগুলির আপেক্ষিক অবস্থান নির্ধারণ করতে ক্যাপচার করা চিত্রগুলিতে প্রয়োগ করা হয়।
লেন্সগুলি ছবিটি ক্যাপচার করে এবং আলোর আকারে সেন্সরে প্রেরণ করে। কম্পিউটার ভিশন সিস্টেম অপ্টিমাইজ করার জন্য, ক্যামেরাটিকে অবশ্যই উপযুক্ত লেন্সের সাথে যুক্ত করতে হবে।
যদিও অনেক ধরনের লেন্স আছে, ফিক্সড ফোকাল লেন্থ লেন্স সাধারণত কম্পিউটার ভিশন অ্যাপ্লিকেশনে ব্যবহৃত হয়। নির্বাচন করার সময় তিনটি বিষয় গুরুত্বপূর্ণ: দৃশ্যের ক্ষেত্র, কাজের দূরত্ব, ক্যামেরা সেন্সরের আকার।
আলো বিভিন্ন উপায়ে একটি ছবিতে প্রয়োগ করা যেতে পারে। আলো যে দিক থেকে আসছে, তার উজ্জ্বলতা, এবং লক্ষ্যের রঙের তুলনায় এর রঙ বা তরঙ্গদৈর্ঘ্য একটি কম্পিউটার দৃষ্টি পরিবেশ ডিজাইন করার সময় বিবেচনা করা খুবই গুরুত্বপূর্ণ বিষয়।
আলো একটি ভাল ছবি পাওয়ার ক্ষেত্রে একটি গুরুত্বপূর্ণ অংশ হলেও, একটি ছবি কতটা আলো পায় তা প্রভাবিত করে এমন আরও দুটি কারণ রয়েছে। লেন্সে অ্যাপারচার নামক একটি সেটিং রয়েছে, যা লেন্সে কম বা বেশি আলো প্রবেশ করার জন্য খোলে বা বন্ধ করে।
এক্সপোজার সময়ের সাথে মিলিত, এটি কোন আলো প্রয়োগ করার আগে পিক্সেল অ্যারেতে আলোর পরিমাণ নির্ধারণ করে। শাটার স্পিড বা এক্সপোজার সময় নির্ধারণ করে কতক্ষণ ছবিটি পিক্সেলের ম্যাট্রিক্সে প্রজেক্ট করা হবে।
কম্পিউটার দৃষ্টিতে, শাটারটি ইলেকট্রনিকভাবে নিয়ন্ত্রিত হয়, সাধারণত মিলিসেকেন্ড নির্ভুলতার সাথে। ছবিটি ক্যাপচার করার পরে, সফ্টওয়্যার সরঞ্জামগুলি প্রয়োগ করা হয়। কিছু বিশ্লেষণের আগে ব্যবহার করা হয় (প্রাক-প্রক্রিয়াকরণ), অন্যগুলি অধ্যয়ন করা বস্তুর বৈশিষ্ট্য নির্ধারণ করতে ব্যবহৃত হয়।
প্রি-প্রসেসিংয়ের সময়, আপনি প্রান্তগুলি তীক্ষ্ণ করতে, বৈসাদৃশ্য বাড়াতে বা ফাঁক পূরণ করতে একটি ছবিতে প্রভাব প্রয়োগ করতে পারেন। এই কাজগুলির উদ্দেশ্য হল অন্যান্য সফ্টওয়্যার সরঞ্জামগুলির ক্ষমতা উন্নত করা।
কৃত্রিম দৃষ্টি একটি প্রযুক্তি যা মানুষের দৃষ্টি অনুকরণ করে এবং আপনাকে উত্পাদন প্রক্রিয়া চলাকালীন প্রাপ্ত চিত্রগুলি গ্রহণ, প্রক্রিয়া এবং ব্যাখ্যা করতে দেয়।কৃত্রিম দৃষ্টি মেশিনগুলি একটি স্বয়ংক্রিয় প্রক্রিয়ার মাধ্যমে সিদ্ধান্ত নিতে এবং সবচেয়ে সুবিধাজনক উপায়ে কাজ করার জন্য উত্পাদন প্রক্রিয়া চলাকালীন প্রাপ্ত তথ্য বিশ্লেষণ এবং ডিকোড করে। এই চিত্রগুলির প্রক্রিয়াকরণ মেশিনের সাথে যুক্ত সফ্টওয়্যার ব্যবহার করে বাহিত হয় এবং প্রাপ্ত ডেটার উপর ভিত্তি করে, প্রক্রিয়াগুলি চালিয়ে যাওয়া এবং সমাবেশ লাইনগুলিতে সম্ভাব্য ত্রুটিগুলি সনাক্ত করা সম্ভব।
কম্পিউটার দর্শনের লক্ষ্য
এখানে কিছু সাধারণ সরঞ্জাম রয়েছে যা আপনি আপনার লক্ষ্য সম্পর্কে তথ্য পেতে ব্যবহার করতে পারেন:
- পিক্সেল কাউন্ট: বস্তুতে আলো বা অন্ধকার পিক্সেলের সংখ্যা দেখায়।
- প্রান্ত সনাক্তকরণ: একটি বস্তুর প্রান্ত খুঁজুন।
- পরিমাপ (মেট্রোলজি): একটি বস্তুর মাত্রা পরিমাপ করা (যেমন মিলিমিটারে)।
- প্যাটার্ন স্বীকৃতি বা প্যাটার্ন ম্যাচিং: নির্দিষ্ট প্যাটার্ন অনুসন্ধান, মিল বা গণনা। এর মধ্যে এমন একটি বস্তু সনাক্ত করা অন্তর্ভুক্ত থাকতে পারে যা ঘোরানো যায়, আংশিকভাবে অন্য বস্তু দ্বারা লুকানো যায়, বা অন্য বস্তু থাকতে পারে।
- অপটিক্যাল ক্যারেক্টার রিকগনিশন (OCR): সিরিয়াল নম্বরের মতো পাঠ্যের স্বয়ংক্রিয় পঠন।
- বারকোড, ডেটা ম্যাট্রিক্স এবং 2D বারকোড রিডিং: বিভিন্ন বারকোডিং স্ট্যান্ডার্ডে থাকা ডেটা সংগ্রহ করুন।
- স্পট সনাক্তকরণ: চিত্রের জন্য একটি রেফারেন্স পয়েন্ট হিসাবে আন্তঃসংযুক্ত পিক্সেলের প্যাচগুলির (যেমন একটি ধূসর বস্তুতে একটি কালো গর্ত) জন্য চিত্রটি পরীক্ষা করে।
- রঙ বিশ্লেষণ: রঙ দ্বারা অংশ, পণ্য এবং বস্তু সনাক্ত করুন, গুণমান মূল্যায়ন করুন এবং রঙ দ্বারা উপাদান হাইলাইট করুন।
পরিদর্শন ডেটা প্রাপ্তির উদ্দেশ্য প্রায়শই পাস/ফেল বা এগিয়ে যাওয়া/এগিয়ে না যাওয়া নির্ধারণ করতে লক্ষ্য মানের সাথে তুলনা করতে ব্যবহার করা।
উদাহরণস্বরূপ, একটি কোড বা বারকোড স্ক্যান করার সময়, ফলাফলের মানটিকে সংরক্ষিত লক্ষ্য মানের সাথে তুলনা করা হয়। পরিমাপের ক্ষেত্রে, পরিমাপ করা মানটি সঠিক মান এবং সহনশীলতার সাথে তুলনা করা হয়।
একটি আলফানিউমেরিক কোড পরীক্ষা করার সময়, OCR পাঠ্য মান সঠিক বা লক্ষ্য মানের সাথে তুলনা করা হয়। পৃষ্ঠের ত্রুটিগুলি পরীক্ষা করার জন্য, ত্রুটির আকারটি গুণমানের মান দ্বারা অনুমোদিত সর্বাধিক আকারের সাথে তুলনা করা যেতে পারে।
মান নিয়ন্ত্রণ
শিল্পে মেশিন ভিশনের বিশাল সম্ভাবনা রয়েছে। এই কৃত্রিম দৃষ্টি সিস্টেম ব্যবহার করা হয়েছে রোবোটিক্সে, আমাদের উত্পাদনের বিভিন্ন পর্যায়ের জন্য একটি স্বয়ংক্রিয় সমাধান অফার করার অনুমতি দিন, যেমন মান নিয়ন্ত্রণ বা ত্রুটিপূর্ণ পণ্য সনাক্তকরণ।
গুণমান নিয়ন্ত্রণ পদ্ধতি এবং সরঞ্জামগুলির একটি সেট যা আমাদের উত্পাদন প্রক্রিয়ার ত্রুটিগুলি সনাক্ত করতে এবং সেইসাথে তাদের নির্মূল করার জন্য যথাযথ ব্যবস্থা গ্রহণ করতে দেয়। এটি চূড়ান্ত পণ্যের উপর অনেক বেশি সম্পূর্ণ নিয়ন্ত্রণ প্রদান করে, নিশ্চিত করে যে এটি যখন ভোক্তার কাছে পৌঁছাবে তখন এটি নির্দিষ্ট এবং প্রতিষ্ঠিত মানের মান পূরণ করবে।
এইভাবে, যে পণ্যগুলি ন্যূনতম মানের প্রয়োজনীয়তাগুলি পূরণ করে না সেগুলিকে প্রক্রিয়া থেকে বাদ দেওয়া হয়, যার ফলে উত্পাদন প্রক্রিয়ায় সম্ভাব্য বাধাগুলি দূর হয়৷ এটি ক্রমাগত পরিদর্শন এবং এলোমেলো পরীক্ষা পরিচালনা করে অর্জন করা হয়৷
উত্পাদনে গুণমান নিয়ন্ত্রণের ব্যবহারের অনেকগুলি সুবিধা রয়েছে:
- উৎপাদনশীলতা বৃদ্ধি;
- উপাদান ক্ষতি হ্রাস;
- দাম ড্রপ;
- চূড়ান্ত পণ্য সেরা মানের.
কম্পিউটার ভিশনে যোগাযোগ
একবার প্রসেসর এবং সফ্টওয়্যার দ্বারা প্রাপ্ত হলে, এই তথ্যটি বিভিন্ন শিল্প মানক যোগাযোগ প্রোটোকলের মাধ্যমে নিয়ন্ত্রণ ব্যবস্থায় প্রেরণ করা যেতে পারে।
প্রধান কম্পিউটার ভিশন সিস্টেমগুলি প্রায়শই ইথারনেট/আইপি, প্রোফিনেট এবং মডবাস টিসিপি সমর্থন করে। RS232 এবং RS485 সিরিয়াল প্রোটোকলও সাধারণ।
ডিজিটাল I/O প্রায়শই অ্যাকচুয়েশন সিস্টেমে তৈরি করা হয় এবং ফলাফলের রিপোর্টিংকে সরল করে। কম্পিউটার ভিশন যোগাযোগের মানও পাওয়া যায়।
উপসংহার
কৃত্রিম দৃষ্টি সিস্টেমের বিভিন্ন ধরণের অ্যাপ্লিকেশন রয়েছে এবং বিভিন্ন শিল্প এবং প্রতিটি উত্পাদন লাইনের বিভিন্ন প্রয়োজনের সাথে মানিয়ে নেওয়া যেতে পারে। আজ, যেকোন কোম্পানি যে একটি নির্দিষ্ট মানের পণ্য তৈরি করে তারা তাদের উত্পাদন প্রক্রিয়ার অংশ হিসাবে কম্পিউটার দৃষ্টির সুবিধা নিতে পারে।
কৃত্রিম দৃষ্টি সিস্টেমের শারীরিক নীতি এবং ক্ষমতা বোঝা একটি নির্দিষ্ট ক্ষেত্রে এই ধরনের প্রযুক্তি একটি উত্পাদন প্রক্রিয়ার জন্য উপযুক্ত কিনা তা নির্ধারণে সহায়ক হতে পারে। সাধারণভাবে, মানুষের চোখ যাই দেখতে পারে না কেন, ক্যামেরা দেখতে পারে (কখনও কখনও বেশি, কখনও কম), তবে এই তথ্য ডিকোডিং এবং প্রেরণ করা বেশ জটিল হতে পারে।