এআই গ্লসারি
কৃত্রিম বুদ্ধিমত্তার সম্পূর্ণ অভিধান
DETR (DEtection TRansformer)
অগ্রণী স্থাপত্য যা বস্তু সনাক্তকরণকে সরাসরি সেট ভবিষ্যদ্বাণীর সমস্যা হিসেবে বিবেচনা করে এনকর এবং নন-ম্যাক্সিমাম সাপ্রেশনের প্রয়োজনীয়তা দূর করে, বস্তুগুলোর মধ্যকার সম্পর্ক মডেল করতে একটি দ্বিপক্ষীয় ট্রান্সফরমার ব্যবহার করে।
দ্বিপক্ষীয় ট্রান্সফরমার
ট্রান্সফরমার স্থাপত্যের একটি প্রকরণ যেখানে অ্যাটেনশন মেকানিজম ইমেজ ফিচার এবং শেখার যোগ্য বস্তু ক্যোয়ারীগুলোর একটি ছোট ফিক্সড সেটের মধ্যে প্রয়োগ করা হয়, যা বস্তুগুলোর সমান্তরাল ভবিষ্যদ্বাণী সম্ভব করে।
বস্তু ক্যোয়ারী (Object Queries)
শেখার যোগ্য পজিশনাল এমবেডিং ভেক্টর যা প্রতিটি সম্ভাব্য বস্তু ভবিষ্যদ্বাণীর জন্য স্লট হিসেবে কাজ করে, প্রাসঙ্গিক তথ্য বের করতে অ্যাটেনশন মেকানিজমের মাধ্যমে ইমেজ ফিচারগুলোর সাথে ইন্টারঅ্যাক্ট করে।
দ্বিপক্ষীয় ম্যাচিং লস (Bipartite Matching Loss)
হাঙ্গেরিয়ান অ্যালগরিদম ভিত্তিক লস ফাংশন যা মডেলের ভবিষ্যদ্বাণী এবং গ্রাউন্ড ট্রুথের মধ্যে একটি সর্বোত্তম এক-থেকে-এক ম্যাচিং খুঁজে বের করে, সুপারভিশন ছাড়াই ভবিষ্যদ্বাণীর পারমুটেশন সমস্যা সমাধান করে।
এনকোডার-ডিকোডার ট্রান্সফরমার
একটি স্ট্রাকচার যেখানে এনকোডার কনটেক্সট-সমৃদ্ধ রিপ্রেজেন্টেশন তৈরি করতে ইমেজ ফিচার প্রসেস করে, এবং ডিকোডার বস্তু ক্যোয়ারী ব্যবহার করে এই রিপ্রেজেন্টেশনকে ফাইনাল বক্স এবং ক্লাস ভবিষ্যদ্বাণীতে ডিকোড করে।
মাল্টি-হেড মাল্টি-স্কেল অ্যাটেনশন (MSA)
একটি অ্যাটেনশন মেকানিজম যা ফিচার ম্যাপের একাধিক লেভেল থেকে ফিউজড ফিচারগুলোর উপর কাজ করে, মডেলকে বিভিন্ন আকারের বস্তু সনাক্তকরণের জন্য একই সাথে লোকাল এবং গ্লোবাল তথ্য ক্যাপচার করতে সক্ষম করে।
DETR-ResNet
DETR-এর একটি প্রকরণ যা প্রধান ফিচার এক্সট্র্যাক্টর হিসেবে একটি কনভোলিউশনাল নিউরাল নেটওয়ার্ক ResNet ব্যবহার করে, ফিচার এক্সট্র্যাকশনের জন্য CNN-এর শক্তি এবং ট্রান্সফরমারগুলোর গ্লোবাল রিজনিংকে একত্রিত করে।
Mask2Former
প্যানোপটিক, ইনস্ট্যান্স এবং সেমান্টিক সেগমেন্টেশনের জন্য একটি ইউনিফাইড আর্কিটেকচার যা আগ্রহের অঞ্চলগুলোকে মাস্ক করে এবং সরাসরি ট্রান্সফরমার ব্যবহার করে মাস্ক ভবিষ্যদ্বাণী করে, নির্ভুলতা এবং সরলতার দিক থেকে পূর্ববর্তী পদ্ধতিগুলোকে ছাড়িয়ে যায়।
পজিশন এম্বেডিংস
ট্রান্সফরমারকে স্থানিক তথ্য প্রদানের জন্য ইমেজ বৈশিষ্ট্যগুলিতে যোগ করা ভেক্টর, যা মডেলকে দৃশ্যের জ্যামিতি বুঝতে এবং সঠিকভাবে অবজেক্টের অবস্থান নির্ধারণ করতে অপরিহার্য।
কন্ডিশনাল ডিইটিআর
ডিইটিআর-এর একটি উন্নত সংস্করণ যা ইমেজ কন্টেন্টের উপর অবজেক্ট ক্যোয়ারীগুলিকে কন্ডিশন করে কনভারজেন্স গতি বাড়ায়, ক্যোয়ারীগুলির আরও ভাল বিশেষীকরণ এবং আরও সঠিক প্রেডিকশন সম্ভব করে।
ডিফর্মেবল ডিইটিআর
ডিইটিআর-এর একটি বৈকল্পিক যা কনভারজেন্স গতি এবং পারফরম্যান্স উল্লেখযোগ্যভাবে উন্নত করতে, বিশেষ করে ছোট অবজেক্টগুলির জন্য, একটি ছোট সেটের মূল পয়েন্টগুলিতে ফোকাস করতে ডিফর্মেবল অ্যাটেনশন মডিউল একীভূত করে।
স্পার্স আর-সিএনএন
একটি সম্পূর্ণ স্পার্স ডিটেকশন অ্যাপ্রোচ যা শেখার যোগ্য প্রস্তাবিত বক্সগুলির একটি নির্দিষ্ট সেট এবং প্রেডিকশন পরিমার্জনের জন্য ট্রান্সফরমার ক্যাসকেড ব্যবহার করে, অ্যাঙ্কর বা এনএমএস-এর মতো হিউরিস্টিক্সের প্রয়োজন দূর করে।
ক্যোয়ারী-টু-অ্যাটেনশন
একটি মেকানিজম যেখানে অবজেক্ট ক্যোয়ারীগুলি গ্লোবাল অ্যাটেনশনের বিপরীতে মডেলের অ্যাটেনশনকে ইমেজের প্রাসঙ্গিক অঞ্চলগুলির দিকে নির্দেশিত করে, যা দক্ষতা এবং প্রেডিকশনগুলির বিশেষীকরণ উন্নত করে।
ডিনো (উন্নত ডিনোইজিং অ্যাঙ্কর বক্স সহ ডিইটিআর)
একটি স্টেট-অফ-দ্য-আর্ট মডেল যা উন্নত ডিনোইজিং অ্যাঙ্কর বক্সগুলিকে ট্রান্সফরমার আর্কিটেকচারের সাথে একত্রিত করে, এনএমএস-এর প্রয়োজন ছাড়াই ডিটেকশন বেঞ্চমার্কগুলিতে শীর্ষস্থানীয় পারফরম্যান্স অর্জন করে।
ট্রান্সফরমারদের জন্য ফোকাল লস
একটি লস ফাংশন যা কঠিন নমুনাগুলিতে ফোকাস করে এবং ভালভাবে শ্রেণীবদ্ধ করা সহজ নমুনাগুলির অবদান হ্রাস করে ডিইটিআর মডেলগুলির ধীর কনভারজেন্স সমস্যা সমাধানের জন্য ডিজাইন করা হয়েছে।
ট্রান্সফরমার দ্বারা প্যানোপটিক সেগমেন্টেশন
প্যানোপটিক সেগমেন্টেশনের একীভূত কাজে ট্রান্সফরমার আর্কিটেকচারগুলির প্রয়োগ, একটি একক এন্ড-টু-এন্ড মডেল ব্যবহার করে থিংস এবং ব্যাকগ্রাউন্ড উভয়ের জন্য সিম্যান্টিক মাস্ক একইসাথে প্রেডিক্ট করা।
মাম্বা-ডিইটিআর
একটি অবজেক্ট ডিটেকশন আর্কিটেকচার যা অ্যাটেনশন মেকানিজমের পরিবর্তে মাম্বা থেকে অনুপ্রাণিত স্টেট স্পেস ব্লক ব্যবহার করে, রিয়েল-টাইম অবজেক্ট ডিটেকশনের জন্য লিনিয়ার কমপ্লেক্সিটি এবং প্রতিযোগিতামূলক পারফরম্যান্স প্রদান করে।