ট্রান্সফরমার্স অবজেক্ট ডিটেকশনের জন্য - কৃত্রিম বুদ্ধিমত্তা শব্দাবলী

📖

শব্দ

DETR (DEtection TRansformer)

অগ্রণী স্থাপত্য যা বস্তু সনাক্তকরণকে সরাসরি সেট ভবিষ্যদ্বাণীর সমস্যা হিসেবে বিবেচনা করে এনকর এবং নন-ম্যাক্সিমাম সাপ্রেশনের প্রয়োজনীয়তা দূর করে, বস্তুগুলোর মধ্যকার সম্পর্ক মডেল করতে একটি দ্বিপক্ষীয় ট্রান্সফরমার ব্যবহার করে।

📖

শব্দ

দ্বিপক্ষীয় ট্রান্সফরমার

ট্রান্সফরমার স্থাপত্যের একটি প্রকরণ যেখানে অ্যাটেনশন মেকানিজম ইমেজ ফিচার এবং শেখার যোগ্য বস্তু ক্যোয়ারীগুলোর একটি ছোট ফিক্সড সেটের মধ্যে প্রয়োগ করা হয়, যা বস্তুগুলোর সমান্তরাল ভবিষ্যদ্বাণী সম্ভব করে।

📖

শব্দ

বস্তু ক্যোয়ারী (Object Queries)

শেখার যোগ্য পজিশনাল এমবেডিং ভেক্টর যা প্রতিটি সম্ভাব্য বস্তু ভবিষ্যদ্বাণীর জন্য স্লট হিসেবে কাজ করে, প্রাসঙ্গিক তথ্য বের করতে অ্যাটেনশন মেকানিজমের মাধ্যমে ইমেজ ফিচারগুলোর সাথে ইন্টারঅ্যাক্ট করে।

📖

শব্দ

দ্বিপক্ষীয় ম্যাচিং লস (Bipartite Matching Loss)

হাঙ্গেরিয়ান অ্যালগরিদম ভিত্তিক লস ফাংশন যা মডেলের ভবিষ্যদ্বাণী এবং গ্রাউন্ড ট্রুথের মধ্যে একটি সর্বোত্তম এক-থেকে-এক ম্যাচিং খুঁজে বের করে, সুপারভিশন ছাড়াই ভবিষ্যদ্বাণীর পারমুটেশন সমস্যা সমাধান করে।

📖

শব্দ

এনকোডার-ডিকোডার ট্রান্সফরমার

একটি স্ট্রাকচার যেখানে এনকোডার কনটেক্সট-সমৃদ্ধ রিপ্রেজেন্টেশন তৈরি করতে ইমেজ ফিচার প্রসেস করে, এবং ডিকোডার বস্তু ক্যোয়ারী ব্যবহার করে এই রিপ্রেজেন্টেশনকে ফাইনাল বক্স এবং ক্লাস ভবিষ্যদ্বাণীতে ডিকোড করে।

📖

শব্দ

মাল্টি-হেড মাল্টি-স্কেল অ্যাটেনশন (MSA)

একটি অ্যাটেনশন মেকানিজম যা ফিচার ম্যাপের একাধিক লেভেল থেকে ফিউজড ফিচারগুলোর উপর কাজ করে, মডেলকে বিভিন্ন আকারের বস্তু সনাক্তকরণের জন্য একই সাথে লোকাল এবং গ্লোবাল তথ্য ক্যাপচার করতে সক্ষম করে।

📖

শব্দ

DETR-ResNet

DETR-এর একটি প্রকরণ যা প্রধান ফিচার এক্সট্র্যাক্টর হিসেবে একটি কনভোলিউশনাল নিউরাল নেটওয়ার্ক ResNet ব্যবহার করে, ফিচার এক্সট্র্যাকশনের জন্য CNN-এর শক্তি এবং ট্রান্সফরমারগুলোর গ্লোবাল রিজনিংকে একত্রিত করে।

📖

শব্দ

Mask2Former

প্যানোপটিক, ইনস্ট্যান্স এবং সেমান্টিক সেগমেন্টেশনের জন্য একটি ইউনিফাইড আর্কিটেকচার যা আগ্রহের অঞ্চলগুলোকে মাস্ক করে এবং সরাসরি ট্রান্সফরমার ব্যবহার করে মাস্ক ভবিষ্যদ্বাণী করে, নির্ভুলতা এবং সরলতার দিক থেকে পূর্ববর্তী পদ্ধতিগুলোকে ছাড়িয়ে যায়।

📖

শব্দ

পজিশন এম্বেডিংস

ট্রান্সফরমারকে স্থানিক তথ্য প্রদানের জন্য ইমেজ বৈশিষ্ট্যগুলিতে যোগ করা ভেক্টর, যা মডেলকে দৃশ্যের জ্যামিতি বুঝতে এবং সঠিকভাবে অবজেক্টের অবস্থান নির্ধারণ করতে অপরিহার্য।

📖

শব্দ

কন্ডিশনাল ডিইটিআর

ডিইটিআর-এর একটি উন্নত সংস্করণ যা ইমেজ কন্টেন্টের উপর অবজেক্ট ক্যোয়ারীগুলিকে কন্ডিশন করে কনভারজেন্স গতি বাড়ায়, ক্যোয়ারীগুলির আরও ভাল বিশেষীকরণ এবং আরও সঠিক প্রেডিকশন সম্ভব করে।

📖

শব্দ

ডিফর্মেবল ডিইটিআর

ডিইটিআর-এর একটি বৈকল্পিক যা কনভারজেন্স গতি এবং পারফরম্যান্স উল্লেখযোগ্যভাবে উন্নত করতে, বিশেষ করে ছোট অবজেক্টগুলির জন্য, একটি ছোট সেটের মূল পয়েন্টগুলিতে ফোকাস করতে ডিফর্মেবল অ্যাটেনশন মডিউল একীভূত করে।

📖

শব্দ

স্পার্স আর-সিএনএন

একটি সম্পূর্ণ স্পার্স ডিটেকশন অ্যাপ্রোচ যা শেখার যোগ্য প্রস্তাবিত বক্সগুলির একটি নির্দিষ্ট সেট এবং প্রেডিকশন পরিমার্জনের জন্য ট্রান্সফরমার ক্যাসকেড ব্যবহার করে, অ্যাঙ্কর বা এনএমএস-এর মতো হিউরিস্টিক্সের প্রয়োজন দূর করে।

📖

শব্দ

ক্যোয়ারী-টু-অ্যাটেনশন

একটি মেকানিজম যেখানে অবজেক্ট ক্যোয়ারীগুলি গ্লোবাল অ্যাটেনশনের বিপরীতে মডেলের অ্যাটেনশনকে ইমেজের প্রাসঙ্গিক অঞ্চলগুলির দিকে নির্দেশিত করে, যা দক্ষতা এবং প্রেডিকশনগুলির বিশেষীকরণ উন্নত করে।

📖

শব্দ

ডিনো (উন্নত ডিনোইজিং অ্যাঙ্কর বক্স সহ ডিইটিআর)

একটি স্টেট-অফ-দ্য-আর্ট মডেল যা উন্নত ডিনোইজিং অ্যাঙ্কর বক্সগুলিকে ট্রান্সফরমার আর্কিটেকচারের সাথে একত্রিত করে, এনএমএস-এর প্রয়োজন ছাড়াই ডিটেকশন বেঞ্চমার্কগুলিতে শীর্ষস্থানীয় পারফরম্যান্স অর্জন করে।

📖

শব্দ

ট্রান্সফরমারদের জন্য ফোকাল লস

একটি লস ফাংশন যা কঠিন নমুনাগুলিতে ফোকাস করে এবং ভালভাবে শ্রেণীবদ্ধ করা সহজ নমুনাগুলির অবদান হ্রাস করে ডিইটিআর মডেলগুলির ধীর কনভারজেন্স সমস্যা সমাধানের জন্য ডিজাইন করা হয়েছে।

📖

শব্দ

ট্রান্সফরমার দ্বারা প্যানোপটিক সেগমেন্টেশন

প্যানোপটিক সেগমেন্টেশনের একীভূত কাজে ট্রান্সফরমার আর্কিটেকচারগুলির প্রয়োগ, একটি একক এন্ড-টু-এন্ড মডেল ব্যবহার করে থিংস এবং ব্যাকগ্রাউন্ড উভয়ের জন্য সিম্যান্টিক মাস্ক একইসাথে প্রেডিক্ট করা।

📖

শব্দ

মাম্বা-ডিইটিআর

একটি অবজেক্ট ডিটেকশন আর্কিটেকচার যা অ্যাটেনশন মেকানিজমের পরিবর্তে মাম্বা থেকে অনুপ্রাণিত স্টেট স্পেস ব্লক ব্যবহার করে, রিয়েল-টাইম অবজেক্ট ডিটেকশনের জন্য লিনিয়ার কমপ্লেক্সিটি এবং প্রতিযোগিতামূলক পারফরম্যান্স প্রদান করে।

এআই গ্লসারি

DETR (DEtection TRansformer)

দ্বিপক্ষীয় ট্রান্সফরমার

বস্তু ক্যোয়ারী (Object Queries)

দ্বিপক্ষীয় ম্যাচিং লস (Bipartite Matching Loss)

এনকোডার-ডিকোডার ট্রান্সফরমার

মাল্টি-হেড মাল্টি-স্কেল অ্যাটেনশন (MSA)

DETR-ResNet

Mask2Former

পজিশন এম্বেডিংস

কন্ডিশনাল ডিইটিআর

ডিফর্মেবল ডিইটিআর

স্পার্স আর-সিএনএন

ক্যোয়ারী-টু-অ্যাটেনশন

ডিনো (উন্নত ডিনোইজিং অ্যাঙ্কর বক্স সহ ডিইটিআর)

ট্রান্সফরমারদের জন্য ফোকাল লস

ট্রান্সফরমার দ্বারা প্যানোপটিক সেগমেন্টেশন

মাম্বা-ডিইটিআর

কোন ফলাফল পাওয়া যায়নি