এআই গ্লসারি
কৃত্রিম বুদ্ধিমত্তার সম্পূর্ণ অভিধান
কনভোলিউশনাল নিউরাল নেটওয়ার্ক (সিএনএন)
ইমেজের মতো গ্রিড ডেটা প্রক্রিয়াকরণে বিশেষায়িত ডিপ লার্নিং আর্কিটেকচার, যা বৈশিষ্ট্যের শ্রেণিবিন্যাস শিখতে কনভোলিউশন লেয়ার, পুলিং লেয়ার এবং সম্পূর্ণ সংযুক্ত লেয়ার ব্যবহার করে।
ফিল্টার (বা কার্নেল)
শেখার যোগ্য ওজনের ছোট ম্যাট্রিক্স যা নির্দিষ্ট প্যাটার্ন যেমন এজ, টেক্সচার বা আকৃতি সনাক্ত করতে কনভোলিউশন লেয়ারের ইনপুটের উপর স্লাইড করে।
রিসেপটিভ ফিল্ড
ইনপুট ইমেজের সেই অঞ্চল যা একটি নির্দিষ্ট লেয়ারের একটি নির্দিষ্ট নিউরনকে প্রভাবিত করে, নেটওয়ার্কের গভীর লেয়ারগুলিতে যত এগোতে থাকে এর আকার তত বৃদ্ধি পায়।
অবজেক্ট ডিটেকশন
একটি ইমেজে এক বা একাধিক বস্তুর অবস্থান নির্ধারণ এবং সনাক্তকরণের কাজ, সাধারণত তাদের চারপাশে বাউন্ডিং বক্স আঁকা এবং একটি ক্লাস সংযুক্ত করে।
এনকোডার-ডিকোডার আর্কিটেকচার
নেটওয়ার্কের একটি কাঠামো যা এনকোডিং পাথ নিয়ে গঠিত যা প্রসঙ্গ ক্যাপচার করতে স্থানিক মাত্রা হ্রাস করে, এবং ডিকোডিং পাথ যা ইনপুটের মতো একই আকারের আউটপুট তৈরি করতে এটি বৃদ্ধি করে, সেগমেন্টেশনের জন্য ব্যবহৃত।
ক্যাপসুল নিউরাল নেটওয়ার্ক (ক্যাপসনেট)
সিএনএন-এর একটি বিকল্প যা বৈশিষ্ট্যগুলির স্থানিক শ্রেণিবিন্যাস সংরক্ষণ করতে নিউরনগুলিকে 'ক্যাপসুল'-এ সংগঠিত করে, বস্তুর পোজ এবং রোটেশন ভেরিয়েশন আরও ভালভাবে পরিচালনা করার লক্ষ্যে।
জ্যামিতিক কম্পিউটার ভিশন
কম্পিউটার ভিশনের একটি শাখা যা 2D ইমেজ থেকে 3D বৈশিষ্ট্য এবং কাঠামো অনুমান করার উপর দৃষ্টি নিবদ্ধ করে, যাতে 3D রিকনস্ট্রাকশন এবং ক্যামেরা পোজ এস্টিমেশন এর মতো কাজগুলি অন্তর্ভুক্ত থাকে।
ভিশন ট্রান্সফরমার (ভিআইটি)
একটি আর্কিটেকচার যা মূলত এনএলপির জন্য ডিজাইন করা ট্রান্সফরমারদের অ্যাটেনশন মেকানিজমকে ইমেজ প্যাচের সিকোয়েন্সে প্রয়োগ করে, ক্লাসিফিকেশন টাস্কে সিএনএন-এর সাথে প্রতিদ্বন্দ্বিতা করে।