এআই গ্লসারি
কৃত্রিম বুদ্ধিমত্তার সম্পূর্ণ অভিধান
সিএনএন ৩ডি
ভলিউমেট্রিক বা ভিডিও ডেটার উপর ত্রিমাত্রিক কনভলিউশন প্রয়োগ করে স্থানিক ও সময়গত বৈশিষ্ট্যগুলি একইসাথে ক্যাপচার করার জন্য কনভলিউশনাল নিউরাল নেটওয়ার্ক আর্কিটেকচার।
কনভলিউশন ৩ডি
উচ্চতা, প্রস্থ এবং গভীরতা/সময়গত মাত্রা অতিক্রম করে স্পেসিও-টেম্পোরাল ফিচার নিষ্কাশনের জন্য একটি ত্রিমাত্রিক ফিল্টারকে একটি ৩ডি ইনপুট টেনসরে প্রয়োগ করার গাণিতিক অপারেশন।
পুলিং ৩ডি
গণনামূলক জটিলতা হ্রাস করার সময় প্রয়োজনীয় তথ্য সংরক্ষণ করে স্থানিক ও সময়গত সাব-স্যাম্পলিং সম্পাদনকারী ৩ডি ভলিউমে প্রয়োগকৃত মাত্রিকতা হ্রাসের কৌশল।
সি৩ডি (কনভলিউশনাল ৩ডি নেটওয়ার্ক)
পুরো নেটওয়ার্ক জুড়ে অভিন্ন ৩x৩x৩ কনভলিউশন ব্যবহার করে ভিডিও বিশ্লেষণের জন্য ত্রিমাত্রিক কনভলিউশনের কার্যকারিতা প্রদর্শনকারী অগ্রগামী সিএনএন ৩ডি আর্কিটেকচার।
আই৩ডি (ইনফ্লেটেড ৩ডি কনভনেট)
ইমেজনেটে প্রি-ট্রেইন্ড ২ডি ফিল্টারগুলিকে ৩ডি ফিল্টারে 'ফুলিয়ে' তোলার উদ্ভাবনী পদ্ধতি, যা ২ডি ইমেজ থেকে ৩ডি ভিডিওতে দক্ষতার সাথে জ্ঞান স্থানান্তর করতে সক্ষম করে।
রেসনেট৩ডি
ভলিউমেট্রিক ডেটাতে অত্যন্ত গভীর নেটওয়ার্কগুলির প্রশিক্ষণ সহজতর করার জন্য ত্রিমাত্রিক কনভলিউশনে রেসিডুয়াল কানেকশন সংহতকারী রেসিডুয়াল নেটওয়ার্ক আর্কিটেকচারের ৩ডি এক্সটেনশন।
স্পেসিও-টেম্পোরাল অ্যাটেনশন
জটিল অ্যাকশন রিকগনিশন উন্নত করার জন্য একটি ভিডিও সিকোয়েন্সে স্থানিক অঞ্চল এবং সময়গত মুহুর্তগুলির গুরুত্ব গতিশীলভাবে ওজন করার অ্যাটেনশন মেকানিজম।
ভলিউমেট্রিক ফিচার ম্যাপস
ইনপুট সিকোয়েন্সের বিভিন্ন স্থানিক অবস্থান এবং সময়গত মুহুর্তে শেখা বৈশিষ্ট্যগুলি প্রতিনিধিত্বকারী ৩ডি কনভলিউশন অপারেশনের পরে আউটপুট ৩ডি টেনসর।
কার্নেল ৩ডি
তিন-মাত্রিক কনভোলিউশনাল ফিল্টার যার আকার (d, h, w) যা ইনপুট ভলিউমের মাধ্যমে স্লাইড করে ভিডিও বা ভলিউম্যাট্রিক ডেটাতে স্থানিক-কালীন স্থানীয় প্যাটার্ন সনাক্ত করে।
টেম্পোরাল পুলিং
সময়গত সমষ্টিকরণ অপারেশন যা ধারাবাহিক একাধিক ফ্রেমের বৈশিষ্ট্যগুলিকে সংযুক্ত করে সিকোয়েন্সের একটি কমপ্যাক্ট উপস্থাপনা তৈরি করে, গতিশীল তথ্য সংরক্ষণ করার সময়।
ভিডিও শ্রেণীবিভাগ
সম্পূর্ণ ভিডিওগুলিকে পূর্বনির্ধারিত বিভাগে স্বয়ংক্রিয়ভাবে শ্রেণীবদ্ধ করার কাজ, যেখানে সামগ্রিক স্থানিক-কালীন বিষয়বস্তু বিশ্লেষণের জন্য ৩ডি সিএনএন আর্কিটেকচার ব্যবহার করা হয়।
অ্যাকশন শনাক্তকরণ
৩ডি সিএনএন-এর প্রয়োগ যা ভিডিও সিকোয়েন্সে মানুষের ক্রিয়াকলাপ সনাক্ত এবং শ্রেণীবিভাগ করে, স্থানিক-কালীন চলাফেরা এবং মিথস্ক্রিয়া ধারণ করে।
মেডিকেল ইমেজিং ৩ডি
৩ডি সিএনএন-এর প্রয়োগের ক্ষেত্র যা ভলিউম্যাট্রিক মেডিকেল ইমেজ (সিটি, এমআরআই) বিশ্লেষণের জন্য ব্যবহৃত হয়, টিউমার সনাক্তকরণ, অঙ্গ সেগমেন্টেশন এবং সহায়ক ডায়াগনোসিস সক্ষম করে।
অপটিক্যাল ফ্লো
ভেক্টর ক্ষেত্র যা ধারাবাহিক ছবির মধ্যে আপাত গতিবিধি উপস্থাপন করে, প্রায়শই ৩ডি সিএনএন আর্কিটেকচারে অতিরিক্ত ইনপুট চ্যানেল হিসাবে সংহত করা হয় গতিবিধি বোঝার উন্নতির জন্য।
টু-স্ট্রিম নেটওয়ার্ক
আর্কিটেকচার যা একটি স্পেসিয়াল স্ট্রিম (আরজিবি ফ্রেম) এবং একটি টেম্পোরাল স্ট্রিম (অপটিক্যাল ফ্লো) সংযুক্ত করে, ভিডিও বিশ্লেষণে চেহারা এবং গতিবিধি উভয়ই ধারণ করার জন্য দেরিতে ফিউজ করা হয়।
স্থানিক-কালীন স্যাম্পলিং
প্রশিক্ষণের সময় সংলগ্ন এবং অ-ওভারল্যাপিং ভিডিও সেগমেন্ট নমুনা সংগ্রহের কৌশল, যা নিয়ন্ত্রিত জটিলতার সাথে সময়মাত্রার কার্যকর কভারেজ সক্ষম করে।
ভলিউমেট্রিক ডেটা
তিন মাত্রিক (x, y, z) কাঠামোবদ্ধ ডেটা যা সম্পূর্ণ স্থানিক তথ্য যেমন মেডিকেল স্ক্যানার, 3D মডেল বা টেম্পোরাল ভিডিও কিউব প্রতিনিধিত্ব করে।
মাল্টি-ভিউ সিএনএন
একটি পদ্ধতি যা জটিল জ্যামিতিক সম্পর্ক ক্যাপচার করার জন্য 3D কনভলিউশন ব্যবহার করে একটি 3D অবজেক্ট বা ভিডিও দৃশ্যের একাধিক দৃষ্টিকোণ বা ভিউ একই সাথে প্রক্রিয়া করে।
ডিপ 3D সিএনএন
3D সিএনএন আর্কিটেকচার যেখানে অনেকগুলি কনভলিউশনাল লেয়ার স্ট্যাক করা থাকে (সাধারণত >50) যা উন্নত কাজের জন্য অত্যন্ত জটিল স্পেসিও-টেম্পোরাল ফিচারের শ্রেণিবিন্যাস শিখতে সক্ষম।
টেম্পোরাল মডেলিং
3D সিএনএন-এর সময়গত নির্ভরতা ক্যাপচার এবং মডেল করার ক্ষমতা এবং সময়ের সাথে ফিচারগুলির বিবর্তন, যা ভিডিও সিকোয়েন্সের গতিশীলতা বোঝার জন্য অপরিহার্য।