এআই গ্লসারি
কৃত্রিম বুদ্ধিমত্তার সম্পূর্ণ অভিধান
ভিডিও ডিফিউশন মডেল
একটি জেনারেশন আর্কিটেকচার যা স্পেসিও-টেম্পোরাল ডেটাতে ডিফিউশন প্রক্রিয়া প্রয়োগ করে, ভিডিও সিকোয়েন্সের ছবিগুলিতে ধাপে ধাপে নয়েজ যোগ করে এবং সামঞ্জস্যপূর্ণ ভিডিও পুনর্গঠন বা তৈরি করতে ডিনয়েজিং শেখার আগে।
স্পেসিও-টেম্পোরাল লেটেন্ট ডিফিউশন
ভিডিও ডিফিউশন মডেলের একটি বৈকল্পিক যা একটি সংকুচিত লেটেন্ট স্পেসে কাজ করে, কম্পিউটেশনাল জটিলতা হ্রাস করে নিম্ন-মাত্রিক উপস্থাপনাগুলিতে নয়েজিং এবং ডিনয়েজিং প্রক্রিয়া প্রয়োগ করে প্রতিটি ফ্রেমের কাঁচা পিক্সেলের পরিবর্তে।
৩ডি অ্যাটেনশন
একটি অ্যাটেনশন মেকানিজম যা একটি ভিডিওর স্পেসিয়াল (উচ্চতা, প্রস্থ) এবং টেম্পোরাল (সময়) মাত্রাগুলি একই সাথে প্রক্রিয়া করে, মডেলটিকে বিভিন্ন সময় জুড়ে বিভিন্ন অঞ্চলের গুরুত্ব ওজন করতে দেয় স্পেসিও-টেম্পোরাল নির্ভরতা ক্যাপচার করার জন্য।
টাইম এমবেডিং
সময়ের তথ্য এনকোডিং কৌশল (ডিফিউশন স্টেপ, সিকোয়েন্সে অবস্থান) ভেক্টর আকারে যা নেটওয়ার্কে ইনজেক্ট করা হয়, সময়ের সাথে সাথে সামঞ্জস্য এবং গতি বজায় রাখার জন্য জেনারেশন প্রক্রিয়াকে গাইড করে।
পূর্ববর্তী ফ্রেম দ্বারা কন্ডিশনাল ডিনয়েজিং
একটি কৌশল যেখানে একটি ভিডিও ফ্রেমের জন্য নয়েজ প্রেডিকশন পূর্ববর্তী ফ্রেমের ডিনয়েজড সংস্করণ দ্বারা কন্ডিশন করা হয়, জেনারেটেড সিকোয়েন্সের পরপর ছবিগুলির মধ্যে শক্ত টেম্পোরাল ধারাবাহিকতা এবং সামঞ্জস্য নিশ্চিত করে।
৩ডি ইউ-নেট আর্কিটেকচার
ভিডিও ডেটার জন্য অভিযোজিত একটি কনভোলিউশনাল নিউরাল নেটওয়ার্ক স্ট্রাকচার, ডিনয়েজিংয়ের সময় একাধিক স্পেসিয়াল এবং টেম্পোরাল স্কেলের কনটেক্সট কার্যকরভাবে ক্যাপচার করতে ৩ডি রেসিডুয়াল কানেকশন সহ এনকোডার-ডিকোডার পাথগুলিকে একত্রিত করে।
স্পেসিও-টেম্পোরাল লেটেন্ট স্পেস
একটি ভিডিও সিকোয়েন্সের সংকুচিত এবং বিমূর্ত উপস্থাপনা, যেখানে স্পেসিয়াল এবং টেম্পোরাল তথ্যগুলি একটি নিম্ন-মাত্রিক ভেক্টর বা ফিচার ম্যাপে এনকোড করা হয়, যা ভিডিও জেনারেশন বা ম্যানিপুলেশনের ভিত্তি হিসেবে কাজ করে।
ভিডিও ক্লাসিফায়ার-ফ্রি গাইডেন্স (সিএফজি)
স্পষ্ট ক্লাসিফায়ার ছাড়াই ভিডিও জেনারেশন নিয়ন্ত্রণের একটি পদ্ধতি, কন্ডিশনাল (যেমন: টেক্সট) এবং আনকন্ডিশনাল ডেটা উভয়ের উপর একটি মডেলকে প্রশিক্ষণ দিয়ে, তারপর প্রম্পটের সাথে আনুগত্য সামঞ্জস্য করার সময় বৈচিত্র্য সংরক্ষণ করে তাদের ভবিষ্যদ্বাণীগুলির মধ্যে ইন্টারপোলেশন করে।
টেম্পোরাল ডিফিউশন শিডিউলিং
প্রতিটি ফ্রেম বা টেম্পোরাল সেগমেন্টে বরাদ্দকৃত ডিনোইজিং স্টেপের সংখ্যা পরিকল্পনা, যা গতির জটিলতার উপর ভিত্তি করে উৎপন্ন ভিডিওর সামগ্রিক গুণমান এবং সামঞ্জস্য অপ্টিমাইজ করার জন্য অভিন্ন বা অভিযোজিত হতে পারে।
ডিফিউশন দ্বারা টেম্পোরাল সুপার-রেজোলিউশন
ভিডিওর ফ্রেম রেট (fps) বাড়ানোর জন্য ডিফিউশন মডেলের প্রয়োগ, বিদ্যমান ফ্রেমগুলির মধ্যে গতি এবং পরিবর্তনগুলিকে বাস্তবসম্মতভাবে ইন্টারপোলেট করে সামঞ্জস্যপূর্ণ মধ্যবর্তী ফ্রেম তৈরি করা।
ডিফিউশন ভিডিও ইনপেইন্টিং
একটি ডিফিউশন মডেল ব্যবহার করে ভিডিও সিকোয়েন্সে অনুপস্থিত বা মাস্ক করা অঞ্চল পূরণের প্রক্রিয়া, যা পার্শ্ববর্তী ফ্রেমগুলির প্রসঙ্গের উপর ভিত্তি করে স্থানিক এবং অস্থায়ীভাবে সামঞ্জস্যপূর্ণ পিক্সেল তৈরি করে।
লেটেন্ট মোশন মডেলিং
একটি কৌশল যেখানে ভিডিওতে গতি সরাসরি লেটেন্ট স্পেসে মডেল করা এবং তৈরি করা হয়, প্রায়শই পরবর্তী ফ্রেমগুলির লেটেন্ট কোডগুলির মধ্যে স্থানচ্যুতি বা রূপান্তর ভবিষ্যদ্বাণী করে, সেগুলিকে চিত্রে ডিকোড করার আগে।
বাধাদ্বারা অস্থায়ী সামঞ্জস্য
একটি পদ্ধতি যা সংলগ্ন ফ্রেমগুলির মধ্যে গতিবিহীন চেহারার পরিবর্তন (যেমন: রঙ, টেক্সচার) নিরুৎসাহিত করার জন্য মডেলের লস ফাংশনে একটি স্পষ্ট জরিমানা বা বাধা যোগ করে, দৃশ্যমান স্থিতিশীলতা প্রচার করে।
স্পেসিও-টেম্পোরাল নয়েজ ডিকম্পোজিশন
একটি উন্নত পদ্ধতি যেখানে মডেল দ্বারা যোগ এবং ভবিষ্যদ্বাণী করা নয়েজ একটি স্পেসিয়াল কম্পোনেন্ট (চেহারা) এবং একটি টেম্পোরাল কম্পোনেন্ট (গতি) তে বিভক্ত হয়, গতিশীল ভিডিও তৈরি করার জন্য আরও সূক্ষ্ম নিয়ন্ত্রণ এবং আরও শক্তিশীল জেনারেশন অনুমতি দেয়।
ডিফিউশন লেটেন্টসে অটোরিগ্রেশন
একটি হাইব্রিড কৌশল যা ফ্রেম দ্বারা ফ্রেম অটোরিগ্রেসিভভাবে একটি ভিডিও তৈরি করে, যেখানে প্রতিটি লেটেন্ট ফ্রেম পূর্ববর্তী লেটেন্ট ফ্রেম দ্বারা শর্তযুক্ত একটি ডিফিউশন স্টেপ দ্বারা উত্পাদিত হয়, অটোরিগ্রেশনের সামঞ্জস্য এবং ডিফিউশনের গুণমান একত্রিত করে।
টেম্পোরাল ফিচার নরমালাইজেশন
একটি 3D U-Net-এ ফিচার ম্যাপগুলির টেম্পোরাল ডাইমেনশনে প্রয়োগ করা নরমালাইজেশন লেয়ার, সিকোয়েন্সের বিভিন্ন টেম্পোরাল পর্যায় জুড়ে অ্যাক্টিভেশনগুলির বিতরণ সামঞ্জস্যপূর্ণ থাকার নিশ্চিত করে প্রশিক্ষণ স্থিতিশীল করে।