ভিডিও এবং সময়গত বিস্তার - কৃত্রিম বুদ্ধিমত্তা শব্দাবলী

📖

শব্দ

ভিডিও ডিফিউশন মডেল

একটি জেনারেশন আর্কিটেকচার যা স্পেসিও-টেম্পোরাল ডেটাতে ডিফিউশন প্রক্রিয়া প্রয়োগ করে, ভিডিও সিকোয়েন্সের ছবিগুলিতে ধাপে ধাপে নয়েজ যোগ করে এবং সামঞ্জস্যপূর্ণ ভিডিও পুনর্গঠন বা তৈরি করতে ডিনয়েজিং শেখার আগে।

📖

শব্দ

স্পেসিও-টেম্পোরাল লেটেন্ট ডিফিউশন

ভিডিও ডিফিউশন মডেলের একটি বৈকল্পিক যা একটি সংকুচিত লেটেন্ট স্পেসে কাজ করে, কম্পিউটেশনাল জটিলতা হ্রাস করে নিম্ন-মাত্রিক উপস্থাপনাগুলিতে নয়েজিং এবং ডিনয়েজিং প্রক্রিয়া প্রয়োগ করে প্রতিটি ফ্রেমের কাঁচা পিক্সেলের পরিবর্তে।

📖

শব্দ

৩ডি অ্যাটেনশন

একটি অ্যাটেনশন মেকানিজম যা একটি ভিডিওর স্পেসিয়াল (উচ্চতা, প্রস্থ) এবং টেম্পোরাল (সময়) মাত্রাগুলি একই সাথে প্রক্রিয়া করে, মডেলটিকে বিভিন্ন সময় জুড়ে বিভিন্ন অঞ্চলের গুরুত্ব ওজন করতে দেয় স্পেসিও-টেম্পোরাল নির্ভরতা ক্যাপচার করার জন্য।

📖

শব্দ

টাইম এমবেডিং

সময়ের তথ্য এনকোডিং কৌশল (ডিফিউশন স্টেপ, সিকোয়েন্সে অবস্থান) ভেক্টর আকারে যা নেটওয়ার্কে ইনজেক্ট করা হয়, সময়ের সাথে সাথে সামঞ্জস্য এবং গতি বজায় রাখার জন্য জেনারেশন প্রক্রিয়াকে গাইড করে।

📖

শব্দ

পূর্ববর্তী ফ্রেম দ্বারা কন্ডিশনাল ডিনয়েজিং

একটি কৌশল যেখানে একটি ভিডিও ফ্রেমের জন্য নয়েজ প্রেডিকশন পূর্ববর্তী ফ্রেমের ডিনয়েজড সংস্করণ দ্বারা কন্ডিশন করা হয়, জেনারেটেড সিকোয়েন্সের পরপর ছবিগুলির মধ্যে শক্ত টেম্পোরাল ধারাবাহিকতা এবং সামঞ্জস্য নিশ্চিত করে।

📖

শব্দ

৩ডি ইউ-নেট আর্কিটেকচার

ভিডিও ডেটার জন্য অভিযোজিত একটি কনভোলিউশনাল নিউরাল নেটওয়ার্ক স্ট্রাকচার, ডিনয়েজিংয়ের সময় একাধিক স্পেসিয়াল এবং টেম্পোরাল স্কেলের কনটেক্সট কার্যকরভাবে ক্যাপচার করতে ৩ডি রেসিডুয়াল কানেকশন সহ এনকোডার-ডিকোডার পাথগুলিকে একত্রিত করে।

📖

শব্দ

স্পেসিও-টেম্পোরাল লেটেন্ট স্পেস

একটি ভিডিও সিকোয়েন্সের সংকুচিত এবং বিমূর্ত উপস্থাপনা, যেখানে স্পেসিয়াল এবং টেম্পোরাল তথ্যগুলি একটি নিম্ন-মাত্রিক ভেক্টর বা ফিচার ম্যাপে এনকোড করা হয়, যা ভিডিও জেনারেশন বা ম্যানিপুলেশনের ভিত্তি হিসেবে কাজ করে।

📖

শব্দ

ভিডিও ক্লাসিফায়ার-ফ্রি গাইডেন্স (সিএফজি)

স্পষ্ট ক্লাসিফায়ার ছাড়াই ভিডিও জেনারেশন নিয়ন্ত্রণের একটি পদ্ধতি, কন্ডিশনাল (যেমন: টেক্সট) এবং আনকন্ডিশনাল ডেটা উভয়ের উপর একটি মডেলকে প্রশিক্ষণ দিয়ে, তারপর প্রম্পটের সাথে আনুগত্য সামঞ্জস্য করার সময় বৈচিত্র্য সংরক্ষণ করে তাদের ভবিষ্যদ্বাণীগুলির মধ্যে ইন্টারপোলেশন করে।

📖

শব্দ

টেম্পোরাল ডিফিউশন শিডিউলিং

প্রতিটি ফ্রেম বা টেম্পোরাল সেগমেন্টে বরাদ্দকৃত ডিনোইজিং স্টেপের সংখ্যা পরিকল্পনা, যা গতির জটিলতার উপর ভিত্তি করে উৎপন্ন ভিডিওর সামগ্রিক গুণমান এবং সামঞ্জস্য অপ্টিমাইজ করার জন্য অভিন্ন বা অভিযোজিত হতে পারে।

📖

শব্দ

ডিফিউশন দ্বারা টেম্পোরাল সুপার-রেজোলিউশন

ভিডিওর ফ্রেম রেট (fps) বাড়ানোর জন্য ডিফিউশন মডেলের প্রয়োগ, বিদ্যমান ফ্রেমগুলির মধ্যে গতি এবং পরিবর্তনগুলিকে বাস্তবসম্মতভাবে ইন্টারপোলেট করে সামঞ্জস্যপূর্ণ মধ্যবর্তী ফ্রেম তৈরি করা।

📖

শব্দ

ডিফিউশন ভিডিও ইনপেইন্টিং

একটি ডিফিউশন মডেল ব্যবহার করে ভিডিও সিকোয়েন্সে অনুপস্থিত বা মাস্ক করা অঞ্চল পূরণের প্রক্রিয়া, যা পার্শ্ববর্তী ফ্রেমগুলির প্রসঙ্গের উপর ভিত্তি করে স্থানিক এবং অস্থায়ীভাবে সামঞ্জস্যপূর্ণ পিক্সেল তৈরি করে।

📖

শব্দ

লেটেন্ট মোশন মডেলিং

একটি কৌশল যেখানে ভিডিওতে গতি সরাসরি লেটেন্ট স্পেসে মডেল করা এবং তৈরি করা হয়, প্রায়শই পরবর্তী ফ্রেমগুলির লেটেন্ট কোডগুলির মধ্যে স্থানচ্যুতি বা রূপান্তর ভবিষ্যদ্বাণী করে, সেগুলিকে চিত্রে ডিকোড করার আগে।

📖

শব্দ

বাধাদ্বারা অস্থায়ী সামঞ্জস্য

একটি পদ্ধতি যা সংলগ্ন ফ্রেমগুলির মধ্যে গতিবিহীন চেহারার পরিবর্তন (যেমন: রঙ, টেক্সচার) নিরুৎসাহিত করার জন্য মডেলের লস ফাংশনে একটি স্পষ্ট জরিমানা বা বাধা যোগ করে, দৃশ্যমান স্থিতিশীলতা প্রচার করে।

📖

শব্দ

স্পেসিও-টেম্পোরাল নয়েজ ডিকম্পোজিশন

একটি উন্নত পদ্ধতি যেখানে মডেল দ্বারা যোগ এবং ভবিষ্যদ্বাণী করা নয়েজ একটি স্পেসিয়াল কম্পোনেন্ট (চেহারা) এবং একটি টেম্পোরাল কম্পোনেন্ট (গতি) তে বিভক্ত হয়, গতিশীল ভিডিও তৈরি করার জন্য আরও সূক্ষ্ম নিয়ন্ত্রণ এবং আরও শক্তিশীল জেনারেশন অনুমতি দেয়।

📖

শব্দ

ডিফিউশন লেটেন্টসে অটোরিগ্রেশন

একটি হাইব্রিড কৌশল যা ফ্রেম দ্বারা ফ্রেম অটোরিগ্রেসিভভাবে একটি ভিডিও তৈরি করে, যেখানে প্রতিটি লেটেন্ট ফ্রেম পূর্ববর্তী লেটেন্ট ফ্রেম দ্বারা শর্তযুক্ত একটি ডিফিউশন স্টেপ দ্বারা উত্পাদিত হয়, অটোরিগ্রেশনের সামঞ্জস্য এবং ডিফিউশনের গুণমান একত্রিত করে।

📖

শব্দ

টেম্পোরাল ফিচার নরমালাইজেশন

একটি 3D U-Net-এ ফিচার ম্যাপগুলির টেম্পোরাল ডাইমেনশনে প্রয়োগ করা নরমালাইজেশন লেয়ার, সিকোয়েন্সের বিভিন্ন টেম্পোরাল পর্যায় জুড়ে অ্যাক্টিভেশনগুলির বিতরণ সামঞ্জস্যপূর্ণ থাকার নিশ্চিত করে প্রশিক্ষণ স্থিতিশীল করে।

এআই গ্লসারি

ভিডিও ডিফিউশন মডেল

স্পেসিও-টেম্পোরাল লেটেন্ট ডিফিউশন

৩ডি অ্যাটেনশন

টাইম এমবেডিং

পূর্ববর্তী ফ্রেম দ্বারা কন্ডিশনাল ডিনয়েজিং

৩ডি ইউ-নেট আর্কিটেকচার

স্পেসিও-টেম্পোরাল লেটেন্ট স্পেস

ভিডিও ক্লাসিফায়ার-ফ্রি গাইডেন্স (সিএফজি)

টেম্পোরাল ডিফিউশন শিডিউলিং

ডিফিউশন দ্বারা টেম্পোরাল সুপার-রেজোলিউশন

ডিফিউশন ভিডিও ইনপেইন্টিং

লেটেন্ট মোশন মডেলিং

বাধাদ্বারা অস্থায়ী সামঞ্জস্য

স্পেসিও-টেম্পোরাল নয়েজ ডিকম্পোজিশন

ডিফিউশন লেটেন্টসে অটোরিগ্রেশন

টেম্পোরাল ফিচার নরমালাইজেশন

কোন ফলাফল পাওয়া যায়নি