এআই গ্লসারি
কৃত্রিম বুদ্ধিমত্তার সম্পূর্ণ অভিধান
ভিজিএএন (ভিডিও জেনারেটিভ অ্যাডভারসারিয়াল নেটওয়ার্ক)
ভিডিও জেনারেশনের জন্য জিএএন-এর একটি অগ্রণী মডেল যা প্রক্রিয়াটিকে স্থির চিত্র জেনারেশন এবং গতি জেনারেশনে বিভক্ত করে, পৃথক চিত্র জেনারেটর এবং গতি জেনারেটর ব্যবহার করে।
টিজিএএন (টেম্পোরাল জেনারেটিভ অ্যাডভারসারিয়াল নেটওয়ার্ক)
জিএএন-এর একটি এক্সটেনশন যা ভিডিও সিকোয়েন্সে সময়গত নির্ভরতা স্পষ্টভাবে মডেল করার জন্য জেনারেটর এবং ডিসক্রিমিনেটরে একটি আরএনএন (রিকারেন্ট নিউরাল নেটওয়ার্ক) স্ট্রাকচার সংহত করে।
মোকোজিএএন (মোশন অ্যান্ড কনটেন্ট জেনারেটিভ অ্যাডভারসারিয়াল নেটওয়ার্ক)
একটি আর্কিটেকচার যা কনটেন্ট জেনারেশন (স্থির চেহারা) এবং গতি (সময়গত গতিশীলতা) পৃথক করে, পৃথক জেনারেটর ব্যবহার করে, যা জেনারেট করা ভিডিও উপাদানগুলির উপর আরও ভাল নিয়ন্ত্রণের অনুমতি দেয়।
৩ডি ডিসক্রিমিনেটর
ভিডিও জিএএন-এ এক ধরনের ডিসক্রিমিনেটর যা স্পেসিও-টেম্পোরাল ভলিউম (ভিডিও কিউব) অপারেট করে জেনারেট করা সিকোয়েন্সের স্থানিক এবং সময়গত সামঞ্জস্য একই সাথে মূল্যায়ন করে।
কন্ডিশনাল ইমেজ জেনারেটর
ভিডিও জিএএন-এর একটি উপাদান যা পূর্ববর্তী চিত্র এবং একটি লেটেন্ট গতি ভেক্টরের উপর ভিত্তি করে প্রতিটি ফ্রেম তৈরি করে, পরপর চিত্রগুলির মধ্যে ভিজ্যুয়াল ধারাবাহিকতা নিশ্চিত করে।
লেটেন্ট মোশন ফ্যাক্টর
একটি ভিডিও জিএএন-এর লেটেন্ট স্পেসে একটি ভেরিয়েবল যা বিশেষভাবে গতি এবং সময়গত গতিশীলতার তথ্য এনকোড করে, স্থির চেহারার ফ্যাক্টর থেকে পৃথক।
ভিডিও-টু-ভিডিও প্রেডিকশন
ভিডিও জিএএন-এর একটি অ্যাপ্লিকেশন যেখানে মডেলটি একটি ইনপুট সিকোয়েন্সের উপর ভিত্তি করে ভবিষ্যত ফ্রেম তৈরি করে, ভিডিওর ভবিষ্যদ্বাণী এবং সময়গত এক্সট্রাপোলেশনের জন্য ব্যবহৃত হয়।
স্থির চিত্র থেকে ভিডিও সিন্থেসিস
স্থির চিত্রগুলিকে অ্যানিমেট করার জন্য ভিডিও জিএএন ব্যবহার করে এমন একটি কৌশল যা মূল চিত্রের পরিচয় এবং বৈশিষ্ট্যগুলি সংরক্ষণ করার সময় বিশ্বাসযোগ্য গতি তৈরি করে।
স্থানিক-কালিক সামঞ্জস্য
ভিডিও GAN-এ একটি নির্দেশক নীতি যা নিশ্চিত করে যে বস্তু ও দৃশ্যগুলি স্থানের মধ্যে (একটি ফ্রেমের ভিতরে) এবং সময়ের মধ্যে (ফ্রেমগুলির মধ্যে) সামঞ্জস্যপূর্ণ বৈশিষ্ট্য বজায় রাখে।
ক্রমবিন্যাসিক ভিডিও GAN
একটি বহু-স্কেল স্থাপত্য যেখানে একটি প্রথম GAN কম রেজোলিউশনে ফ্রেম তৈরি করে এবং একটি দ্বিতীয় GAN উচ্চ রেজোলিউশনে বিবরণ পরিশোধন করে, ভিডিও তৈরির গুণমান ও স্থিতিশীলতা উন্নত করে।
কালিক বৈষমক
ভিডিও GAN-এ একটি বিশেষায়িত উপাদান যা একচেটিয়াভাবে ক্রমগুলির কালিক সামঞ্জস্য মূল্যায়ন করে, প্রায়শই ফ্রেমগুলির মধ্যে রূপান্তর বিশ্লেষণ করতে 3D নেটওয়ার্ক বা পুনরাবৃত্তিমূলক স্থাপত্য ব্যবহার করে।
ভিডিও লেটেন্ট স্পেস
একটি বহুমাত্রিক উপস্থাপনা যেখানে প্রতিটি বিন্দু একটি সম্পূর্ণ ভিডিও ক্রম এনকোড করে, একটি অবিচ্ছিন্ন স্থানে বিভিন্ন উৎপন্ন ভিডিওগুলির মধ্যে নেভিগেশন ও ইন্টারপোলেশন সম্ভব করে।
শর্তযুক্ত ভিডিও GAN
ভিডিও GAN-এর একটি বৈকল্পিক যা নির্দিষ্ট ইনপুট শর্তের ভিত্তিতে ক্রম তৈরি করে, যেমন অ্যাকশন ক্লাস, টেক্সট বর্ণনা বা পূর্বনির্ধারিত গতিপথ।
ভিডিও প্রশিক্ষণ স্থিতিশীলতা
ভিডিও GAN-এ একটি প্রধান চ্যালেঞ্জ যা স্থানিক-কালিক ডেটাতে জেনারেটর ও ডিসক্রিমিনেটরের মধ্যে ভারসাম্য বজায় রাখার সাথে সম্পর্কিত, বিশেষায়িত অপ্টিমাইজেশন কৌশল প্রয়োজন।
অনিরীক্ষিত ভিডিও GAN
একটি পদ্ধতি যেখানে মডেলটি স্পষ্ট কালিক অ্যানোটেশন ছাড়াই সামঞ্জস্যপূর্ণ ভিডিও তৈরি করতে শেখে, কাঁচা ডেটা থেকে স্বয়ংক্রিয়ভাবে গতির কাঠামো আবিষ্কার করে।
লেটেন্ট উপস্থিতি ফ্যাক্টর
একটি ভিডিও GAN-এর লেটেন্ট স্পেসে একটি মাত্রা যা কালিক গতিবিদ্যা থেকে স্বাধীনভাবে একটি দৃশ্যের স্থির বৈশিষ্ট্যগুলি ক্যাপচার করে, যেমন টেক্সচার, রঙ এবং আকৃতি।
দীর্ঘকালীন ভিডিও জিএএন
দীর্ঘ সময়ের দিগন্তে সামঞ্জস্য বজায় রাখার জন্য মেমরি প্রক্রিয়া এবং শ্রেণিবদ্ধ কাঠামো ব্যবহার করে বিস্তৃত ভিডিও ক্রম তৈরি করার জন্য বিশেষায়িত স্থাপত্য।