এআই গ্লসারি
কৃত্রিম বুদ্ধিমত্তার সম্পূর্ণ অভিধান
Rééchantillonnage (Reparameterization Trick)
Technique permettant la différenciation du processus d'échantillonnage aléatoire du VAE en décomposant la variable aléatoire en une partie déterministe et une partie stochastique indépendante, facilitant la rétropropagation du gradient.
Borne Inférieure Variationnelle (ELBO)
Objectif d'optimisation des VAE, équivalant à la log-vraisemblance des données moins la divergence KL, servant de proxy tractable pour maximiser la vraisemblance des données observées.
Modèle de Dynamique Latent
Modèle apprenant la transition d'états dans l'espace latent, prédisant la représentation latente suivante à partir de l'état latent actuel et de l'action, réduisant la complexité de la modélisation de la dynamique de l'environnement.
Planification dans l'Espace Latent
Stratégie où l'agent recherche une séquence d'actions optimales en utilisant le modèle de dynamique latent pour simuler les conséquences futures sans interagir directement avec l'environnement réel.
Modèle du Monde (World Model)
Architecture combinant un VAE pour la perception, un modèle de dynamique (RNN ou MDP) pour la prédiction d'états latents, et un agent de contrôle (policy) opérant entièrement dans cet espace latent simulé.
Distribution Postérieure Approximative (q)
Distribution paramétrée par le réseau encodeur qui approxime la vraie distribution postérieure des variables latentes conditionnellement aux observations, rendant l'inférence tractable.
Distribution A Priori (p)
Distribution choisie pour les variables latentes, typiquement une gaussienne isotropique standard, servant de régularisateur pour structurer l'espace latent et éviter le sur-apprentissage.
Autoencodeur Déterministe vs. Stochastique
Distinction où l'autoencodeur déterministe mappe chaque entrée à un point latent unique, tandis que le VAE stochastique mappe chaque entrée à une distribution, capturant l'incertitude et permettant la génération de données nouvelles.
বিটা ফ্যাক্টর (β-VAE)
ELBO লস ফাংশনের KL রেগুলারাইজেশন টার্মের ওজন নির্ধারণকারী হাইপারপ্যারামিটার, যা পুনর্গঠনের গুণমান এবং ল্যাটেন্ট ফ্যাক্টরগুলির বিচ্ছিন্নকরণের (disentanglement) মাত্রার মধ্যে আপস নিয়ন্ত্রণ করে।
প্রতিনিধিত্বের বিচ্ছিন্নকরণ (Disentanglement)
একটি ল্যাটেন্ট স্পেসের বৈশিষ্ট্য যেখানে প্রতিটি মাত্রা ডেটার একটি স্বতন্ত্র সেমান্টিক ভেরিয়েশন ফ্যাক্টরের সাথে ব্যাখ্যাযোগ্যভাবে সম্পর্কিত, যা মডেলের জেনারেলাইজেশন এবং ব্যাখ্যাযোগ্যতা উন্নত করে।
ল্যাটেন্ট ট্রানজিশন মডেল
ওয়ার্ল্ড মডেলের একটি উপাদান যা বর্তমান ল্যাটেন্ট অবস্থা এবং প্রয়োগ করা অ্যাকশনের উপর ভিত্তি করে পরবর্তী ল্যাটেন্ট অবস্থার বন্টন পূর্বাভাস দেয়, যা প্ল্যানারের জন্য কল্পনামূলক সিমুলেশনের (imagination) ভিত্তি তৈরি করে।
নিয়ন্ত্রণ এজেন্ট (Controller)
অ্যাকশন সিদ্ধান্ত গ্রহণকারী পলিসি বা নিউরাল নেটওয়ার্ক, যা ওয়ার্ল্ড মডেলের ক্ষেত্রে, প্রকৃত পরিবেশ থেকে নয় বরং ল্যাটেন্ট স্পেসে উৎপন্ন অভিজ্ঞতা ব্যবহার করে প্রশিক্ষিত হয়।