Glossario IA
Il dizionario completo dell'Intelligenza Artificiale
Pix2Pix
Architecture de réseau neuronal antagoniste génératif (GAN) conditionnel conçue pour la traduction d'image à image, utilisant des paires d'images alignées pour un apprentissage supervisé de transformations précises.
Perte L1
Fonction de perte, aussi appelée erreur absolue moyenne, utilisée dans Pix2Pix pour encourager la fidélité pixel à pixel entre l'image générée et l'image cible en pénalisant la différence absolue.
Générateur U-Net
Architecture de réseau neuronal en forme de U avec des connexions de saut (skip connections) qui préserve les informations de bas niveau tout en apprenant des caractéristiques de haut niveau, essentielle pour la traduction d'image précise.
Discriminateur PatchGAN
Type de discriminateur qui évalue la réalisme de l'image non pas globalement mais sur des patches de taille N×N, permettant de capturer des détails de haute fréquence et de textures locales.
Paires Alignées
Ensemble de données d'apprentissage composé d'images d'entrée et de leurs images cibles correspondantes, pixel à pixel, qui servent de vérité terrain pour l'apprentissage supervisé de Pix2Pix.
Traduction Image-à-Image
Tâche de vision par ordinateur consistant à convertir une image d'un domaine à un autre, par exemple transformer un croquis en photo ou une carte en image satellite, en utilisant des modèles d'apprentissage profond.
Connexions de Saut (Skip Connections)
Liens directs dans une architecture de réseau neuronal qui contournent certaines couches pour transmettre des informations de bas niveau (comme les textures) de l'encodeur vers le décodeur, améliorant la précision de la reconstruction.
Fonction d'Activation ReLU
Fonction d'activation non linéaire (Rectified Linear Unit) couramment utilisée dans les GAN pour introduire de la non-linéarité, définie comme f(x) = max(0, x), et qui aide à accélérer la convergence.
Instabilité de Mode
Problème courant dans l'entraînement des GAN où le générateur s'effondre et produit une diversité limitée de sorties, ignorant certains modes de la distribution des données cibles.
Vérité Terrain (Ground Truth)
Dans le contexte de Pix2Pix, l'image cible réelle et parfaitement alignée qui est utilisée pour superviser l'entraînement et calculer les pertes de reconstruction (L1) et d'adversarité.