🏠 Startseite
Vergleiche
📊 Alle Benchmarks 🦖 Dinosaurier v1 🦖 Dinosaurier v2 ✅ To-Do-Listen-Apps 🎨 Kreative freie Seiten 🎯 FSACB - Ultimatives Showcase 🌍 Übersetzungs-Benchmark
Modelle
🏆 Top 10 Modelle 🆓 Kostenlose Modelle 📋 Alle Modelle ⚙️ Kilo Code
Ressourcen
💬 Prompt-Bibliothek 📖 KI-Glossar 🔗 Nützliche Links

KI-Glossar

Das vollständige Wörterbuch der Künstlichen Intelligenz

162
Kategorien
2.032
Unterkategorien
23.060
Begriffe
📖
Begriffe

Audio Transformer

Architecture Transformer adaptée pour le traitement des signaux audio utilisant des mécanismes d'attention sur des représentations temporelles ou fréquentielles des données audio.

📖
Begriffe

Spectrogram Transformer

Variante de Transformer opérant directement sur des spectrogrammes en les découpant en patches traités comme des séquences d'embeddings pour la classification audio.

📖
Begriffe

Wav2Vec 2.0

Modèle d'apprentissage auto-supervisé pour la représentation vocale utilisant une architecture Transformer avec masking quantifié sur les waveforms brutes.

📖
Begriffe

Whisper

Modèle Transformer robuste pour la reconnaissance vocale et la traduction speech-to-text entraîné sur 680k heures de données audio transcrits avec weak supervision.

📖
Begriffe

AudioLM

Modèle language-like pour la génération audio utilisant Transformers hiérarchiques sur des représentations discrètes acoustic et semantic.

📖
Begriffe

Encodec

Neural codec basé sur Transformer avec quantification résiduelle pour la compression et reconstruction audio haute fidélité.

📖
Begriffe

VALL-E

Modèle de synthesis vocale neural codec language utilisant Transformers pour générer parole haute qualité à partir de prompts vocaux de 3 secondes.

📖
Begriffe

Wav2Vec-U

Approche unsupervised pour ASR utilisant des modèles wav2vec 2.0 pré-entraînés sans transcription, exploitant les alignements phonétiques implicites.

📖
Begriffe

MusicGen

Modèle Transformer conditionnel pour la génération musicale utilisant des tokenizers audio et contrôlable par des descriptions textuelles ou mélodies.

📖
Begriffe

MERT

Music Envelope Representation Transformer, modèle pré-entraîné auto-supervisé pour la compréhension musicale utilisant des représentations multi-échelles.

📖
Begriffe

Spec2Vec

Architecture Transformer convertissant des spectrogrammes en embeddings vectoriels pour des tâches de classification et retrieval audio.

🔍

Keine Ergebnisse gefunden