AI用語集
人工知能の完全辞典
236
カテゴリ
3,245
サブカテゴリ
39,334
用語
用語
オーディオ埋め込み
音声セグメントの低次元で密なベクトル表現。ニューラルネットワークによって自動的に学習され、音声のセマンティックな特徴を捉える。
用語
音響シーン分類
記録された環境音響特性から音響環境(屋内/屋外、通りのオフィスなど)を自動的に識別するプロセス。
用語
オーディオ拡張
分類モデルの堅牢性と一般化を向上させるために、学習用オーディオデータを変換する技術(ノイズ追加、ピッチシフト、タイムストレッチなど)。
用語
時間的畳み込みネットワーク(TCN)
オーディオ系列内の長期的な時間的依存関係を効率的にモデル化するために、拡張因果的畳み込みを使用するニューラルネットワークアーキテクチャ。
用語
オーディオ特徴量エンジニアリング
分類アルゴリズムに供給するために、識別的なオーディオ特徴量(時間的、周波数的、知覚的)を手動で抽出・選択するプロセス。
用語
オーディオの転移学習
大規模なオーディオコーパスで事前学習されたモデルを特定の分類タスクに適応させ、学習データの必要性を削減する手法。
用語
オーディオイベント検出
連続オーディオ録音内で、特定の音響イベント(アラーム、爆発、拍手など)を時間的に特定し分類すること。
用語
オーディオ前処理
抽出される特徴量の品質を最適化するために、生信号に適用される初期処理(正規化、窓処理、フィルタリングなど)。
用語
ディープオーディオ分類器
生のスペクトル表現から直接オーディオ分類を行うために、エンドツーエンドで学習された深層学習モデル(CNN、RNN、Transformer)。
🔍