音声分類 - AI用語集

📖

用語

音声セグメントの低次元で密なベクトル表現。ニューラルネットワークによって自動的に学習され、音声のセマンティックな特徴を捉える。

📖

用語

記録された環境音響特性から音響環境（屋内/屋外、通りのオフィスなど）を自動的に識別するプロセス。

📖

用語

分類モデルの堅牢性と一般化を向上させるために、学習用オーディオデータを変換する技術（ノイズ追加、ピッチシフト、タイムストレッチなど）。

📖

用語

オーディオ系列内の長期的な時間的依存関係を効率的にモデル化するために、拡張因果的畳み込みを使用するニューラルネットワークアーキテクチャ。

📖

用語

分類アルゴリズムに供給するために、識別的なオーディオ特徴量（時間的、周波数的、知覚的）を手動で抽出・選択するプロセス。

📖

用語

大規模なオーディオコーパスで事前学習されたモデルを特定の分類タスクに適応させ、学習データの必要性を削減する手法。

📖

用語

連続オーディオ録音内で、特定の音響イベント（アラーム、爆発、拍手など）を時間的に特定し分類すること。

📖

用語

抽出される特徴量の品質を最適化するために、生信号に適用される初期処理（正規化、窓処理、フィルタリングなど）。

📖

用語

生のスペクトル表現から直接オーディオ分類を行うために、エンドツーエンドで学習された深層学習モデル（CNN、RNN、Transformer）。

AI用語集