Глоссарий ИИ
Полный словарь искусственного интеллекта
Псевдо-метки
Метки, автоматически генерируемые алгоритмами кластеризации для аппроксимации истинных меток в контексте самообучения. Они позволяют преобразовать немаркированные данные в искусственно размеченные данные для обучения с учителем.
Самоконтролируемая иерархическая кластеризация
Метод кластеризации, который строит иерархию вложенных кластеров без явного контроля, используемый для генерации псевдо-меток на различных уровнях детализации. Этот подход позволяет проводить многоуровневое исследование структуры данных.
Самоконтролируемый K-means
Вариант классического алгоритма K-means, применяемый в рамках самообучения для создания псевдо-меток из немаркированных данных. Полученные центры кластеров затем служат прототипами для обучения с учителем.
Адаптивный DBSCAN
Улучшенная версия DBSCAN, которая автоматически настраивает свои параметры в зависимости от локальной плотности данных в контексте самообучения. Этот метод позволяет обнаруживать кластеры различной формы и неоднородной плотности.
Полуконтролируемая спектральная кластеризация
Техника кластеризации, использующая собственные значения матрицы сходства для идентификации структур данных, с автоматически генерируемыми частичными ограничениями. Она объединяет спектральную информацию с псевдо-метками для улучшения согласованности кластеров.
Автоматическое присвоение слабых меток
Процесс генерации неточных, но полезных меток на основе внутренних характеристик данных без вмешательства человека. Эти слабые метки служат обучающим сигналом для надежных моделей обучения с учителем.
Самоконтролируемое контрастное обучение
Парадигма обучения, в котором модель учится различать похожие (положительные) и непохожие (отрицательные) образцы без явных меток. Естественным образом сформированные кластеры предоставляют псевдо-метки для обучения.
Кластеризация на основе плотности
Семейство алгоритмов, которые идентифицируют кластеры как области высокой плотности, разделенные областями низкой плотности в пространстве признаков. Этот подход особенно эффективен для обнаружения кластеров произвольной формы.
Algorithme de clustering itératif
Méthode de clustering qui raffine progressivement les pseudo-étiquettes à travers plusieurs itérations d'assignation et de mise à jour des centroïdes. Chaque itération améliore la cohésion intra-cluster et la séparation inter-cluster.
Validation de cluster interne
Ensemble de métriques évaluant la qualité des clusters générés sans référence à des étiquettes externes, utilisées pour optimiser les pseudo-étiquettes. Ces mesures incluent le coefficient de silhouette, l'indice de Davies-Bouldin et le score de Calinski-Harabasz.
Clustering à haute dimension
Défi technique consistant à regrouper des données dans des espaces de très grande dimensionnalité où la notion de distance perd sa signification. Des techniques spécialisées comme la réduction de dimensionnalité sont nécessaires pour un clustering efficace.
Réduction de dimensionnalité pour clustering
Étape préliminaire essentielle dans le clustering auto-supervisé qui transforme les données en un espace de plus faible dimension tout en préservant la structure des clusters. Elle améliore l'efficacité computationnelle et la qualité des pseudo-étiquettes.
Clustering basé sur les graphes
Approche de clustering qui modélise les données comme un graphe où les nœuds représentent les échantillons et les arêtes les similarités. Les communautés détectées dans ce graphe correspondent aux clusters utilisés pour générer les pseudo-étiquettes.
Clustering par propagation d'affinité
Algorithme qui identifie des exemplaires représentatifs dans les données et attribue chaque point à l'exemplaire le plus approprié sans nécessiter de nombre de clusters prédéfini. Cette méthode est particulièrement adaptée pour découvrir des structures de données complexes.
Clustering par mélanges gaussiens
Approche probabiliste qui modélise les données comme un mélange de plusieurs distributions gaussiennes, chaque composante représentant un cluster. Les probabilités d'appartenance servent de pseudo-étiquettes souples pour l'apprentissage supervisé.
Clustering incrémental
Méthode de clustering capable de mettre à jour les pseudo-étiquettes au fur et à mesure de l'arrivée de nouvelles données sans nécessiter de recalcul complet. Cette approche est essentielle pour les systèmes d'apprentissage en continu.
Многовидовая кластеризация
Парадигма, объединяющая информацию из нескольких представлений или перспектив одних и тех же данных для улучшения качества кластеров и псевдо-меток. Этот подход использует взаимодополняемость различных видов для более надежного обучения.
Глубокая кластеризация
Сочетание глубоких нейронных сетей с алгоритмами кластеризации для обучения оптимальным представлениям и генерации псевдо-меток в сквозном режиме. Этот подход позволяет выявлять сложные нелинейные структуры в данных.