Glosario IA
El diccionario completo de la Inteligencia Artificial
Agrupamiento K-Means
Algoritmo de particionamiento que divide los documentos en K clústeres minimizando la varianza intra-clúster, asignando cada documento al centroide más cercano.
Agrupamiento Jerárquico
Método de agrupamiento que construye una jerarquía de clústeres anidados, ya sea mediante un enfoque ascendente (aglomerativo) o descendente (divisivo), representado por un dendrograma.
Índice de Jaccard
Coeficiente de similitud que mide la similitud entre dos conjuntos de documentos calculando la proporción de su intersección sobre su unión.
Análisis Semántico Latente (LSA)
Técnica de reducción dimensional que utiliza la descomposición en valores singulares (SVD) para descubrir las relaciones semánticas latentes entre los términos y los documentos.
N-gramas
Secuencias continuas de n elementos (palabras, caracteres) en un texto utilizadas para capturar el contexto local y mejorar la representación semántica de los documentos.
Método del Codo
Técnica heurística para determinar el número óptimo de clústeres identificando el punto donde la adición de clústeres adicionales ya no reduce significativamente la varianza intra-clúster.
Agrupamiento Aglomerativo
Enfoque ascendente del agrupamiento jerárquico que fusiona iterativamente los clústeres más cercanos hasta alcanzar un criterio de parada predefinido.
Agrupamiento de Documentos
Proceso de agrupación automática de documentos en clústeres basados en su similitud de contenido, permitiendo la organización y el descubrimiento de estructuras temáticas.
Frecuencia de Término
Medida normalizada de la frecuencia de aparición de un término en un documento, a menudo utilizada como componente base en los modelos de representación vectorial.
Matriz Documento-Término
Estructura de datos tabular donde cada fila representa un documento y cada columna un término del vocabulario, con las celdas conteniendo los pesos asociados.