Método de Jerarquización

Los métodos de jerarquización buscan segmentar los datos en jerarquías o árboles de clústers. La representación de los datos de una manera jerarquizada, es útil para resumir y visualizar los datos. Si bien estos métodos segmentan la información de una forma jerarquizada, la data puede no estarlo y no tener una relación evidente de jerarquización, los datos tienen una estructura jerárquica subyacente que es la que se pretende descubrir. (Han, Kamber, & Pei, 2012)

Los métodos de agrupamiento jerárquico pueden encontrar dificultades en cuanto a la selección de los puntos de fusión o los puntos de división. Estas decisiones son críticas, porque una vez que un grupo de objetos se fusiona o se separan, el proceso en el paso siguiente operará en los clústers generados. El proceso no deshará lo realizado previamente, ni llevará a cabo el intercambio de objetos entre los clústers. Por lo tanto, las decisiones de fusión o división, si no está bien elegidas, pueden dar lugar a clústers de baja calidad. Por otra parte, los métodos no se escalan bien, porque cada decisión de fusión o escisión necesita examinar y evaluar muchos objetos o clústers. (Han, Kamber, & Pei, 2012)

Los métodos de agrupamiento jerárquico pueden ser: de aglomeración o de división, dependiendo de si la descomposición jerárquica se generar de abajo hacia arriba (aglomeración) o arriba hacia abajo (división). (Han, Kamber, & Pei, 2012)

Método de Jerarquización Aglomerativo

Un método de agrupamiento jerárquico de aglomeración utiliza una estrategia de abajo hacia arriba. Por lo general comienza por dejar que cada objeto forme su propio clúster y de forma iterativa fusiona los clústers en grupos cada vez más grandes, hasta que todos los objetos están en un solo grupo o ciertas condiciones de terminación están satisfechas. El clúster único se convierte en la raíz de la jerarquía. El proceso de fusión integra los dos grupos que están más cerca entre sí, de acuerdo con alguna medida de similitud, y combina los dos para formar un clúster. Cada iteración fusiona dos clústers, donde cada clúster contiene al menos un objeto. (Han, Kamber, & Pei, 2012)

Método de Jerarquización Divisorio

A la inversa del método anterior, un método de agrupamiento jerárquico divisorio emplea una estrategia de arriba hacia abajo. Se inicia mediante la colocación de todos los objetos en un clúster, que es la raíz de la jerarquía. Luego se divide el clúster raíz en varios subgrupos más pequeños, y de forma recursiva las particiones de esas agrupaciones en otras más pequeñas. El proceso de partición continúa hasta que cada grupo en el nivel más bajo es coherente suficiente, ya sea que contiene sólo un objeto o los objetos dentro de un grupo son suficientemente similares entre sí. (Han, Kamber, & Pei, 2012)

Bibliografía

Han, J., Kamber, M., & Pei, J. (2012). Data Mining Concepts and Techniques (Tercera ed.). Waltham, Massachusetts, USA: Morgan Kaufmann.

Publicado por

Santiago X. Saavedra Y.

Ingeniero Industrial, Master en Administración de Empresas y Master en Gestión de Tecnologías de Información, especializado en Transformación Digital e Inteligencia de Negocios. https://www.linkedin.com/in/sxsaavedra