Inicio 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15  16 17 18 19 20 21 22 23 24 25  

 

Introducción

Los distintos métodos para el análisis de grandes volúmenes de datos han tenido un amplio desarrollo desde al auge de la computación. Así, han surgido diferentes paquetes estadísticos, muchos de ellos comerciales y con un alto precio para los usuarios individuales; otros, de uso más restringido, son de poca difusión y tienen muchas limitaciones. Ahora bien, son muy pocos los programas que tienen la flexibilidad para que el usuario pueda cambiar las rutinas según su gusto o el uso que le dé a los cálculos y resultados.

La aparición de paquetería computacional para el cálculo numérico y simbólico, basada en biblioteca generales, ha tenido un gran auge en los últimos años. Entre ellas, MATHEMATICA es una de la más usadas actualmente.

Con el fin de dotar al usuario no sólo de una herramienta para realizar un análisis de datos complejo, sino también para que él mismo pueda usar los resultados y cambiarlos según sus necesidades, hemos decidido emprender la programación de muchos de los principales métodos en MATHEMATICA: Análisis en Componentes Principales, Análisis de Correspondencias, Clasificación Jerárquica y por Nubes Dinámicas, y Rotaciones Varimax y Varimax Oblicuas.

En el presente trabajo presentamos el desarrollo del método de Clasificación Jerárquica Ascendente. Hemos creado la biblioteca HierarchicalCluster con el propósito de construir árboles jerárquicos de clasificación usando un método ascendente. Esta requiere a su vez, las bibliotecas Dissimilarity, Inertias y Covariances todas agrupadas en un contexto denominado DataAnalysis. Esto significa que para emplear los comandos definidos en todas estas bibliotecas, debe crearse la carpeta DataAnalysis con los archivos: HierarchicalCluster.m, Dissimilarity.m, Inertias.m, Covariances.m y Symbols.m en la siguiente estructura de directorios de los sistemas Windows:



Archivos de programa\Wolfram Research\Mathematica\4.2\AddsOn\Applications

La carpeta DataAnalysis no existe en esta dirección, debe crearse y agregar los archivos mencionados que están disponibles por este medio. A continuación se explican los procedimientos de MATHEMATICA contenidos en HierarchicalCluster.m y Dissimilarity.m que constituyen las herramientas básicas para aplicar el algoritmo de clasificación jerárquica ascendente [1,3] y manipular los resultados obtenidos. Estos procedimientos corren apropiadamente en las versiones 3.0, 4.0 y 4.2 de MATHEMATICA y se activan con la orden:



Needs["DataAnalysis`HierarchicalCluster`"]

Los comandos definidos en Inertias.m se expondrán en un artículo posterior, así como otras bibliotecas de los restantes temas del análisis de datos ya citados.

 

Revista Virtual Matemática, Educación e Internet

Derechos Reservados