Inicio 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15  16 17 18 19 20 21 22 23 24 25  


Agregaciones

Además de la disimilitud, HierarchicalTree necesita que se especifique un índice de agregación con el fin de construir la jerarquía. El índice de agregación $\delta$ es una disimilitud definida sobre el conjunto de partes de $\Omega $, sin que necesariamente $\delta(A,A) = 0$, para todo $A \subset \Omega$.


Tabla 4: Indices de agregación.
  Agregación $\delta(h_1,h_2)$
1 MinDistance $\min\{ d(x_i,x_j)\vert x_i \in h_1,x_j \in h_2\}$
2 MaxDistance $\max\{ d(x_i,x_j)\vert x_i \in h_1,x_j \in h_2\}$
3 MeanDistance $ \frac{1}{\mu(h_1) \mu(h_2) } \sum_{x_i \in h_1,x_j \in h_2} p_i p_j d(x_i,x_j) $
4 GravityCenter $ d^2(g_{h_1},g_{h_2}) $
5 Ward $ \frac{\mu(h_1) \mu(h_2)}{\mu(h_1)+\mu(h_2)} d^2(g_{h_1},g_{h_2}) $
6 IncreaseVariance ${\rm var}(h_1\cup h_2) - \frac{\mu(h_1)}{\mu(h_1)+\mu(h_2)} {\rm var}(h_1)$

$- \frac{\mu(h_2)}{\mu(h_1)+\mu(h_2)} {\rm var}(h_2)$

7 JoinInertia $I(h_1\cup h_2)$
8 JoinVariance $ {\rm var}(h_1\cup h_2)$


Las agregaciones que se encuentran en HierarchicalCluster se muestran en la tabla 4. En estas definiciones, la inercia de una clase $h$ es la inercia respecto a su centro de gravedad:

\begin{displaymath}I(h) = \sum_{x_i \in h} p_i d^2(x_i,g_h),\end{displaymath}

donde $p_i$ es el peso asociado al individuo $x_i$ y $\mu(h)$ es el peso del conjunto $h \in {\cal P}(\Omega)$. Se define también ${\rm var}(h) = I(h)/\mu(h)$ como la varianza de $h$.

En la implementación de las agregaciones anteriores, se supone que $p_i = 1/n$ y $\mu(h) = \frac{\mbox{card}(h)}{n}$, y se usa la fórmula de Lance, Williams & Jambu:

\begin{displaymath}\begin{array}{lll}
\delta(h_1\cup h_2,h) & = & a_1 \delta(h_1...
...\ \ + a_7 \vert\delta(h,h_1) - \delta(h,h_2)\vert.
\end{array} \end{displaymath}

Cada función MinDistance, MaxDistance, MeanDistance, GravityCenter, IncreaseVariance,
Ward, JoinInertia, y JoinVariance está definida como una función de nueve parámetros: las cardinalidades de $h_1, h_2$ y $h$, (denotadas ca,cb,cc), las agregaciones $\delta(h_1,h_2)$, $\delta(h_1,h)$ y $\delta(h_2,h)$ (denotadas dab, dac, dbc) y los índices $f(h_1)$, $f(h_2)$ y $f(h)$ (denotados fa,fb,fc). Por ejemplo, en el caso de la agregación de Ward, su definición es:


Ward[ca_,cb_,cc_,dab_,dac_,dbc_,fa_,fb_,fc_] :=
With[{abc = ca+cb+cc}, ((ca+cc)dac + (cb+cc)dbc - cc dab)/abc]

HierarchicalTree acepta como agregación cualquier función de los nueve parámetros mencionados arriba; así, el usuario puede especificar nuevos índices de agregación siempre que respete el orden de los parámetros y que la evaluación sea un número positivo.

 

Revista Virtual Matemática, Educación e Internet

Derechos Reservados