Inicio 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15  16 17 18 19 20 21 22 23 24 25  

 

Disimilitudes sobre tablas de datos con variables cuantitativas

Si todas las variables de la tabla de datos son cuantitativas se puede escoger entre las disimilitudes mostradas en la tabla 2, donde se usan las notaciones usuales para la varianza de la variable $k$ ($\sigma_k^2$), la matriz de varianzas $V$, las ponderaciones $p_k$ para las variables, y donde $r$ es un número real positivo.


Tabla 2: Indices de disimilitud para tablas que contienen variables cuantitativas.
  Disimilitud $d(x_i,x_j)$
1 EuclideanDistance $\displaystyle \sqrt{\sum_{k=1}^p (x_{ik}-x_{jk})^2}$
2 VarianceInverse $\displaystyle \sqrt{\sum_{k=1}^p (x_{ik}-x_{jk})^2/\sigma_k^2}$
3 Mahalanobis $ \displaystyle \sqrt{(x_i-x_j)^tV^{-1}(x_i-x_j)}$
4 Manhattan $ \displaystyle \sum_{k=1}^p p_k \vert x_{ik}-x_{jk}\vert$
5 Chebychev $ \max_{k} \vert x_{ik}-x_{jk}\vert$
6 Minkowski[r] $ \displaystyle (\sum_{k=1}^p \vert x_{ik}-x_{jk}\vert^r)^{1/r}$
7 Camberra $ \displaystyle \sum_{k=1}^p \frac{\vert x_{ik}-x_{jk}\vert}{x_{ik}+x_{jk}}$

 

Revista Virtual Matemática, Educación e Internet

Derechos Reservados