Inicio 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15  16 17 18 19 20 21 22 23 24 25  

 

Disimilitudes sobre tablas de datos binarias

En este caso se supone que los valores que toman las variables de la tabla son solamente 0 ó 1 (ausencia, presencia, respectivamente), es decir $x_{ij} = 0 \mbox{ \'o } 1$. Dadas las filas $i$ y $j$ de la tabla, $x_i = \{x_{i1},x_{i2},\ldots,x_{ip}\}$ y $x_j = \{x_{j1},x_{j2},\ldots,x_{jp}\}$, para calcular $d(x_i,x_j)$ se calculan los valores:

  $j$
$i$ $\begin{array}{\vert c\vert cc\vert} \hline
& 1 & 0 \\ \hline
1 & a_{ij} & b_{ij} \\
0 & c_{ij} & d_{ij} \\ \hline
\end{array}$
donde $a_{ij}$ (respectivamente $d_{ij}$) es el número de variables tales que $i$ y $j$ tienen al mismo tiempo el valor 1 (resp. 0), y $b_{ij}$ (resp. $c_{ij}$) es tal que $i$ vale 1 (resp. 0) y $j$ vale 0 (resp. 1). Además, $n_i = a_{ij} + b_{ij}$ y $n_j = a_{ij} + c_{ij}$.

La tabla 1 muestra la definición de las funciones de disimilitud sobre tablas binarias disponibles en Dissimilarity; su nombre está formado por el nombre de uno o varios de los autores del índice.


Tabla 1: Indices de disimilitud para tablas que contienen variables binarias.
  Disimilitud        $d(x_i,x_j)$
1 Jaccard $ 1 - \displaystyle \frac{a_{ij}}{a_{ij}+b_{ij}+c_{ij}}$
2 Dice $ 1 - \displaystyle \frac{2a_{ij}}{2a_{ij}+b_{ij}+c_{ij}}$
3 SokalMichener $ 1 - \displaystyle \frac{a_{ij} + d_{ij}}{p}$
4 RusselRao $ \left\{ \begin{array}{ll}
0 & \mbox{si}\ i = j \\
1 - \displaystyle \frac{a_{ij}}{p} & \mbox{si}\ i \not= j
\end{array}\right.$
5 Kulczinski1 $ 1 - \displaystyle \frac{a_{ij}(1/n_i + 1/n_j)}{2}$
6 Ohiai $ 1 - \displaystyle \frac{a_{ij}}{\sqrt{n_i n_j}}$
7 SokalSneath1 $ 1 - \displaystyle \frac{2(a_{ij}+d_{ij})}{2(a_{ij}+d_{ij})+b_{ij}+c_{ij}}$
8 SokalSneath2 $ 1 - \displaystyle \frac{a_{ij}}{a_{ij}+2(b_{ij}+c_{ij})}$
9 Yule $1 - \displaystyle \frac{\vert a_{ij}d_{ij}-b_{ij}c_{ij}\vert}{a_{ij}d_{ij}+b_{ij}c_{ij}}$
10 AngularDistance $1 - \displaystyle \frac{\vert a_{ij}d_{ij}-b_{ij}c_{ij}\vert}
{\sqrt{(a_{ij}+b_{ij})(c_{ij}+d_{ij})(a_{ij}+c_{ij})(b_{ij}+d_{ij})}}$
11 RogersTanimoto $ 1 - \displaystyle \frac{a_{ij}+d_{ij}}{a_{ij}+d_{ij}+2(b_{ij}+c_{ij})}$

 

 

Revista Virtual Matemática, Educación e Internet

Derechos Reservados