Coeficiente de agrupamiento

Ejemplo de coeficiente de agrupamiento para el nodo azul i {\displaystyle i} en un grafo no dirigido. Las líneas negras son aristas que conectan vecinos de i {\displaystyle i} ; las segmentadas son aristas inexistentes.

En ciencia de redes, el coeficiente de agrupamiento (clustering coefficient, en inglés) de un vértice en un grafo cuantifica qué tanto está de agrupado (o interconectado) con sus vecinos. Si el vértice está agrupado como un clique (subgrafo completo), entonces su valor es máximo, mientras que un valor pequeño indica un vértice poco agrupado en la red. Duncan J. Watts y Steven Strogatz fueron los primeros en idear este coeficiente en 1998,[1]​ para determinar si un grafo es una red de mundo pequeño. Se suele representar formalmente como C i {\displaystyle C_{i}} . En el análisis de redes sociales, en ocasiones a este coeficiente se le conoce también como transitividad.

Definición

Un grafo G = ( V , E ) {\displaystyle G=(V,E)} formalmente consiste en un conjunto de vértices V {\displaystyle V} y en un conjunto de enlaces E {\displaystyle E} entre ellos. Un enlace e i j {\displaystyle e_{ij}} conecta dos vértices i {\displaystyle i} y j {\displaystyle j} . La vecindad de vértices N para un vértice v i {\displaystyle v_{i}} se define como aquellos vértices inmediatamente conectados de tal forma que:

N i = { v j } : e i j E e j i E . {\displaystyle N_{i}=\{v_{j}\}:e_{ij}\in E\lor e_{ji}\in E.}

El grado, que se representa como k i {\displaystyle k_{i}} de un vértice, es definido como el número de vértices enlazados con uno dado. En esta expresión además se tiene que | N i | {\displaystyle |N_{i}|} .

El coeficiente de agrupamiento C i {\displaystyle C_{i}} para un vértice v i {\displaystyle v_{i}} está dado por la proporción entre los enlaces conectados con sus vecinos dividido entre el número de enlaces existentes en un clique en el que la conectividad es máxima. Para un grafo dirigido, e i j {\displaystyle e_{ij}} es distinto de e j i {\displaystyle e_{ji}} , y por lo tanto para cada vecino N i {\displaystyle N_{i}} hay k i ( k i 1 ) {\displaystyle k_{i}(k_{i}-1)} enlaces que podrían existir entre los vértices de la vecindad ( k i {\displaystyle k_{i}} es el grado del vértice i para el total (entrantes + salientes)). De esta forma el grado de agrupamiento en los grafos dirigidos está dado por:

C i = | { e j k } | k i ( k i 1 ) : v j , v k N i , e j k E . {\displaystyle C_{i}={\frac {|\{e_{jk}\}|}{k_{i}(k_{i}-1)}}:v_{j},v_{k}\in N_{i},e_{jk}\in E.}

Un grafo no dirigido tiene la propiedad de que tanto los enlaces e i j {\displaystyle e_{ij}} y e j i {\displaystyle e_{ji}} son considerados idénticos. Por lo tanto, si un vértice v i {\displaystyle v_{i}} posee k i {\displaystyle k_{i}} vecinos, entonces existirían k i ( k i 1 ) 2 {\displaystyle {\frac {k_{i}(k_{i}-1)}{2}}} enlaces entre los vértices de su vecindad. De esta forma el coeficiente de agrupamiento de grafos no dirigidos pueden ser definidos como:

C i = 2 | { e j k } | k i ( k i 1 ) : v j , v k N i , e j k E . {\displaystyle C_{i}={\frac {2|\{e_{jk}\}|}{k_{i}(k_{i}-1)}}:v_{j},v_{k}\in N_{i},e_{jk}\in E.}

Sea λ G ( v ) {\displaystyle \lambda _{G}(v)} el número de triángulos en v V ( G ) {\displaystyle v\in V(G)} para un grafo no dirigido G {\displaystyle G} . Esto es, λ G ( v ) {\displaystyle \lambda _{G}(v)} es el número de sub-grafos de G {\displaystyle G} con tres enlaces y tres vértices, uno de los cuales es v {\displaystyle v} . Sea τ G ( v ) {\displaystyle \tau _{G}(v)} el número de tripletes en v G {\displaystyle v\in G} . Esto es, τ G ( v ) {\displaystyle \tau _{G}(v)} es número de sub-grafos (no necesariamente inducidos) con dos enlaces y 3 vértices, uno de los cuales es v {\displaystyle v} y tal que v {\displaystyle v} es incidente a ambos enlaces. De esta forma se puede definir también el coeficiente de agrupamiento como

C i = λ G ( v ) τ G ( v ) . {\displaystyle C_{i}={\frac {\lambda _{G}(v)}{\tau _{G}(v)}}.}

Es muy simple mostar que de las dos definiciones precedentes son similares, ya que:

τ G ( v ) = C ( k i , 2 ) = 1 2 k i ( k i 1 ) . {\displaystyle \tau _{G}(v)=C({k_{i}},2)={\frac {1}{2}}k_{i}(k_{i}-1).}

Esta medida es igual a 1 si cada vecino está conectado a v i {\displaystyle v_{i}} está conectada igualmente a cada uno de los otros vértices en la vecindad, y 0 si no hay vértices que están conectados a v i {\displaystyle v_{i}} que conectan a otro vértice que es conectado a v i {\displaystyle v_{i}} . El coeficiente de agrupamiento de la red se calcula mediante Watts y Strogatz como la media de los coeficientes de agrupamiento de todos los vértices de la red:

C ¯ = 1 n i = 1 n C i . {\displaystyle {\bar {C}}={\frac {1}{n}}\sum _{i=1}^{n}C_{i}.}

Un grafo se considera una red de mundo pequeño si el coeficiente de agrupamiento de la red C ¯ {\displaystyle {\bar {C}}} es significantemente mayor que el que pueda ofrecer un grafo aleatorio construido con el mismo conjunto de vértices, y si al mismo tiempo posee una distancia media de pequeño valor.

Aplicaciones

Se suele emplear el coeficiente de agrupamiento en la detección automática de tópicos.

Véase también

Referencias

  1. D. J. Watts y Steven Strogatz (1998). «Collective dynamics of 'small-world' networks». Nature 393: 440-442. doi:10.1038/30918. 

Enlaces externos

  • Wikimedia Commons alberga una categoría multimedia sobre Coeficiente de agrupamiento.
Control de autoridades
  • Proyectos Wikimedia
  • Wd Datos: Q898680
  • Commonscat Multimedia: Clustering coefficient / Q898680

  • Wd Datos: Q898680
  • Commonscat Multimedia: Clustering coefficient / Q898680