Calcular el Page Rank para visualizar su distribución

Tags: 
google page rank / robot de google / análisis seo / enlaces internos

Un enlace, un voto

Siempre que alguien, en cualquier sitio del planeta, decide compartir un enlace desde su página web, transmite valor hacia la página de destino. Google, desde el principio de su existencia, se ha tomado el intercambio de enlaces muy en serio, considerando que un enlace es igual que un voto que se le da a una página. Y cuantos más votos tenga una página, más popularidad tendrá. En realidad, el concepto clásico es un poco más elaborado, como se puede observar en las visualizaciones de transmisión de Page Rank que mostramos más abajo. Vamos a explicar para qué sirve estudiar la transmisión de Page Rank en el posicionamiento web.

 Page Rank en el dominio Crawlerzone.com   Visualizar el Page Rank en un blog   

Visualización Page Rank

Concepto y calculo del Page Rank de Google

El Page Rank de Google es uno de los criterios fundamentales por determinar la popularidad de una página (no de un dominio) en la web mundial. Sin embargo, es importante aclarar dos cosas:

  • Hay que diferenciar entre el Page Rank y el Page Rank Toolbar (que se puede conseguir gracias a plugins o páginas gratis y que se reparte entre 0 y 10 pero que no está actualizado). 
  • No tendremos en cuenta en este artículo la transmisión de semántica y el cálculo de la similaridad.
  • Por último, y aunque sea más anecdótico, debemos mencionar el hecho de que “Page” no se refiere a página web si no al nombre de su creador Larry Page, que ha registrado una patente llamada  “Metodo por la clasificación de nodos en una base de datos con enlaces” (“Method for node ranking in a linked database") y que se puede consultar online. 

El Page Rank se calcula en base a una fórmula matemática que constituye una de las claves del éxito del buscador de Google. Debido al tamaño de la red y al hecho de que se intenta manipular este valor (esquemas de maximización de Page Rank por un lado y webspam por el otro), el cálculo se convierte en un proceso complejo. Para los que les interese profundizar más en este tema, la formula clásica es ésta:

Formula del Page Rank de Google  

A la complejidad del calculo hay que añadir dos elementos adicionales:

  • El Page Rank es una propriedad de los caminos (rutas definidas por los enlaces entre páginas).
  • Solo puede ser relevante este scoring gracias al concepto de “usuario aleatorio” (en francés “surfista aleatorio” o “usuario tonto”), es a decir la hipótesis según la cual un usuario sigue un camino con la probabilidad de continuar o no. Cuando el camino se interrumpe, el usuario empieza de nuevo en un contexto totalmente diferente (se habla de teleportación).

¿Visualizar el Page Rank interno?

Para llegar a visualizar el Page Rank de Google, vamos a considerar que para determinar la fuerza de una página dentro de una red de enlaces, nos basaremos en el cálculo de un hipotético Page Rank interno. Es decir, usaremos la fórmula del Page Rank de Google pero limitándola a unas páginas dentro de un campo de estudio determinado (dataset). Existen algunas herramientas SEO que permiten calcular el Page Rank, en su mayoría crawlers SEO. Pero para este artículo vamos a usar una herramienta de visualización de datos que se llama Gephi. Esta herramienta nos va a permitir visualizar la distribución de Page Rank dentro de redes de enlaces características. Estas visualizaciones pueden ser muy útiles para demostrar desequilibrios entre secciones o páginas desde la óptica SEO.

Caso 1 - Distribución de Page Rank dentro de un dominio con poca profundidad

(Ejemplo de Crawlerzone.com, 24 páginas, 482 enlaces, descargar al formato PDF)

Este ejemplo es característico de un dominio con pocas páginas y solo dos niveles de profundidad en lo cual la popularidad se enfoca a nivel 1 (landings principales y artículos del blog). El resultado en este caso es que las páginas profundas reciben mas popularidad que la página de inicio. Efectivamente, la página de incio solo esta enlazada con el logo desde las páginas profundas.

Botify Analytics Page Rank interno

Si ahora visualizamos con Gephi la anatomía del Page Rank de Crawlerzone.com, se ve aún más claro el desequilibrio entre la página de inicio y las páginas profundas (el tamaño de los puntos depende del valor del PR, los pequeños puntos son las imágenes).

Visualización Page Rank Crawlerzone.com

Caso 2 – Visualización del Page Rank para un blog wordpress

(1.013 páginas, 74.075 enlaces, descargar al formato PDF)

Visualización Page Rank Blog Wordpress

En este ejemplo de blog desarrollado con el CMA Wordpress, vemos que la página de inicio está igualada con los enlaces salientes (es decir, todos los enlaces que apuntan a otros dominios, redes sociales, etc.) Este desequilibrio viene de la presencia de enlaces redundantes en la cabecera y el pie de página de todas las URLs del blog. Por otro lado, constatamos también la buena repartición de Page Rank hacia las categorías y los tags. Sin embargo, tenemos sólo 20 posts populares de un total de 700. Esto significa que habría que exagerar aún más los desequilibrios del blog para conseguir maximizar el Page Rank de los posts que consideramos estratégicos.

Caso 3 – Distribución de Page Rank dentro de un dominio entero multi-idioma sin navegación optimizada

(4.829 páginas, 264.664 enlaces, descargar al formato PDF)

 Visualización Page Rank página web multi-idioma

En este ejemplo (la página de un festival español de música muy conocido), vemos de manera evidente que todo el Page Rank se envía a las cuentas sociales Instagram y Twitter (malditos enlaces de cabecera y pie de página…). El resto de páginas se reparten muy poco Page Rank, por lo que no se ven en la visualización. Sólo con mirar esta estructura podemos concluir que Google no va a valorar las páginas profundas. Ahora bien, si miramos sólo la sección de páginas en español (quitando los enlaces sociales y salientes), con el mismo problema de navegación, vemos que la página que concentra todo el Page Rank es la página de inicio de la sección “Conciertos”. Este desequilibrio impide que las páginas profundas se posicionen en Google (artistas, actualidad, ...).

Visualización Page Rank Festival música español

Descargar al formato PDF.

Caso 4 – Ejemplo de regresión técnica perjudicando a páginas optimizadas por SEO

(17.103 páginas, 136.559 enlaces, descargar al formato PDF)

Valor Page Rank páginas optimizadas por SEO

En este caso ha ocurrido algo que puede pasar a veces si se implementan mal las recomendaciones SEO. En lugar de presentar a los buscadores sólo páginas optimizadas en base a expresiones estratégicas, se han abierto por error enlaces internos hacia páginas duplicadas. La consecuencia es que todo el Page Rank interno se desvía hacia las duplicaciones (círculo naranja) en lugar de dirigirse hacia las páginas optimizadas. No darse cuenta de la magnitud de este problema, puede crear una caída de tráfico SEO tremenda en una web con muchas páginas. Google tiene un presupuesto de crawl diario limitado y si no aprovechamos este tiempo para enseñarle contenido relevante, puede desclasificar una web. Y después habrá que esperar varios meses para volver a recuperar el tráfico original.

Conclusión

Saber cómo se reparte el Page Rank dentro de una red de enlaces puede ayudar a tomar decisiones estratégicas de cara al posicionamiento web. Éste no es, por supuesto, el único criterio a tomar en cuenta a la hora de ejecutar un proyecto SEO. Pero controlar los enlaces y tener una estructura optimizada dentro de una web determinada, son condición fundamental para adquirir tráfico SEO.

Las otras aplicaciones que se pueden hacer son:

  • Calcular un Page Rank semántico en base al calculo de la similaridad
  • Usar pesos para rebajar la importancia de enlaces irrelevantes por SEO
  • Probar eschemas de enlaces antes de implementarlos para maximizar el Page Rank interno en páginas o secciones estratégicas
  • Estudiar las estructuras de las webs con más visibilidad en Google

Nota: Gracias a Guillaume y Sylvain Peyronnet para enseñarnos los potenciales de Gephi en su masterclass Buscadores y SEO avanzado.