¿Es posible que estés desaprovechando páginas importantes para SEO?

¿Es posible que estés, sin saberlo, desaprovechando páginas valiosas?

Por decirlo de otro modo, ¿tienes páginas huérfanas con tráfico orgánico potencial o real?

Probablemente la respuesta sea que sí, ya que es lo habitual en la mayoría de páginas web. Volver a vincular algunas de estas páginas a la estructura de tu página web permitiría explotar todo su potencial.

Las páginas huérfanas son aquellas exploradas por Google que los usuarios no pueden encontrar navegando por la página web ya que no están relacionadas con ninguna otra parte de la misma, lo que hace que el rastreador de Botify tampoco las encuentre.

Estas páginas verán por tanto reducido su tráfico potencial. Pero no solo eso. El problema adicional más frecuente es la gran cantidad de pérdida de rastreo de Google.

Hace poco estuvimos hablando de páginas de tu sitio web que google ni siquiera sabe que existen porque el buscador no puede o no va a explorarlas (marcado en rojo a la izquierda en el gráfico de abajo). En la gran mayoría de los casos se encuentran también páginas huérfanas (la parte gris de la derecha).

En el siguiente ejemplo, más del 70% de las páginas exploradas por Google en una página web son huérfanas:

Hay dos tipos de páginas huérfanas: las previstas, inevitables y normales que derivan de causas conocidas; y las imprevistas o anómalas.

Lo primero que hay que hacer cuando se detecte un elevado volumen de páginas huérfanas es revisarlas y comprobar si estaban previstas o no.

Las páginas huérfanas, o han sido previstas, o indican problemas

Algunas de las razones por las que una página huérfana puede haber sido prevista:

  • Páginas vinculadas con webs externas, habitualmente re-direccionadas. Las páginas re-direccionadas siempre son huérfanas ya que cualquier vínculo interno debería ir directamente a la página correcta.

  • Páginas indicando errores. Estos errores han sido ya identificados y corregidos en la web pero Google aún rastrea las urls durante algún tiempo. No hay que preocuparse.

  • Páginas que han expirado en una web con un gran número de páginas con una pequeña vida útil, como las clasificadas que expiran en poco tiempo y lo hacen mientras se realiza el análisis. Sólo deberían preocuparnos si continúan apareciendo como huérfanas durante mucho tiempo. Si no, la cantidad de páginas huérfanas simplemente alude a la velocidad de rotación de las páginas del sitio web y debe tenerse en cuenta simplemente como elemento de reflexión.

Causas frecuentes de páginas huérfanas que no deberán existir pero continúan siendo rastreadas por Google

  • Páginas que han expirado pero continúan devolviendo contenido: algunos sitios web dejan simplemente de vincular contenido antiguo (como productos que ya no forman parte de un catálogo) pero no devuelven un código de estado indicando que el contenido ya no está disponible (http 404 o 410) o re-direccionan la página a contenidos similares (como nuevas versiones del producto). El resultado de esto es que la página aún aparece como accesible.

Páginas que se quedan descolgadas en una migración: no son re-direccionadas y el contenido anterior aún se encuentra disponible. Puede que haya otro contenido similar en el sitio web y estas páginas antiguas

  • deberían entonces re-direccionar a las páginas actuales (re-dirección de página a página), o no lo hay y estas páginas devuelven un resultado http 404 (no encontrada) o 410 (ya no existe).

  • Un error de sintaxis al generar los mapas del sitio, lo que crea urls erróneas (que devuelven contenido y crean duplicados o bien devuelven errores http).

  • Un error de sintaxis al generar canonical tags, lo que crea urls erróneas (que pueden, de nuevo, bien devolver http 200 o errores).

  • Páginas que no siempre están vinculadas a la estructura del sitio web. Algunos sitios web utilizan una navegación de páginas (lista de contenidos, como páginas por categorías o páginas resultado de búsquedas internas) que sólo están vinculadas cuando se cumplen uno o varios criterios. Por ejemplo, las sub-categorías sólo aparecerán en el menú cuando la lista no esté vacía o alcance un número mínimo de elementos. El enfoque adecuado sería determinar cuándo, en base a criterios de negocio, deja una página de ser objetivo del tráfico orgánico, y, cuando así sea, sacarla de una vez y de todas partes: quitando links y devolviendo resultados http 404 o 410. Hasta entonces, debería mantenerse siempre vinculada al sitio web.

Las páginas huérfanas con contenido antiguo ¿pueden ser entonces tanto normales como anormales?

¡Sí, has leído correctamente! Puede haber páginas huérfanas que hayan sido tanto previstas como imprevistas generadas por contenido antiguo. La diferencia entre ambos casos es el código de estado http. Ambas estaban vinculadas al sitio web cuando Google rastreó las páginas pero no lo estaban ya cuando el rastreador de Botify hizo lo mismo. Pero desde el momento en que el contenido ha expirado, la página huérfana normal avisa de que el contenido ha desaparecido (http 404 o 410), mientras que una página huérfana anómala indica que aún existe (devuelve http 200). La diferencia aparecerá en el Botify Logs Analyzer. En el primer caso, el número de http 404 crecerá de forma constante y el número de http 200 se mantendrá relativamente estable, mientras que el número de http 200 continuará creciendo con el tiempo en el caso de páginas huérfanas anómalas.

Y entonces, ¿cómo saber delante de qué caso estamos?

El Botify Logs Analyzer nos ayudará a identificar páginas huérfanas y nos aportará información sobre si merece la pena o no reintegrarlas en la estructura de la web, con información de las visitas que generan.

El informe de rastreo del Botify Logs Analyzer lo dice todo sobre páginas huérfanas

Volvamos al ejemplo anterior. Hay aproximadamente 800 mil páginas huérfanas rastreadas por Google, bastante más que las 300 mil exploradas en la web. El informe de rastreo del Botify Logs Analyzer muestra una distribución de páginas por tipo de página para cada una.

La distribución por tipo de página es muy diferente de lo que encuentra Google en la estructura de la web.

Un rápido vistazo a los gráficos históricos diarios del Botify Logs Analyzer nos indica que las páginas verdes que representan el 61% de las páginas huérfanas del gráfico de arriba están re-direccionadas:

Este gráfico muestra el volumen diario de rastreo de Google en este tipo concreto de categoría de páginas, por código de estado. Estas páginas devuelven casi siempre un código de estado http 301 (re-direccionamiento permanente), mostrado en naranja.

El informe también nos cuenta qué tipos de páginas huérfanas están activas (una página activa es una página que ha generado al menos una visita en un período total analizado de 30 días) y lo compara con el resto de páginas activas del sitio web:

Y, lo más importante, el informe traduce esto en visitas orgánicas. En esta web el 5% de las visitas orgánicas han sido generadas por páginas huérfanas.

En este ejemplo, el tipo de página que genera el 79% del tráfico orgánico de la web (en la estructura) también genera el 7% del tráfico en páginas huérfanas.  Y  las dos categorías de páginas que generan el mayor volumen de tráfico en páginas huérfanas son en realidad cajones de sastre de “otro” tipo de páginas que no han sido categorizadas de forma más precisa al ser minoritarias (los gráficos de arriba combinan cualquier valor por debajo del 1%, pero el informe puede ir incluso más al detalle).

Con el informe se aporta igualmente la lista completa de páginas huérfanas categorizadas, junto con el número de visitas orgánicas y el número de rastreos de Google, lo que permitirá analizarlas y decidir cómo actuar con ellas.

Y si resulta que descubres que hay un sorprendente volumen de páginas huérfanas con visitas orgánicas, puedes tener por seguro que se trata, en su mayoría, de visitas de Google Adwords que no fueron correctamente identificadas, por algo como por ejemplo, la falta del parámetro identificador de Adwords en la url.

Este artículo es una traducción del post de Annabelle Bouard en el blog oficial de Botify Orphan pages and SEO: stop hurting yourself