icon/dark/fileicon/dark/foldericon/dark/folde-openicon/dark/hashtagicon/dark/line-graphicon/dark/listicon/dark/localicon/dark/lock

Eres una persona ocupada. Tienes un sitio web de gran tamaño y un equipo reducido (o ni siquiera tienes equipo), así que es posible que pases por alto algunas de las tareas de SEO más avanzadas. El rastreo de sitios web es una de esas cosas que se dejan de lado con facilidad.

lo cual es un error.

Rastrear tu sitio web te ayuda a descubrir todo tipo de problemas técnicos que afectan al modo en que los humanos y los motores de búsqueda interactúan con tus páginas. Rastrear tu sitio web diagnosticará o te ayudará a prevenir diversos problemas que boicotean la experiencia de usuario y el SEO:

  1. Contenido duplicado
  2. Páginas rotas
  3. Enlaces rotos
  4. Redireccionamientos erróneos
  5. Páginas no seguras
  6. Contenido no indexable

CTA

Contenido duplicado

El contenido duplicado es algo que toda persona que utiliza el SEO debe tener en cuenta. Y por un buen motivo: las páginas duplicadas no suelen obtener un buen posicionamiento y pueden excluirte de los resultados de búsqueda. Incluso las páginas con contenido exclusivo alojadas en dominios con gran cantidad de contenido duplicado pueden ver su posicionamiento afectado.

Cuando apareció el concepto de «contenido duplicado» por primera vez, se centraba principalmente en contenido plagiado, recortado y combinado.

Pero puedes acabar con contenido duplicado por diversos motivos:

  • Problemas de tu sistema de gestión de contenidos (CMS)
  • Sitios web plurilingües
  • Redireccionamiento www
  • Migración de HTTP a HTTPS

Estos problemas son bastante técnicos. ¿Qué puede hacer alguien sin conocimientos avanzados?

Rastrear su sitio web. Esa es su mejor opción.

El rastreo del sitio web analiza las páginas en tu sitio y compara sus contenidos, resaltando el texto similar.

También observa los elementos importante en la página que Google utiliza como indicadores de contenido duplicado, tales como la etiqueta de título y las metadescripciones.

Canónicas y Hreflang

Las etiquetas y URL canónicas se utilizan para ayudar a los motores de búsqueda a encontrar la versión original de las páginas duplicadas. Las etiquetas Hreflang indican a los motores de búsqueda qué páginas ofrecer en función del idioma del usuario. Estas etiquetas son un punto importante para evitar el contenido duplicado en tu sitio web.

Si cuentas con un sitio web de gran tamaño con numerosas páginas duplicadas o similares, como los sitios de comercio electrónico, probablemente tengas muchas etiquetas de este tipo. Comprobar estas etiquetas de forma manual no tiene mucho sentido a menos que tengas una cantidad de tiempo libre inimaginable. La buena noticia es que con un rastreador puedes encontrar cada instancia de una etiqueta canónica, así como instancias de etiquetas canónicas que...

● Están en conflicto con el mapa web de tu sitio ● No cargan correctamente ● Difieren de tu entrada en Open Graph

Páginas y enlaces rotos

Como puedes imaginar, las páginas y los enlaces rotos no benefician a nadie. Enviar a personas a páginas inexistentes o inaccesibles hará que los usuarios abandonen tu sitio web. Además, si hay demasiadas páginas que devuelven códigos de error, causarán un gran impacto en la autoridad y la confianza de tu dominio.

Comprobar los enlaces internos es extremadamente importante, porque estos enlaces no solo desplazan a los usuarios de una página a otra, sino que también transmiten link juice. Estos enlaces rotos identifican un doble contratiempo, que comprende una mala experiencia de usuario y un SEO de baja calidad.

Rastrear tu sitio web es la única opción fiable para comprobar todos tus enlaces y páginas en busca de errores. ¿Quieres realmente visitar cada página y hacer clic en cada enlace?

Ya suponíamos que no.

Los rastreadores acceden a las páginas a través de tus enlaces. También intentan seguir los enlaces externos, pero no rastrean esos dominios. Así que, por definición, un rastreador de SEO verificará tus enlaces internos y externos.

El rastreador de sitios web comprueba los códigos de estado HTTP de cada URL que encuentra. Muestra todas las URL que devuelven un código de error que impide a los usuarios acceder a dicha página:

  • Errores de cliente 4xx
  • Errores de servidor 5xx
  • Errores de redireccionamiento 3xx

Errores de redireccionamiento

Aunque técnicamente son un código de estado HTTP, los redireccionamientos se pueden considerar un tema aparte. Devolver un estado HTTP 3xx no es problema. Las dificultades de SEO relacionadas con los redireccionamientos aparecen cuando:

  • Un redireccionamiento apunta a otro redireccionamiento (cadena de redireccionamientos)
  • Dos redireccionamientos se enlazan mutuamente (bucle de redireccionamiento)
  • Un redireccionamiento apunta a una URL que devuelve un código de error (redireccionamiento roto)

Estos errores de redireccionamiento causan un aumento del tiempo de carga (cadenas) y enlaces rotos (redireccionamientos rotos). La mayoría de los navegadores ni siquiera permiten al usuario entrar en un bucle de redireccionamiento, sino que en su lugar muestran una página de error.

Atributos HTTP en páginas HTTPS

Utilizar URL de tipo HTTPS es sin lugar a dudas una muy buena idea. Es más seguro para los usuarios y también para ti. Y Google lo utiliza como potenciador de posicionamiento. Así que es bueno migrar a HTTPS. Pero debes asegurarte de migrar también todas tus imágenes, estilos CSS y archivos de JavaScript.

Tener páginas seguras con atributos HTTP causará que el navegador muestre al usuario una alarmante advertencia roja cada vez que intente acceder a la página, algo terriblemente molesto. Además, tu sitio no será totalmente seguro. A Google no le gustará nada.

Utiliza el rastreador de sitios web para asegurarte de no haber pasado por alto ninguno de esos archivos después de realizar la migración, así como para encontrar los que no se migren correctamente. Cuando se trata de HTTP dentro de HTTPS, incluso el archivo más diminuto puede causar un dolor de cabeza enorme.

Páginas no indexables

Las dos formas de evitar que Google indexe páginas son archivos robots.txt o etiquetas meta robots. Existen numerosos motivos por los que puede interesarte que una página, una carpeta o un sitio no sea indexable:

  • Evitar problemas de contenido duplicado o de poco valor
  • Evitar que los motores de búsqueda rastreen páginas sin utilidad
  • Tienes páginas o tipos de archivo concretos que no quieres que sean rastreados

Sin embargo, utilizar demasiado el comando disallow (o generar un error en el certificado) o los meta robots es una de las causas principales de rechazo de tráfico orgánico.

Y, desafortunadamente, con tan solo introducir un carácter erróneo puedes causar que secciones enteras de tu sitio web no se incluyan en el índice de Google.

Por suerte, tu rastreador de SEO accederá a tu archivo robots.txt y lo leerá antes de rastrear tu sitio web. De este modo, el rastreador de sitios web sabe directamente a qué páginas no podrá acceder Google. Y cuando el robot aterriza en una página, comprueba si esta incluye el atributo «NoIndex» en la etiqueta meta robots.

También comprueba el atributo de meta robots «NoFollow». El atributo «NoFollow» indica a los robots que no sigan ninguno de los enlaces de la página. Así que, incluso si la página es indexable, no transmitirá link juice ni conectará a los rastreadores con el resto del sitio web.

Técnicamente, estas páginas no indexables no son errores. Existen motivos por los que añadir el atributo NoIndex a una página. Pero sin duda deberías comprobar la indexación del sitio en el informe del rastreador. Si las URL no tienen sentido, debes revisar tu archivo robots.txt y todas las etiquetas meta robots que tengas.

WooRank está aquí para ayudar

El rastreo es una de las funciones de SEO que muchos no tienen en cuenta, especialmente si se dedican principalmente al marketing. Sin embargo, se trata de un paso imprescindible para descubrir problemas que evitan que obtengas un buen posicionamiento o directamente impedir que esos problemas puedan aparecer.

Muchos rastreadores intimidan al crear una lista de URL con sus correspondientes atributos y dejar el análisis a tu cargo. Este es uno de los motivos por los que WooRank creó el rastreador de sitios web, que efectúa el análisis por ti y te informa sobre cualquier detalle que debas revisar. Sin embargo, tanto si utilizas el rastreador de sitios web como si no, deberías rastrear tu web cada cierto tiempo para evitar que pequeños errores acaben convirtiéndose en grandes problemas.