¿Qué es una URL limpia?

Las URLs limpias son aquellas que pueden leerse y que no tienen no contiene cadenas de consulta ni parámetros de URL.

Mira este ejemplo:

http://example.com/services/index.jsp?category=legal&id=patents

Esta URL no solo no describe fácilmente el título o los contenidos de la página de un vistazo. Estos fragmentos de texto: index.jsp?category= y &id= son parámetros que dan una apariencia "sucia" a tu URL. Esta es otra versión de la misma URL:

http://example.com/services/legal/patents

Obviamente el segundo ejemplo tiene una apariencia más directa y profesional, y es más probable que los usuarios cliqueen en ella cuando es compartida en Twitter, Facebook o simplemente en un blog.

La importancia de tener URLs limpias:

Las URLs limpias son las preferidas de los usuarios, pero además, sucede que los motores de búsqueda también las prefieren. Las palabras clave en las URLs son normalmente usadas para identificar la relevancia de una página cuando se realiza una búsqueda para una palabra clave en particular.

Sin embargo, generalmente no se recomienda llenar tus URLs de palabras clave solo por el SEO. La idea es brindar una mejor usabilidad y también ayudar a los usuarios a recordar y compartir tus URLs más fácilmente. Al mismo tiempo, las URLs limpias también facilitan la capacidad de los motores de búsqueda para identificar la relevancia del contenido de una página para una búsqueda en particular, para decidir qué mostrar en los resultados.

Indexar una URL limpia es más fácil que rastrear e indexar una URL desaliñada. La captura de pantalla de abajo muestra la primera página de resultados para la palabra clave Aviso legal. Puedes notar que las URLs que se muestran son generalmente limpias y contienen al menos una de las palabras, si no las dos.

Resultados de búsqueda con URLs limpias

Una URL limpia también anima a mayores mayores tasas de clics en los resultados de búsqueda. Mira los ejemplos de arriba. Los usuarios probablemente cliqueen estas URLs porque son fáciles de entender y parecen muy relevantes, especialmente aquellas con las palabras clave resaltadas.

¿Qué son parámetros de URL?

Un parámetro de URL es la variable de una dirección de red que aparece tras el signo de interrogación (?). Estos son llamados cadenas de consulta, o rutas de consulta y a veces son agregados para rastrear una URL particular, en cuyo caso se llamarían parámetros de rastreo. Por ejemplo, mira esta URL:

http://www.yoursite.com/?utm_source=book&utm_ medium=text&utm_campaign=test

En esta URL, ?utm_source es el parámetro de rastreo (también llamado parámetro UTM) que normalmente se asocia con Google Analytics.

La presencia de parámetros de URL es problemática en tres casos en particular:

  • URLs de páginas de inicio.
  • Páginas internas duplicadas.
  • Paginaciones.

URLs de páginas de inicio:

La página de inicio es la página más importante de tu sitio web. Es la página más vinculada, tanto interna como externamente. Con tantos enlaces entrantes y salientes apuntando hacia y desde la página de inicio, es necesario mantener limpia la URL. A veces, se crean parámetros de URL (como se muestra en el ejemplo a continuación), lo que resulta en múltiples URL que apuntan a la página de inicio. Esto no solo crea contenido duplicado, sino que también distribuye el link juice de la página, reduciendo así su clasificación.

Estas son diferentes formas de la misma URL de la página de inicio:

  • tusitio.com/index.html
  • tusitio.com/inicio
  • tusitio.com/inicio.html
  • tusitio.com/pagina/inicio/0,,1234,00.html

La situación es peor cuando las versiones www y no www de la URL de la página de inicio crean contenido duplicado. Por ejemplo, si alguien entra a tu sitio como tusitio.com, puede ser llevado a la URL www.tusitio.com/index.html. Estas variaciones causadas por los parámetros de URL no ayudan a los motores de búsqueda a decidir qué URL debe presentarse en los resultados de búsqueda. En tales casos, los motores de búsqueda como Google agrupan las URL duplicadas y seleccionan la mejor URL para mostrar en los resultados de búsqueda. La URL elegida por los motores de búsqueda puede no ser la URL que usan tus fans. Por lo tanto, su equidad de enlace es compartida por diferentes versiones de la URL de tu página de inicio, lo que diluye el SEO de la página de inicio de su sitio web.

Para evitar esto:

  • Elige la URL que deseas que sea la original. Esta será tu URL canónica. Para garantizar que el tráfico de tu sitio web llegue a la URL canónica, agrega una redirección 301 a la URL de página de inicio duplicadas que tienen identificadores de sesión y cadenas de consulta.
  • Si no es posible realizar redireccionamientos 301, agrega etiquetas rel = canonical a las páginas duplicadas.
  • Nunca enlaces a tu página de inicio utilizando una URL que no sea la canónica. Esto incluye sitios externos, tu página de blog, tus perfiles de redes sociales, firmas de correo electrónico y cualquier otra cosa.

Páginas internas duplicadas:

Cuando los parámetros de URL producen el mismo contenido más de una vez, significa que se ha creado una URL duplicada. Esto puede ocurrir para páginas de inicio y páginas internas. Por ejemplo, supongamos que tienes una página de productos en tu sitio de comercio electrónico que trata sobre vestidos verdes. Debido a las cadenas de consulta y los identificadores de sesión creados, las diferentes versiones de la misma URL están disponibles para los motores de búsqueda. Por ejemplo, las URL de muestra debajo apuntan al mismo contenido de la página:

http://www.tusitio.com/productos/mujer/vestidos/verde.htm

http://www.tusitio.com/productos/mujer?category=dresses&color=green

http://tusitio.com/tienda/index.php?productos_id=32&highlight=verde+vestidos&cat_id=1&sessionid=123&affid=431

Los motores de búsqueda deciden qué URL mostrar en los resultados de búsqueda. Pueden elegir la tercera URL, que no está limpia, y si dicha URL se muestra en los resultados de búsqueda, es posible que no obtenga tantos clics como lo haría una URL limpia. Para evitar esto, puedes realizar uno de los siguientes pasos (lo mismo que vimos anteriormente):

  • Elige la URL canónica. Agrega redireccionamientos 301 y envía el tráfico de tu sitio web a la URL canónica.
  • Si no es posible realizar redireccionamientos 301, agrega etiquetas rel=canonical a las páginas duplicadas.

Paginaciones:

Cuando una página no puede enumerar todos los elementos en una sola página, se crea una nueva página con la misma URL pero diferentes cadenas de consulta, como se muestra en el ejemplo a continuación. Esto se llama paginación.

http://www.tusitio.com/vestido-verde?pagina=1
http://www.tusitio.com/vestido-verde?pagina=2
http://www.tusitio.com/vestido-verde?pagina=3

Los motores de búsqueda deben comprender la relación entre cada página para indexarlas correctamente y evitar problemas de contenido duplicado.

Agregue una etiqueta rel="canonical" a las páginas paginadas de la siguiente manera:

<link rel=”canonical” href=”www.tusitio.com/vestidos-verdes>

Es mejor usar también las etiquetas rel=”next” y rel=”prev” para que los motores de búsqueda indexen estas páginas en la secuencia adecuada. Encuentra más información sobre estas etiquetas en el Blog de Google Webmaster Central . Si tus URL de paginación tienen muchos identificadores de sesión y cadenas de consulta, es mejor limpiarlas.

Dependiendo del servidor y la plataforma con la que se creó tu sitio web, existen diferentes formas de limpiar las URL de tu página web. Tu servidor necesita tener una tecnología conocida como "mod_rewrite" que esté configurada y habilitada para tu cuenta. Mod_rewrite es un módulo disponible en el servidor Apache. Aquí se explica cómo limpiar las URL en el servidor Apache:

Primero necesitas un archivo .htaccess para limpiar tus URL. Abre un documento de Bloc de notas en blanco y guárdalo como .htaccess. Pega lo siguiente en tu archivo:

RewriteEngine On

La cadena de consulta en tu URL debe colocarse en el archivo .htaccess. Por ejemplo, si tu URL es

http://www.tusitio.com/index.php?page=articles

entonces la cadena de consulta es

index.php?page=articles.

Agrega este parámetro de URL al archivo .htaccess de la siguiente manera:

RewriteRule ^([a-zA-Z0-9]+)/$ index.php?page=$1

El "^" representa la URL donde se encuentra este archivo .htaccess, por ejemplo, si lo colocas en www.tusitio.com/carpeta-vestidos-verdes, significa esa URL. El "([a-zA-Z0-9] +)" representa cualquier carácter que sea alfabético en minúsculas, alfabético en mayúsculas y numérico. El signo "+" indica que cualquier número de caracteres está bien. El signo "$" denota el final de la URL limpia y luego es seguido por el parámetro URL. La parte "$ 1" indica que solo se ha especificado un conjunto de variables. Carga este archivo .htaccess en tu directorio de raíz público que contiene tu página de índice principal.

Puedes cambiar tu configuración dentro de las herramientas del motor de búsqueda para que ignoren ciertos parámetros en tus URL. Bing permite esto en Herramientas para webmasters de Bing y Google lo permite en Herramientas para webmasters de Google. Sin embargo, no es aconsejable configurar los parámetros de todo el sitio si no estás completamente seguro de lo que estás haciendo.