About Us
Lorem ipsum dolor sit amet, consectetur adipi Suspendisse ultrices hendrerit nunc vitae vel a sodales. Ac lectus vel risus suscipit venenatis. Morbi dignissim mi non dui phaedrum ullamcorper.

Hirtenstraße 19, 10178 Berlin, Germany

+49 30 24041420

ouroffice@any.com

Follow Us
Síguenos en las redes




Queremos conocer tu idea

¿Qué es un Sitemap y para qué sirve?

[:es]

¿Qué es un Sitemap y para qué sirve?

Hoy nos centramos en uno de los archivos más importantes de una web, el Sitemap. Se trata de uno de los más importantes para el correcto funcionamiento y posicionamiento de un proyecto online y muy pocos lo utilizan correctamente.

Es importante saber que se trata de un archivo que casi siempre pasa desapercibido, pero que no es complicado de utilizar si se estudia un poquito su funcionamiento.

Además tenemos grandes noticias y es que si trabajas con plataformas como WordPress, Prestashop o Magento se puede generar automáticamente con un pluging o módulo. Estos plugins cada vez son más completos por lo que son capaces de generar estos archivos de manera muy profesional. Eso sí, es necesario que cada cierto tiempo lo revisemos y no lo dejemos en el olvido.

Para evitar problemas y aprovechar al máximo todo lo que puede ofrecer un Sitemap, te enseñamos una serie de factores que probablemente desconocías.

¿Qué es el Sitemap?

Un archivo de Sitemap es aquel que indicará a los motores de búsqueda, las páginas o URLs de una web, para que los robots de dichos buscadores rastreen toda la web de manera eficiente y correcta.

Este archivo tiene que estar subido en tu cuenta de Google Search Console, para que Google sepa que lo trabajas y lo tienes en cuenta.

Dentro de Web Master tools en la propiedad de la web, nos vamos a Rastreo >> Sitemap y ahí lo enviamos para que Google lo tenga bien a mano.

¿Cómo mira un buscador tu web? En este caso Google

Tienes que saber que Googlebot accederá a tu web para rastrear contenidos nuevos cada poco tiempo, por lo que primero lee la información escrita en el archivo robots.txt ya que es aquel donde le indicamos al buscador los contenidos que deben ser indexados y los que no y posteriormente accederá a nuestro Sitemap.

Después de conocer los permisos que le indicamos en el Robots, Google pasará a revisar el archivo de sitemap.xml, hay que procurar que este archivo esté lo más actualizado posible, sobre todo si hablamos de una web de reciente creación.

La información que debe contener es la siguiente:

  1. Todas las URLs de las páginas, post y archivos visibles *Aquellas que hemos dado el visto nuevo para rastrear en el Robots.
  2. Etiquetas de títulos de contenido.
  3. Metadatos, datos estructurados y descripciones de páginas.

Todo esto estará especificado en el archivo de sitemap.xml.

Sitemap web

¿Existen diferentes tipos de Sitemap?

Supongamos que tenemos un sitio web dinámico, en el que subimos productos o artículos o videos y que esta subida o publicación es continua, en este caso necesitaremos un Sitemap Dinámico. En el caso de que nuestra web no varíe demasiado podemos elaborar un Sitemap Estático e ir actualizándolo nosotros mismo.

Formatos en los que podemos generar un sitemap.

XML: Es el más usado y el que recomendamos que utilices, ya que tienes plugins para wordpress, prestashop o magento que te harán este archivo de manera automática.

RSS: Este formato está recomendado para aquellas páginas que tienen un feed generado que automatiza la subida de contenido, pero cuidado, se suele olvidar de añadir páginas antiguas, que son importantes pero que al no haberse generado de manera automática las pasa por alto.

TXT: Archivo creado a mano en formato txt, aquí eres tu el que manda y coloca una URL por línea.

Os dejo toda la información de Google para que tengáis más información sobre los formatos de Sitemap.

Nota: No se puedes crear archivos de Sitemap de más de 50.000 URLs y si son muchos miles e URLs es recomendable que hagas un índice de sitemap.

¿Qué URLs puedo incluir en un archivo de Sitemap?

  • Aquellas que son INDEX, es decir aquellas que queremos que el buscado indexe
  • Aquellas URLs que responden a un código 200
  • Aquellas URLs que son canonicas

Errores básicos de Sitemap:

  • Incluir en el Sitemap aquellas URLs que hemos bloqueado en el Robots.txt

Uno de los errores más comunes es incluir aquellas páginas que previamente hemos bloqueado en el Robots.txt como no indexables. Es decir, si no queremos que el buscador indexe este tipo de páginas, no debemos de ponerlas en el sitemap.

  • Incluir en el Sitemap páginas que dan un 404

Si tenemos páginas que dan error 404 no las incluiremos en el Sitemap, sino que haremos una redirección hacia su página equivalente.

  • Incluir URLs redireccionadas 301, 302…

Sólo incluiremos aquellas que responden a un 200.

  • Incluir URls con Canonical apuntando a otra URL

Si hemos añadido en una página una etiqueta canonical que apunta hacia otra página, estamos diciendo que esa página no es la importante, sino que lo es aquella a la que apunta la etiqueta.

Para comprobar todo esto usaremos la herramienta de Screaming Frog.

En primer lugar, te recomiendo que descargues el archivo de sitemap que tienes actualmente. En el caso de que todavía no tengas archivo de Sitemap estos pasos te servirán igual.

Inicia Screaming Frog >> Mode>> List >> Upload List >> from a file >> selecciona Sitemap xml.

Analízalo y detecta los errores que pueda tener el archivo. Y si lo tienes que generar de cero, esta herramienta lo genera de manera automática, lo único que debes hacer es descargar el archivo que te muestra Screamig Frong y subirlo a tu htacces y GSC. Pero además, si no quieres complicarte la vida, actualmente la mayoría de las plataformas cuentan con Plugins que te permite generar sitemaps dinámicos estupendos y aceptados por Google.

¿Cuándo debes de revisar tu sitemap?

  1. Si has realizado una migración o has hecho cambios de estructura en tu web. En este caso encontrarás páginas 404 o 301.
  2. Si has marcado nuevas restrcciones index o no-index.
  3. Si has añadido el certificado de seguridad SSL. Tienes que tener en cuenta que este cambio varía todas tus URLs de http a https.
  4. Si te has aficionado a los “canonical” (recuerda que en el Sitemap no podemos tener páginas que apuntan a otras URLs)

Secretos del Sitemap:

Eliminar URLs de manera más rápida

En el caso de que necesites borrar fichas de productos, o has cambiado categorías por unas nuevas y ya no van a existir más deberás hacer que devuelvan un error 410.

CUIDADO: Ten presente que no se pueden borrar páginas así como así, debes asegurarte que esas páginas ya no tienen visitas, ni enlaces externos y que realmente nunca más van a volver a existir.

Estas páginas 410 las incluimos en nuestro sitemap y después de un tiempo considerable comprobamos que ya no están indexadas en Google.

Una vez estén dexindexadas las quitamos del archivo de Sitemap.

Dexindexación de URLs que no nos interesan:

Necesitamos eliminar cientos o miles de URLs que por el motivo que sea queremos que no aparezcan en los buscadores, y no queremos esperar a que el robot de Google pase por todas ellas:

Para ello añadiremos las URLs que hayamos definido como NO-INDEX en el archivo de Sitemap (si es posible, intentaremos generar una subcarpeta dentro de nuestro Sitemap que contenga únicamente estas páginas, de esta manera será mucho más sencillo su posterior borrado) y lo subiremos a GSC. Generemos con Screaming Frog el archivo o bien podemos utilizar esta herramienta gratuita.

Igual que en el caso anterior, una vez pasado un periodo de tiempo comprobaremos que estas páginas ya no están indexadas y las borraremos del Sitemap.

El archivo de Sitemap Conclusiones

Como has podido ver, el archivo de Sitemap es muy importante para que los buscadores interpreten nuestra web de manera correcta, además cuanto más específico sea nuestro archivo más sencillo será que los buscadores conozcan la importancia de cada página.

Si te empapas bien de información y empiezas a utilizar este archivo para mejorar el posicionamiento de tu web y lo aprovechas para las acciones avanzadas que hemos visto más arriba, verás como tu web mejora de manera exponencial.

¿Te atreves con tu archivo de Sitemap? Mucha suerte y si nos quieres dejar un comentario con tus dudas estaremos encantados de ayudarte en lo que podamos.

[:en]

Today we focus on one of the most important files of a website, the Sitemap. It is one of the most important for the proper functioning and positioning of an online project and very few use it correctly.

Its important to know that it is a file that almost always goes unnoticed, but not that complicated to use if you study its operation a little.

We also have great news and is that if you work with platforms such as WordPress, Prestashop or Magento can be generated automatically with a pluging or mode. These plugins are becoming more complete so they are able to generate these files in a very professional manner. Of course, it is necessary that often we review it and not leave it forgotten.

To avoid problems and make the most of everything a Sitemap can offer, we show you a series of factors that you probably did not know about.

What is Sitemap?

A Sitemap file will indicate to the search engines, pages or URLs of a website, so that the robots of these search engines track the entire web efficiently and correctly.

This file has to be uploaded to your Google Search Console account, so Google will know that you work with it and know you are already using it.

Within Web Master tools in the property of the web, we go to Tracking >> Sitemap and there we send it so that Google has it well at hand.

How does a web browser look? In this case Google

You have to know that Googlebot will access your website to crawl new content every few minutes, so first read the information written in the robots.txt file since it is where we tell the search engine the contents that should be indexed and those that do not and later you will access our Sitemap.

After knowing the permissions that we indicated in the Robots, Google will go to review the sitemap.xml file, we must ensure that this file is as up-to-date as possible, especially if we are talking about a recently created website.

The information it must contain is the following:

  1. All the URLs of the pages, post and visible files *Those that we have check-out to track on the Robots.
  2. Content title tags.
  3. Metadata, structured data and page descriptions.

All this will be specified in the sitemap.xml file.

Sitemap web

Are there different types of Sitemap?

Suppose we have a dynamic website, in which we upload products or articles or videos and this upload or publication is continuous, in this case we will need a Dynamic Sitemap. In the case that our website does not vary too much we can create a Static Sitemap and update it ourselves.

Formats in which we can generate a sitemap.

XML: It is the most used and we recommend you this one, since you have plugins for wordpress, prestashop or magento that will make this file automatically.

RSS: This format is recommended for those pages that have a feed that automates the upload of content, but beware, you usually forget to add old pages, which are important but have not been generated automatically.

TXT: File created by hand in txt format, here you are the one that sends and places a URL by line.

This information is about Google so you can search for more more information about the formats of Sitemap.

PS: You cant create Sitemap files of more than 50,000 URLs and if there are many thousands of URLs, it is recommended that you make a sitemap index.

What URLs can I include in a Sitemap file?

  • Those that are INDEX, that is, those that we want the search indexed
  • Those URLs that respond to a code 200
  • Those URLs that are canonical

Basic Sitemap errors:

  • Include in the Sitemap those URLs that we have blocked in the Robots.txt

One of the most common errors is to include those pages that we previously blocked in Robots.txt as non-indexable. That is, if we do not want the search engine to index this type of pages, we should not put them in the sitemap.

  • Include in the Sitemap pages that give a 404

If we have a web that give error 404 we will not include them in the Sitemap, but we will redirect them to their equivalent page.

  • Include redirected URLs 301, 302 …

We will only include those that respond to a 200.

  • Include URls with Canonical pointing to another URL

If we have added a canonical label on a page that points to another page, we are saying that this page is not the important page, but rather the one that the label points to.

To check all this we will use the Screaming Frog tool.

First of all, I recommend you download the sitemap file that you currently have. In the case that you don´t have a Sitemap file yet, these steps will help you the same.

Start Screaming Frog >> Mode >> List >> Upload List >> from a file >> select Sitemap xml.

Analyze it and detect any errors that the file may have. And if you have to generate it from scratch, this tool generates it automatically, all you have to do is download the file that shows you Screamig Frong and upload it to your htacces and GSC. But also, if you do not want to complicate your life, currently most platforms have Plugins that allows you to generate great dynamic sitemaps and accepted by Google.

When should you check your sitemap?

  1. If you have made a migration or have made structure changes in your website. In this case you will find pages 404 or 301.
  2. If you have marked new index or non-index restrictions.
  3. If you have added the SSL security certificate. You have to keep in mind that this change varies all your URLs from http to https.
  4. If you have become fond of “canonical” (remember that in the Sitemap we can not have pages that point to other URLs)

Secrets of the Sitemap:

Remove URLs faster:

In case you need to delete product listings, or have changed categories with new ones and they will not exist anymore, you should have them return a 410 error.

CAUTION: Keep in mind that you can not delete pages like this, you must ensure that those pages no longer have visitors, or external links and that they will never really come back.

These pages 410 are included in our sitemap and after a considerable time we check that they are not indexed in Google anymore.

Once they are dexindexed, we remove them from the Sitemap file.

Dexindexation of URLs that do not interest us:

We need to eliminate hundreds or thousands of URLs that for whatever reason we want them not to appear in the search engines, and we do not want to wait for the Google robot to go through all of them:

For this we will add the URLs that we have defined as NO-INDEX in the Sitemap file (if possible, we will try to generate a subfolder within our Sitemap that contains only these pages, in this way it will be much easier to delete later) and we will upload it to GSC. Generate with Screaming Frog the file or we can use this free tool.

As in the previous case, once a period of time has passed we will check that these pages are no longer indexed and we will delete them from the Sitemap.

The Sitemap file Conclusions

As you can see, the Sitemap file is very important for searchers to interpret our website correctly, and the more specific our file, the easier it will be for search engines to know the importance of each page.

If you search up information and start using this file to improve the positioning of your website and take advantage of the advanced actions we have seen above, you will see how your website improves exponentially.

Do you dare with your Sitemap file? Good luck and if you want to leave a comment with your questions we will be happy to help you in any way we can.

[:]