saltar al contenido

Cómo crear el mapa del sitio XML y enviarlo a Google

La Mapa del sitio es un archivo que enumera todas las páginas y URL (casi) de un sitio web.

Este archivo se puede enviar a los motores de búsqueda para facilitar su tarea., tanto en términos de rastreo como de indexación.

Todos los artículosCuando creé mi primer blog y no tenía conocimiento de cómo funcionaban los motores de búsqueda, me preguntaba ¿Cómo descubre Google mi nueva publicación??

Me encontré con una microguía en cómo crear y enviar contenido nuevo automáticamente gracias a sitemap.xml.

Veamos paso a paso qué es y cómo ayuda a indexar su sitio web.

Mapa del sitio XML que es?

La sitemap.xml es un protocolo y formato que le permite enumerar todas las URL de un sitio web.

XML del mapa del sitio

Más simple, es un archivo que recopila todas las páginas de su sitio web.

Este archivo permite a los robots de los motores de búsqueda (tractor) de identificar las páginas que desea indexar.

El propósito de este archivo es ayudar a los motores de búsqueda a encontrar e indexar las páginas de su sitio web..

Como regla general, los rastreadores indexan todas las páginas que encuentran, a menos que incluyan algún tipo de declaración de bloque, como los comandos en el archivo Robots.txt.

Dentro del mismo mapa del sitio, hay una sección dedicada a los artículos (enviar) y otro a las paginas.

También puede enumerar videos, fotos y otros tipos de archivos.

Existen varios formatos de mapa del sitio pero el más utilizado es el que contiene la extensión XML.

Los archivos de mapa del sitio se pueden crear manualmente o utilizar herramientas de terceros para su generación, como programas (por ejemploGenerador de mapas de sitios XML) o complementos específicos para cada administrador de contenido (por ejemplo, hay algunos para WordPress o Drupal).

Las direcciones del mapa del sitio pueden ser integrado en el archivo robot.txt del sitio que rastrean los motores de búsqueda.

Crea un mapa del sitio

Para un sitio pequeño, crear un mapa del sitio es superfluo.

Las arañas de Google encontrarán el sitio web e indexarán las pocas URL y el contenido presentes..

La cosa se vuelve vital para sitios medianos y grandes y para sitios que se actualizan constantemente con nuevas publicaciones y artículos.

En este caso tenga uno el mapa del sitio constantemente actualizado se vuelve fundamental.

Vital para los sitios web de información.

Hay varias formas de crear el mapa del sitio..

Algunos CMS generan un mapa del sitio automáticamente.

creare sitemap xml

Estos se actualizan automáticamente cuando agrega o elimina páginas y publicaciones de su sitio..

Si su CMS no, generalmente hay un complemento disponible que hace esto.

Para aquellos que usan WordPress, los complementos principales que generan automáticamente el archivo Sitemap.Xml son:

  • Sitemaps XML de Google: es un complemento que genera mapas de sitio XML automáticamente. El complemento admite todo tipo de páginas generadas por WordPress, así como URL personalizadas.
  • SEO de Yoast: el complemento más utilizado para la optimización SEO tiene entre sus funciones la creación y optimización del Sitemap. El índice del mapa del sitio y los mapas del sitio individuales se actualizan automáticamente cuando agrega o elimina contenido. además, incluir los tipos de publicaciones que desea que los motores de búsqueda indexen.
  • Matemáticas de rango:  El complemento de optimización SEO de Yoast SEO y su rival acérrimo tiene en sus herramientas de configuración la capacidad de crear y optimizar su Sitemap.xml. Puede acceder a la configuración del mapa del sitio en Rank Math utilizando el menú de WordPress de Rank Math.

Cada uno de los complementos le permitirá generar un mapa del sitio perfecto y todo automáticamente.

Tipo de mapa del sitio

Hay varios tipos de mapa del sitio para describir contenido multimedia y otro contenido que puede resultar complejo para que los motores de búsqueda analicen.

Vídeo

Los mapas de sitio de video nos permiten informar a los motores de búsqueda sobre el contenido de video en nuestro sitio.

Esta es información que las arañas no podrían identificar utilizando los mecanismos de seguimiento habituales..

De esta forma podemos mejorar la visibilidad del sitio para las búsquedas realizadas por Google Video..

En este caso, el código que se agregará al encabezado del mapa del sitio es:


<?xml version=»1.0″encoding=»UTF-8″?>
<urlset xmlns =»http://www.sitemaps.org/schemas/sitemap/0.9″
xmlns:image=»http://www.google.com/schemas/sitemap-image/1.1″xmlns:video=»http://www.google.com/schemas/sitemap-video/1.1″>

Y en el caso de los videos, se requieren las siguientes etiquetas:


<video:content_loc>: dove il video è ospitato sul server (percorso)
Facoltativamente, questo tag può essere sostituito o aggiunto al tag 
<video:player_loc>: nel caso in cui il video sia stato incorporato 
da un repository video esterno.
<video:thumbnail_loc>: la posizione della miniatura del video
<video:title>: il titolo del video
<video:description>: la descrizione del video

En este ejemplo tendríamos una página que incluye una imagen y un video:


<?xml version=»1.0″encoding=»UTF-8″?>
<urlset xmlns=»http://www.sitemaps.org/schemas/sitemap/0.9″
xmlns:image=»http://www.google.com/schemas/sitemap-image/1.1″
xmlns:video=»http://www.google.com/schemas/sitemap-video/1.1″>
<url>
<loc>http://tuweb.com </loc>
<changefreq>mensile</changefreq>
<priority>1.0</priority>
<lastmod>26/12/2014</lastmod>
<immagine:immagine>
<image:loc>http://nomedominio.com/tuaimagene.jpg</image:loc>
<image:caption> ... il testo della didascalia ... </image:caption>
<image:geo_location> Città, Paese </ image: geo_location>
<image:title>… il titolo della tua immagine… </image:title>
<image:license>http://url-de-licencia.com </image: license>
</image:image>
<video:video>
<video:content_loc>http://tuweb.com/tucarpetadevideos/video123.flv</video:content_loc>
<video:player_loc allow_embed=»sì»>http://youtube.com/tuvideodetucanal</video:player_loc>
<video:thumbnail_loc>http://nomedominio.com/miniatures/123.jpg </video:thumbnail_loc>
<video:title>… il titolo del tuo video… </video:title>
<video:description>… la descrizione del tuo video… </video:description>
</video:video>
</url>
</urlset>

Imagen

Este tipo de mapa del sitio mejorará nuestra visibilidad para las búsquedas realizadas por Imágenes de Google, permitiendo rastreo e indexación de imágenes en nuestro sitio por arañas.

Esta es información que las arañas no podrían identificar utilizando los mecanismos de seguimiento habituales..

Una entrada de imagen en el mapa del sitio puede incluir el objeto, el tipo y licencia de la imagen.

Podemos usar un mapa del sitio separado para incluir imágenes o agregar información de imagen a un mapa del sitio existente..

Los sitios web donde sería conveniente tener un mapa del sitio de imágenes serían, por ejemplo, portales turísticos, páginas de recetas o tiendas online.

<image:caption>: la didascalia dell'immagine
<image:geo_location>: la posizione geografica dell'immagine , se nota
<image:title>: il titolo dell'immagine
<immagine:licenza>:utilizzato per includere l'URL in cui risiede la licenza dell'immagine utilizzata

El archivo será entonces el siguiente:


<?xml version=»1.0″encoding =» UTF-8 ″?>
<urlset xmlns = »http://www.sitemaps.org/schemas/sitemap/0.9″
xmlns:image=»http://www.google.com/schemas/sitemap-image/1.1″>
<url>
<loc>http://tuweb.com </loc>
<changefreq>mensile</changefreq>
<priority>1.0</priority>
<lastmod>26/12/2014</lastmod>
<immagine:immagine>
<image:loc>http://tuosito.com/tuimagen.jpg </image:loc>
<image:caption> ... il testo della didascalia ... </image:caption>
<image:geo_location> Città, Paese </image:geo_location>
<image:title>… il titolo della tua immagine… </image:title>
<image:license> http://url-di-licenza.com </image:license>
</image:image>
</url>
</urlset>

Noticias

Este tipo de mapa del sitio se utiliza a menudo para acelerar el proceso de descubrimiento de noticias por arañas.

Este mapa del sitio es ligeramente diferente al de las páginas web.

Tiene etiquetas específicas como <Noticias: palabras clave> O <título>.

La etiqueta <título> es obligatorio y debe contener el título de la noticia tal como aparece en el sitio.

La <Noticias: palabra clave> no es obligatorio pero se recomienda.

Los rastreadores utilizan los términos incluidos para categorizar las noticias.

Esto permite clasificar nuestro artículo en el ranking de búsquedas relacionadas en las que queremos ganar visibilidad..

Recomiendo usar varias palabras clave en esta etiqueta de mapa del sitio.

Por otra parte, debemos tener en cuenta que el orden de inclusión de los términos no determina su importanciaun, todos tendrían el mismo nivel de relevancia.

También podemos encontrar la etiqueta de cotización, que se usa para noticias comerciales.

Los archivos de mapas del sitio de noticias no pueden contener más de 1.000 URL o incluir artículos anteriores a 24 mineral, siempre a partir de la fecha de publicación.

sin embargo, puede seguir apareciendo en Google Noticias durante un período de 30 dias.


<?xml version="1.0"encoding="UTF-8"?>
<urlset
xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"
xmlns:news="http://www.google .com/schemas/sitemap-news/0.9">
<url>
<loc>https://www.tuosito.com/title-about-the-article</loc>
<news:news>
<news:publication>
<news:name>Organization Name</news:name>
<news:language>it</news:language>
</news:publication>
<news:published_date>2018-06-05T20:21:34-04:00</news:published_date>
<news:title> Titolo del titolo dell'articolo di notizie </news:title>
<news:keywords> parola chiave, parola chiave </news:keywords>
</news:news>
</url>
<url>
<loc>https://www.tuosito.com/title-about-the-article</loc>
<news:news>
<news:publication>
<news:name> Nome dell'organizzazione </news:name>
<news:language>it</news:language>
</news:publication>
<news:published_date> 2018-06-05T20: 21: 34-04: 00 </news:published_date>
<news:title> Titolo del titolo dell'articolo di notizie </news:title>
<news:keywords> parola chiave, parola chiave, parola chiave, parola chiave </news:keywords>
</news:news>
</url>
<url>
<loc>https://www.tuosito.com/title-about-the-article</loc>
<news:news>
<news:publication>
<news:name> Nome organizzazione </news:name>
<news:language>it</news:language>
</news:publication>
<news:published_date> 2018-06- 05T20: 21: 34-04: 00 </ news:published_date>
<news:title> Titolo del titolo dell'articolo di notizie </news:title>
<news:keywords> parola chiave, parola chiave, parola chiave, parola chiave </news:keywords>
</news:news>
</url>
<url>
<loc>https://www.tuosito.com/title-about-the-article</loc>
<news:news>
<news:publication>
<news:name> Nome organizzazione </news:name>
<news:language>it </news:language>
</news:publication>
<news:published_date> 2018-06-05T20:21:34-04:00 </news:published_date>
<news:title> Title about the Titolo articolo di notizie </news:title>
<news:keywords> keyword, keyword, keyword, keyword </news:keywords>
</news:news>
</url>
</urlset>

Prioridad de las páginas dentro de un sitio

La etiqueta <prioridad> indica a los motores de búsqueda la importancia de una URL en comparación con el resto de las páginas del sitio. Este consejo no afecta la clasificación de sus páginas en los resultados de Google..

Los valores de esta etiqueta oscilan entre 0,0 un 1,0.

El marcado HTML proporcionado para el sitemap.xml:

La etiqueta <sitio> le permite especificar la ubicación de la página.
La etiqueta <lastmod> muestra la fecha de la última actualización.
La etiqueta <changefreq> especifica la frecuencia con la que se cambia la página.
La etiqueta <prioridad> se utiliza para establecer el orden de prioridad de una página en la escala de todo el contenido enviado.

Cómo enviar su mapa del sitio a Google

Google no comprueba un mapa del sitio cada vez que se rastrea un sitio; un mapa del sitio solo se comprueba la primera vez que Google lo nota e, más tarde, solo cuando haces ping para decir que ha cambiado.

Solo debe notificar a Google sobre un mapa del sitio cuando sea nuevo o actualizado; no envíe mapas del sitio sin modificar varias veces y no haga ping a esos mapas del sitio varias veces.

enviar la consola de búsqueda del mapa del sitio

Hay algunas formas diferentes de hacer que su mapa del sitio esté disponible para Google:

  • Envíelo a Google utilizando la herramienta de mapa del sitio. Consola de búsqueda
  • Inserte la siguiente línea en cualquier lugar del archivo robots.txtpara especificar la ruta del mapa del sitio:
    Mapa del sitio: http://example.com/sitemap_location.xml
  • Utilice el "ping” para solicitar que Google rastree el mapa del sitio. Envíe una solicitud HTTP GET como la siguiente:
    http://www.google.com/ping?mapa del sitio =<url_full_of_sitemap>
    Por ejemplo:
    http://www.google.com/ping?mapa del sitio = https://example.com/sitemap.xml

Tamaño del mapa del sitio

El mapa del sitio no debe exceder 50 MEGABYTE  (52.428.800 byte), comprimido o sin comprimir, ni contener más de 50.000 URL.

Esto asegurará que el servidor web no se bloquee cuando se necesite una gran cantidad de archivos..

Si su sitio tiene más URL de las mencionadas o si su mapa del sitio excede el tamaño máximo recomendado, deberá crear varios archivos de mapa del sitio que administrará a través de un archivo de índice de mapa del sitio.

Para la compresión del mapa del sitio, Google recomienda usar el formato gzip en lugar de zip.

Simplifique la administración de sus mapas del sitio con el archivo de índice del mapa del sitio.

El archivo de índice de sitemaps le permite enviar todos los sitemaps al mismo tiempo para que el proceso sea mucho más fácil..

Con un índice del mapa del sitio, Las arañas de Google pueden navegar fácilmente a través de los diferentes archivos xml que ha creado..

Este índice se crea como un mapa del sitio genérico., pero usando etiquetas <sitemapindex> mi <mapa del sitio>:


<? xml version = »1.0 ″ encoding =» UTF-8 ″?>
<sitemapindex xmlns = »http://www.sitemaps.org/schemas/sitemap/0.9 ″>
<sitemap>
<loc> http://tuosito.com/sitemap.xml </loc>
</sitemap>
<sitemap>
<loc> http://www.tuosito.com/sitemap-2.xml </loc>
</sitemap>
<sitemap>
<loc> http://www.tuosito.com/sitemap-imagenes.xml </loc>
</sitemap>
<sitemap>
<loc> http://www.tuosito.com/sitemap-videos.xml </loc>
</sitemap>
</sitemapindex>

Esta opción suele ser bastante útil en sitios grandes., como algunos medios que cargan índices de noticias durante meses del año, sino también para otros portales que, aunque no tan grande, tener una gran cantidad de mapas del sitio.

A menudo nos encontramos con mapas del sitio que tienen un tiempo de respuesta demasiado alto., Situación que puede afectar directamente a la indexación de las páginas que contiene..

En este caso, es mejor dividir páginas en varios mapas del sitio.

Administrarlos todos desde el índice del mapa del sitio será muy simple.

Cómo verificar su Sitemap.xml

Antes de enviar el mapa del sitio, debemos asegurarnos de que incluya las URL relevantes del sitio., es decir, los que queremos que Google rastree e indexe.

Los errores del mapa del sitio incluyen errores de compresión, mapas del sitio vacíos, Error HTTP o espacio de nombres incorrecto.

Para esto podemos usar strumenti vienen rana gritando, desde el cual podemos descargar el archivo del mapa del sitio incluyendo directamente la URL.

XML del mapa del sitio de Screaming Frog Analisi

Deberá verificar que los códigos de estado no sean diferentes de 200 Okay.

Las páginas redirigidas, ya sean redireccionamientos temporales o permanentes, no debe almacenarse en el mapa del sitio.

Se recomienda que los elimine de este archivo..

El procedimiento a seguir será el mismo si encontramos páginas inexistentes (404, 410, etc.).

Otro indicador que debemos verificar es el "Estado", que indica si se ha bloqueado el rastreo de una página en particular desde el archivo robots.txt del sitio.

Tendremos que comprobar si esta declaración de bloqueo en estas páginas es realmente correcta o se ha incluido por error.

En caso de que la instrucción del bloque sea correcta, debemos proceder a eliminar estas URL del mapa del sitio.

Igualmente, si detectamos que algunas URL están bloqueadas por error, le recomendamos que facilite el escaneo eliminándolos del archivo robots.txt.

Igualmente importante es también comprobar la columna «Meta Robots», para identificar qué páginas tienen la instrucción «noindex».

Las URL que tienen cualquiera de estas dos declaraciones de bloqueo no deben incluirse en el archivo de mapa del sitio del sitio..

Es inconsistente que las mismas URL que estamos enviando en el mapa del sitio para los motores de búsqueda para rastrear e indexar, a su vez contienen una instrucción que bloquea el acceso a los robots.

Es conveniente seguir estas recomendaciones ya que, corrigiendo estos errores, podríamos mejorar las cifras de saturación del sitio.

Después de corregir las incidencias detectadas, necesitamos volver a enviar el mapa del sitio.

Errores comunes a evitar

Envíe el mapa del sitio en blanco:  no importa cuánto generemos y enviemos el archivo de mapa del sitio, si no contiene las URL que queremos que encuentren los rastreadores, no nos favorecerá de forma positiva en cuanto a SEO.
Supere el tamaño máximo permitido: son super y 50 MB sin comprimir, necesitamos crear un archivo de índice de mapa del sitio y dividirlo en varios mapas del sitio.
Ingrese una fecha incorrecta: necesitamos asegurarnos de que las fechas estén codificadas en W3C para datetime (especificar la hora es opcional).
Ingrese URL no válidas: los que contienen caracteres o símbolos no admitidos, como comillas o espacios. U otros que incluyen el protocolo incorrecto (HTTP invece di HTTPS).
Etiquetas duplicadas: para solucionar este problema tendremos que borrar la etiqueta duplicada y enviar de nuevo el mapa del sitio.
Demasiadas URL en el mapa del sitio: asegúrese de que no contenga más de 50.000 URL, sino que divide el índice del mapa del sitio en varios archivos, teniendo en cuenta que no deben contener más de 50.000 páginas cada una.
No especifique URL completas: es necesario indicar la URL completa. Por ejemplo, www.mydomain.com no sería correcto como lo haríamos sin el protocolo HTTP / HTTPS.
No incluya todos sus mapas del sitio en un archivo de índice de mapa del sitio.
Inclusión de etiquetas incorrectas. Necesitamos asegurarnos de que todas las etiquetas del mapa del sitio estén escritas correctamente. Errores ortográficos como insertar <Noticias: idioma> en vez de <Noticias: idioma> puede hacer que el mapa del sitio registre numerosos errores y los motores de búsqueda no puedan procesarlo correctamente.

Ahora está listo para crear su Sitemap.xml y enviarlo a los motores de búsqueda y ver su contenido indexado en breve..

 

Simone Stoppioni
Últimos mensajes de Simone Stoppioni (ver todo)