Mapa del sitio HTML: Los motores de búsqueda hacen un buen trabajo con sus robots para escanear el contenido de internet. No hay más que dos maneras de ayudar a acelerar el proceso o proporcionar acceso a las páginas que el robot tiene dificultades para acceder. El primer método, y el más simple, es crear una página HTML con enlaces a las páginas que deseas indexar. De este modo, el robot de Google será capaz de encontrar fácilmente las páginas siguiendo los enlaces a los mismos. Hay que trabajar en los enlaces de texto de anclaje, es decir, el vínculo “hacer clic en el texto”. Prueba a utilizar un ancla de texto relacionado con el tema de la página de destino. En general, las páginas HTML se accede mediante un icono que se parece a un organigrama en la esquina superior derecha del sitio.
Sitemap.xml: Los motores de búsqueda también proporcionan un mecanismo para que los webmasters presenten el contenido de sus sitios a través de un mapa (mapa del sitio) en XML (eXtensible Markup Language) o con un TXT. El nombre de archivo no tiene una norma obligatoria, pero por lo general se llama sitemap.xml. El sitemap.xml es un archivo que tiene por objeto enumerar las páginas de un sitio las cuales nos gustaría que estén presentes en los resultados de búsqueda. Google también permite la presentación de imágenes y vídeos.
En resumen, archivo sitemap.xml se utiliza como un índice para los motores de búsqueda, lo que facilita el acceso a dichas páginas y archivos. Vale la pena señalar, sin embargo, que es mucho más importante tener un sitio web fácilmente rastreable por los robots que utilizan sitemap.xml para eludir fracasos de arquitectura del sitio.
La creación de un Sitemap.xml
Google recomienda crear sitemaps con un máximo de 50.000 URL. Sin embargo, te recomiendo hacer archivos con un máximo de 10.000 URL. Si es necesario, se puede crear más de un archivo, como sitemap1.xml, sitemap2.xml, etc. el archivo sitemap.xml se puede crear de 3 formas:
- Manualmente – Tu creas tu propio sitemap con ciertos parámetros, al final del post te pongo un ejemplo de un sitemap hecho manualmente.
- Aplicaciones – Utilizar programas como GSiteCrawler que realizan un seguimiento de tu sitio web simulando el robot de los motores de búsqueda, almacenando las URL encontradas y creando automáticamente el archivo sitemap.xml.
- Las herramientas en línea – Para generar mapas de sitio, se pueden utilizar sitios como www.xml-sitemaps.com o http://www.auditmypc.com para crear mapas de sitio XML sin la necesidad de instalar un programa en tu ordenador.
¿Cómo presentar a Google el Sitemap.xml?
Una vez que tienes el archivo generado o mapa del sitio, debes colocarlo preferentemente en el directorio del sitio. A continuación, debes reportar a Google la ubicación y el nombre del archivo. La manera más fácil es por webmasters tools.
Herramientas para webmasters de Google (Search Console)
La herramienta de Google Wemasters tiene un área donde los webmasters pueden presentar sus mapas de sitio XML y rastrear el estado de indexación de páginas y archivos presentado. Esta zona se accede en Optimización -> Mapas del sitio.
El nuevo protocolo de mapa del sitio
Un nuevo protocolo de sitemaps reconocido por Google proporciona recursos adicionales para un mayor control del robot Google. Las ventajas de la nueva norma garantiza más resultados de búsqueda y seguimiento más eficientes, ya que proporcionan a los solicitantes de información con detalles específicos en las páginas de tu sitio.
Para explorar todas las nuevas características, el archivo debe ser creado en formato XML, aunque también existe el formato TXT. El archivo TXT es una simple lista de direcciones URL.
El mapa del sitio basado en XML, permite la presentación de URL, informa la prioridad de cada página, la frecuencia de actualización, y la última modificación realizada.
Para utilizar las características de la nueva plantilla de mapa del sitio, hay que seguir las reglas de formato XML y añade etiquetas específicas:
- <Xml> sigue las especificaciones requeridas para su presentación a Google
- <Urlset> indica el comienzo y el final de la serie de URL que se rastrearán
- <Url> indica el comienzo y el final de una URL individual
- <Loc> ubicación de la dirección URL completa de la página informada
- <Lastmod> una etiqueta opcional con la fecha de la última modificación
- <Changefreq> sugiere una etiqueta opcional de la frecuencia con que el robot debe realizar el seguimiento
- <Prioridad> etiqueta opcional que indica la prioridad de la dirección URL especificada en relación con las demás URL contenidos en el archivo
Ejemplo de como crear este sitemap con dichos parámetros:
<urlset xmlns = “http://www.sitemaps.org/schemas/sitemap/0.9”>
<url>
<loc> http://www.aqui-pones-tu-web.com/index.html </ loc>
<changefreq> semanal </ changefreq>
<prioridad> 0.9 </ prioridad>
</ url>
<Url>
<loc> http://www.aqu-ipones-tu-web.com/quienes-somos.html </ loc>
<changefreq> semanal </ changefreq>
<prioridad> 0.5 </ prioridad>
</ url>
</ urlset >
Puedes obtener más información sobre estos protocolos en sitemaps.org.