L'architecture des quartiers
Sémantique HTML5 (Main, Section, Article) pour guider les robots.
Imagine : un monde de jeu bien conçu a des quartiers distincts la boutique, l'auberge, la forge, le donjon. En un coup d'œil, tu sais où tu es et ce que tu peux y faire. Un site bien structuré, c'est pareil, chaque zone a son rôle, et Google adore ça.
3.1Les balises sémantiques, les quartiers de ta ville
Le HTML5 propose des balises qui donnent du sens à la structure de ta page. Au lieu de tout empiler dans des <div>, tu utilises des balises qui disent à Google « ici c'est le menu », « là c'est le contenu principal ».
<body>
<header> <!-- L'entrée de la ville -->
<nav> <!-- Le panneau d'orientation -->
<a href="/">Accueil</a>
<a href="/cours">Cours</a>
</nav>
</header>
<main> <!-- La zone de jeu principale -->
<article> <!-- Une quête complète -->
<h1>Guide Flexbox</h1>
<section> <!-- Un chapitre de la quête -->
<h2>Les bases</h2>
<p>Flexbox permet d'aligner...</p>
</section>
</article>
<aside> <!-- L'inventaire latéral (sidebar) -->
<h2>Ressources</h2>
</aside>
</main>
<footer> <!-- Le camp de base -->
<p>© 2026 BaliseTonSite</p>
</footer>
</body><header>l'entrée de la ville (logo, navigation)<nav>le panneau d'orientation (menus de navigation)<main>la zone principale (un seul par page !)<article>un contenu autonome, comme une quête complète<section>un regroupement thématique, un chapitre<aside>du contenu secondaire (sidebar, infos complémentaires)<footer>le camp de base (mentions légales, liens utiles)
Un <div>, c'est un bloc sans identité. Une balise sémantique, c'est un bâtiment avec un panneau dessus. Google préfère les bâtiments bien identifiés.
3.2Des URLs propres et lisibles, les coordonnées GPS
L'URL de ta page, c'est son adresse sur la carte du monde. Elle doit être claire, lisible, et donner une idée du contenu.
<!-- Mauvais on ne sait pas ce qu'on va trouver -->
https://monsite.fr/page?id=42&cat=7
<!-- Bon l'URL décrit le contenu -->
https://monsite.fr/css/flexbox
<!-- Encore mieux avec des mots-clés naturels -->
https://monsite.fr/apprendre/css-flexbox-guide-complet- Courtes et descriptives pas d'ID cryptique
- Mots séparés par des tirets
-pas_ - Tout en minuscules pour éviter les doublons
- Pas de mots inutiles évite « le », « de », « un »
3.3Le fichier sitemap.xml, la carte complète de ton monde
Le sitemap.xml est un fichier qui liste toutes les pages de ton site. C'est la carte complète que tu donnes aux éclaireurs de Google pour qu'ils ne ratent aucune zone.
<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<url>
<loc>https://monsite.fr/</loc>
<lastmod>2026-01-15</lastmod>
<priority>1.0</priority>
</url>
<url>
<loc>https://monsite.fr/css/flexbox</loc>
<lastmod>2026-01-10</lastmod>
<priority>0.8</priority>
</url>
</urlset>- Obligatoire ? Non, mais fortement recommandé pour les gros sites
- Où le mettre ? À la racine
https://monsite.fr/sitemap.xml - Auto-générée les CMS et frameworks modernes le font pour toi (Next.js, WordPress…)
Sans sitemap, les éclaireurs de Google doivent explorer ton monde zone par zone en suivant les liens. Avec un sitemap, tu leur donnes carrément la carte complète dès le départ.
3.4Le fichier robots.txt, les zones interdites
Le fichier robots.txt dit aux robots de Google quelles zones ils ont le droit d'explorer et lesquelles sont interdites. C'est le « Accès restreint » de certaines salles de ton donjon.
# robots.txt - à la racine de ton site
# Autorise tout le monde à tout explorer
User-agent: *
Allow: /
# Bloque l'accès à la zone admin
Disallow: /admin/
Disallow: /api/
# Indique où est la carte du monde
Sitemap: https://monsite.fr/sitemap.xml- User-agent: * s'applique à tous les robots
- Disallow interdit l'accès à un chemin
- Allow autorise l'accès (par défaut tout est autorisé)
- Sitemap Indique où trouver ta carte
Attention robots.txt est une suggestion, pas un verrou de sécurité. Les robots respectueux (Google) obéissent. Les autres non. Pour bloquer réellement l'accès, utilise l'authentification côté serveur.