Comment fonctionne un moteur de recherche?
Un moteur de recherche, toujours de manière
tres schématique, est un robot (synonyme : spider, araignée
et tous les petits noms qu'on voudra bien lui donner) qui parcourt méthodiquement
le web.
Ce robot " lit" les pages web , il les indexe,
les référence en fonction de leur contenu selon des méthodes
que nous verrons plus bas.
Pourquoi référencer mon site?
Le moteur de recherche n'a (statistiquement parlant)
aucune chance de trouver votre site tout seul.
En vous référencant, vous lui annoncez
l'existence de votre site.
Quelques règles de bases
Rappel
L'indexation des sites est faite par des robots
ou des araignées (spider) selon des critères prédéfinis
par leur programmeur.
Il n'y a que peu ou pas d'interventions humaines.
Cette indexation se fait en plein texte et chaque
mot de votre page compte.
Selon le moteur de recherche, les robots se comportent
différemment et n'utilisent pas nécessairement les mêmes
critères de référencement.
Cependant, il existe des règles de base
(liste non exhaustive).
On trouve ces balises au début d'un document HTML
.
<META NAME="DESCRIPTION"
CONTENT="description du site">
<META NAME="KEYWORDS" CONTENT="mots
clés">
<META NAME="ROBOTS" CONTENT="index,nofollow">
<TITLE>Le titre</TITLE>
1/ Le contenu du site
Si votre site n'aborde pas de sujet précis, ou
aborde un sujet repris des centaines de milliers de fois, ou n'aborde pas
de sujet du tout, ne révez pas, même référencé
dans les règles de l'art, vous n'aurez que peu d'audience.
2/ Le titre
90% du référencement
va se faire sur le titre de la page. Soyez donc extrèmement
précis pour ce titre.
Demandez vous quels sont le ou les deux mots que
votre futur visiteur va utiliser pour rechercher la page qui l'intéresse.
(la votre en l'occurence)
Sachez que si vous mettez 'page perso' ou 'javascript',
vous allez être perdu au milieu de millions d'autres pages.
Ne faites pas de "spamming" ; pratique constistant
à donner un titre à votre page qui n'a rien a voir avec son
contenu.
Le même principe est applicable aux mots-clés.
3/Le contenu de la page
Pour un robot, votre page c'est du texte pur et dur,
il ignorera vos belles images, vos sons, etc etc.
Ce robot va se faire une idée (façon de
parler) de l'objet, (theme etc) de votre site en dechiffrant la page
de garde.
4/ Les balises META
<META NAME="DESCRIPTION"
CONTENT="description du site">
Note : Tous les moteurs n'utilisent
pas ce TAG, certains utilisent les premières lignes de votre page
comme description.
Il faut donc aborder dès
le début de la page le sujet principal du site et reléguer
en bas de page les publicité, les compteurs et les liens qui risqueraient
de faire perdre les pédales au robot d'indexation.
Allez droit au but..le
moteur de recherche va afficher le titre de votre page, et une ou
deux lignes de description. Il faut que cette
description incite à cliquer sur l'hyperlien pointant
vers votre site.
<META NAME="KEYWORDS" CONTENT="mots
clé 1,mots clé 2,.....,mots clé n">
Vous pouvez en mettre un nombre considérable (1000)
Certains robots ignorent les mots clés répétés
plus de 7 fois.
3.1 Recherchez les mots clés qui correspondent parfaitement à votre site.
3.2 Certains robots vont ignorer les mots clés
prédéfinis par vos soins et vont les rechercher dans
les X premieres lignes de chaque page
et classeront la dite page en fonction de cette lecture.
Si vous abordez le corps du sujet en bas de votre page,
elle risque d'être mal référencée.
3.3 Certains robots, notamment anglo saxons, ne tiennent pas compte des accents ou des majuscules, donc dans vos mots clés répétez les mots avec accent, sans accent, avec majuscule, sans majuscule, cédille etc...
<META NAME="ROBOTS" CONTENT="index,nofollow">
Indique au moteur de recherche la marche à suivre
(certains moteurs de recherche n'en tiennent pas compte, et indexent tout
le site)
Index : ok Mister
Robot, tu peux indexer cette page et la faire apparaître dans les
résultats de recherche.
noindex : Mister
Robot, oublie cette page, elle n'a aucun intérêt, aucune plus
value (page de remerciement par exemple)
follow : Mister
Robot, sache que les hyperliens contenus dans cette page pointent vers
des pages intéressantes et qu'il serait bon de les suivre (le robot
restera dans le domaine du site)
nofollow
: Mister Robot oublie les hyperliens de cette page