Qu'est ce que le Cloacking ?
Le cloaking (en français dissimulation) est une technique proscrite par les moteurs de recherche (donc à éviter), consistant à générer un contenu HTML différent selon qu’il s’agit d’un visiteur ou d’un moteur de recherche.
En effet il est possible de repérer les robots des moteurs de recherche par la présence d’un champ User-Agent spécifique dans les requêtes HTTP qu’ils envoient et de leur fournir un contenu différent, comportant des mots clés en surnombre, non affichés aux visiteurs.
Pour autant, si l’utilisation de cette technique est constatée par un moteur de recherche (cela leur est facile), le site risque tout simplement de ne pas être indexé, voire d’être mis en liste noire (bannissement) pendant plusieurs mois.
Présentation du fichier robots.txt
Le fichier robots.txt est un fichier texte contenant des commandes à destination des robots d’indexation des moteurs de recherche afin de leur préciser les pages qui peuvent ou ne peuvent pas être indexées. Ainsi tout moteur de recherche commence l’exploration d’un site Internet en cherchant le fichier robots.txt à la racine du site.
Format du fichier robots.txt
Le fichier robots.txt (écrit en minuscules et au pluriel) est un fichier ASCII se trouvant à la racine du site et pouvant contenir les commandes suivantes :
User-Agent: permet de préciser le robot concerné par les directives suivantes. La valeur * signifie « tous les moteurs de recherche ».
Disallow: permet d’indiquer les pages à exclure de l’indexation. Chaque page ou chemin à exclure doit être sur une ligne à part et doit commencer par /. La valeur / seule signifie « toutes les pages du site ».
Le fichier robots.txt ne doit contenir aucune ligne vide !
Voici des exemples de fichier robots.txt :
● Exclusion de toutes les pages :
User-Agent: *
Disallow: /
● Exclusion d’aucune page (équivalent à l’absence de fichier robots.txt, toutes les pages sont visitées) :
User-Agent: *
Disallow:
● Autorisation d’un seul robot :
User-Agent: nomDuRobot
Disallow:
User-Agent: *
Disallow: /
● Exclusion d’un robot :
User-Agent: NomDuRobot
Disallow: /
User-Agent: *
Disallow:
● Exclusion d’une page :
User-Agent: *
Disallow: /repertoire/chemin/page.html
● Exclusion de toutes les pages d’un répertoire et ses sous-dossiers :
User-Agent: *
Disallow: /repertoire/
Quelques User-Agents
Voici quelques exemples de User-Agents pour les moteurs de recherche les plus populaires :
Prospecter de nouveaux visiteurs potentiels par des mécanismes de promotion est essentiel, mais il ne faut pas négliger pour autant les visiteurs fidèles. Des études ont montré qu’il était plus profitable, à peine égale, de choyer ses visiteurs fidèles que d’en chercher de nouveaux.
L’objet de la fidélisation est de faire en sorte de satisfaire les visiteurs, afin qu’ils reviennent, voire qu’ils se fassent ambassadeurs du site web en vantant ses mérites.
D’une manière générale, un internaute reviendra essentiellement sur le site s’il est satisfait par son contenu et si son sentiment global est positif, mais il n’est pas impossible qu’il finisse néanmoins par oublier son existence. Par ailleurs, il est indispensable d’être à l’écoute des visiteurs, afin de prendre en compte leurs remarques et d’améliorer le contenu ou les services à leur disposition.
Il existe un certain nombre de techniques permettant de maximiser les chances qu’un visiteur se souvienne d’un site, afin de le pousser à le consulter régulièrement.

|

|
|