Les erreurs a éviter

 

Conseils concernant la qualité - Points à retenir

 

  • Évitez les contenus textuels ou les liens cachés.
  • N'utilisez pas de techniques de dissimulation ("cloaking") ou de pages de redirection trompeuses.
  • N'envoyez pas de requêtes automatiques à Google.
  • Ne multipliez pas les termes sans rapport avec le contenu réel de votre site.
  • Ne créez pas plusieurs pages, sous-domaines ou domaines présentant un contenu en grande partie identique.
  • Ne créez pas de pages permettant l'installation de virus, de chevaux de Troie ou de tout autre programme mouchard ("badware").
  • Évitez les pages satellites ("doorway") créées exclusivement pour les moteurs de recherche ou d'autres solutions, telles que les programmes d'affiliation, sans véritable contenu informatif.
  • Si votre site fait partie d'un programme d'affiliation, assurez-vous qu'il est utile aux internautes. Présentez un contenu pertinent et original pour inciter les internautes à visiter votre site. 

 

 

Texte et liens cachés 

Si votre site contient du texte ou des liens cachés, il risque d'être considéré comme peu fiable, car il présente aux moteurs de recherche un contenu différent de celui destiné aux visiteurs. Les contenus textuels (tels qu'un nombre excessif de mots clés) peuvent être cachés de plusieurs manières, dont les suivantes :

 

  • utilisation d'un texte blanc sur fond blanc ;
  • insertion d'un texte derrière une image ;
  • utilisation d'une feuille de style CSS pour cacher du texte ;
  • définition de la taille de la police sur 0.

Les liens cachés sont conçus pour être explorés par Googlebot, mais ne sont pas lisibles par les visiteurs pour les raisons suivantes :

 

  • Le lien contient du texte caché (par exemple, la couleur du texte est identique à celle du fond).
  • Une feuille de style CSS a été utilisée pour créer des liens hypertexte minuscules dont la taille ne dépasse pas1 pixel.
  • Le lien est caché dans un caractère de petite taille (par exemple, dans un trait d'union au milieu d'un paragraphe).

Si votre site contient du texte et des liens cachés conçus pour induire les moteurs de rechercher en erreur, votre site peut être retiré de l'index Google et ne plus être affiché dans les pages de résultats de recherche. Lorsque vous évaluez votre site afin de vérifier s'il contient du texte ou des liens cachés, recherchez tout ce qui n'est pas facilement affichable par les visiteurs. Existe-t-il du texte ou des liens accessibles uniquement aux moteurs de recherche et non aux visiteurs ?

 

Si vous utilisez du texte pour décrire des éléments auxquels les moteurs de recherche ne peuvent pas accéder (par exemple, JavaScript, images ou fichiers Flash), n'oubliez pas que de nombreux visiteurs utilisant des lecteurs d'écran, des navigateurs de mobile, des navigateurs sans plug-in et des connexions bas débit ne pourront pas non plus y accéder. L'utilisation de texte descriptif pour ce type de contenu améliorera l'accessibilité de votre site. Pour tester son accessibilité, désactivez les JavaScript, les fichiers Flash et les images sur votre navigateur ou utilisez un navigateur texte tel que Lynx. Conseils pour améliorer l'accessibilité de votre site :

 

Images : utilisez l'attribut alt pour fournir un texte descriptif. Nous vous recommandons également d'utiliser un texte descriptif et une légende lisibles par les visiteurs pour vos images.

Javascript : placez le contenu du JavaScript dans une balise noscript. Si vous utilisez cette méthode, assurez-vous que ce contenu est strictement identique à celui de JavaScript et qu'il est accessible aux visiteurs qui n'ont pas activé l'option Javascript sur leur navigateur.

Flash : pensez à placer le texte descriptif et les éléments de navigation du site en dehors des balises Flash.

Vidéos : insérez le texte décrivant le contenu de vos vidéos dans le code HTML. Vous pouvez également fournir des transcriptions de vos vidéos.

Si vous trouvez du texte ou des liens cachés sur votre site, supprimez-les ou, s'ils sont pertinents pour les visiteurs, faites en sorte qu'ils soient facilement consultables. Si votre site a été retiré de nos résultats de recherche, consultez nos conseils aux webmasters pour plus d'informations. Après avoir apporté les modifications nécessaires et vous être assuré que votre site est désormais conforme à nos recommandations, envoyez-le pour réexamen..

 

Requêtes automatiques 

Les Conditions d'utilisation Google interdisent l'envoi de requêtes automatiques de tout type au système sans autorisation expresse préalable de Google. L'envoi de requêtes automatiques consomme des ressources et implique l'utilisation de logiciels (tels que WebPosition Gold™) pour l'envoi des requêtes à Google afin de déterminer le classement d'un site ou d'une page Web dans les résultats de recherche pour diverses requêtes.

 

Accumulation de mots clés 

L'accumulation de mots clés est la pratique qui consiste à charger une page Web contenant des mots clés dans le but de manipuler le classement d'un site dans les résultats de recherche Google. L'insertion de mots clés dans les pages affecte négativement la navigation des utilisateurs et peut modifier le classement de votre site. Efforcez-vous de créer un contenu utile et pertinent qui utilise les mots clés de manière appropriée et en contexte.

 

Pour résoudre ce problème, recherchez les mots clés utilisés de manière inappropriée dans votre site. Il s'agit généralement de listes ou de paragraphes de mots clés, souvent répétés de manière aléatoire. Soyez attentifs, car les mots clés peuvent souvent se présenter sous la forme de texte caché ou être cachés dans des balises de titre ou des attributs alt.

 

Contenu en double

Par contenu en double, on entend généralement des blocs de contenu importants, appartenant à un même domaine ou répartis sur plusieurs domaines, qui sont identiques ou sensiblement similaires. À l'origine, la plupart de ces contenus ne sont pas malveillants. Exemples de contenu non malveillant :

 

  • forums de discussion pouvant générer à la fois des pages normales et des pages "raccourcies" associées aux mobiles ;
  • articles en vente affichés ou liés via plusieurs URL distinctes ;
  • versions imprimables uniquement de pages Web.

Dans certains cas cependant, le contenu est délibérément dupliqué entre les domaines afin de manipuler le classement du site par les moteurs de recherche ou d'augmenter le trafic. Ce type de pratique trompeuse peut affecter négativement la navigation de l'internaute qui voit quasiment le même contenu se répéter dans un ensemble de résultats de recherche.

 

Google s'efforce d'indexer et d'afficher des pages contenant des informations distinctes. À titre d'exemple, si votre site contient une version "standard" et une version "imprimable" de chaque article, et qu'aucune des deux n'est bloquée dans robots.txt ou avec une balise META noindex, nous en choisissons une seule. Dans les rares cas où nous estimons que du contenu en double est peut-être affiché dans le but de manipuler nos classements et de tromper nos utilisateurs, nous apportons également les ajustements appropriés dans l'indexation et le classement des sites impliqués. En conséquence, le classement du site peut être affecté, ou le site peut être retiré définitivement de l'index Google, auquel cas il n'apparaîtra plus dans les résultats de recherche.

 

Les mesures suivantes vous permettent de résoudre les problèmes de contenu en double de manière proactive et de vous assurer que les visiteurs accèdent au contenu que vous souhaitez leur présenter.

 

Bloquez l'indexation des pages : plutôt que de laisser les algorithmes Google déterminer la "meilleure" version d'un document, vous pouvez nous indiquer votre version favorite. Par exemple, si vous ne souhaitez pas indexer les versions imprimables des articles de votre site, désactivez ces répertoires ou utilisez des expressions littérales dans votre fichier robots.txt.

Utilisez des redirections 301 : si vous avez restructuré votre site, utilisez des redirections 301 ("RedirectPermanent") dans votre fichier. htaccess pour rediriger efficacement les internautes, Googlebot et autres robots d'exploration. (Pour ce faire, utilisez un fichier.htaccess dans Apache, et la console d'administration dans IIS.)

Soyez cohérent : assurez la cohérence dans vos liens internes. Par exemple, n'établissez pas de lien vers http://www.exemple.fr/page/, http://www.exemple.fr/page et http://www.exemple.fr/page/index.htm.

Utilisez des domaines de premier niveau : pour nous aider à présenter la version la plus appropriée d'un document, utilisez dans la mesure du possible des domaines de premier niveau pour gérer du contenu propre à un pays. Nous sommes plus enclins à penser que le site www.exemple.de contient du contenu destiné à l'Allemagne, que www.exemple.com/de ou de.exemple.com.

Diffusez du contenu avec prudence : si vous diffusez votre contenu sur d'autres sites, Google affichera systématiquement la version jugée la plus appropriée pour les internautes dans chaque recherche donnée, qui pourra être ou non celle que vous préférez. Cependant, il est utile de s'assurer que chaque site sur lequel votre contenu est diffusé inclut un lien renvoyant vers votre article original. Vous pouvez également demander à ceux qui utilisent votre contenu diffusé de bloquer la version sur leur site avec leur fichier robots.txt.

Utilisez nos outils pour les webmasters afin de nous indiquer votre méthode d'indexation de site favorite : vous pouvez indiquer votre domaine favori à Google (par exemple, www.exemple.fr ou http://exemple.fr).

Limitez les répétitions : par exemple, au lieu d'inclure une longue mention de copyright au bas de chaque page, insérez un récapitulatif très bref, puis établissez un lien vers une page plus détaillée.

Évitez la publication de pages incomplètes : les internautes n'appréciant pas les pages "vides", évitez dans la mesure du possible les espaces réservés. Par exemple, ne publiez pas de pages pour lesquelles vous ne disposez pas encore de contenu réel. Si vous créez des pages contenant des espaces réservés, utilisez le fichier robots.txt pour bloquer leur exploration.

Apprenez à maîtriser votre système de gestion de contenu : vérifiez que vous maîtrisez l'affichage du contenu de votre site Web. Les blogs, forums et systèmes associés affichent souvent le même contenu dans des formats divers. Par exemple, un message de blog peut apparaître sur la page d'accueil d'un blog, dans une page d'archives et dans une autre page avec le même libellé.

Limitez les contenus similaires : si de nombreuses pages de votre site sont similaires, développez chacune d'entre elles afin de les rendre uniques ou consolidez-les en une seule. Par exemple, si votre site de voyages présente des pages distinctes pour deux villes, mais que celles-ci comportent des informations identiques, regroupez les informations sur les deux villes sur une seule page ou développez chaque page afin qu'elles contiennent des informations bien différentes.

Le contenu en double n'entraîne pas de conséquences négatives particulières pour votre site sauf si l'objectif semble être de tromper et de manipuler les résultats des moteurs de recherche. En cas de problèmes de contenu en double, et si vous ne suivez pas les recommandations indiquées ci-dessus, nous nous chargeons de choisir la version du contenu à afficher dans nos résultats de recherche.

 

Cependant, si nous estimons qu'il s'agit de pratiques trompeuses et retirons en conséquence votre site de nos résultats de recherche, revoyez sérieusement votre site. Après avoir apporté les modifications nécessaires et vous être assuré que votre site est conforme à nos conseils aux webmasters, envoyez-le pour qu'il soit réexaminé. Nous utiliserons le centre de messagerie des outils Google pour les webmasters afin de vous ternir informé du statut de votre demande.

 

Si vous découvrez qu'un autre site duplique votre contenu en le détournant (détournement et republication), il est peu probable que cela affecte négativement le classement de votre site dans les pages de résultats de recherche Google. Si vous identifiez un cas s'avérant particulièrement frustrant, nous vous invitons à déposer une plainte DMCA afin de revendiquer la propriété du contenu et de demander la suppression de cet autre site de l'index de Google.

 

Installation de virus et autres programmes mouchards ("badware") 

Les sites qui exploitent les failles de sécurité des navigateurs afin d'installer des logiciels (tels que des logiciels malveillants, logiciels espions, virus, logiciels de publicité et chevaux de Troie) sont en infraction avec les conseils concernant la qualité donnés par Google et sont susceptibles d'être retirés de l'index Google.

 

Dans de nombreux cas, les sites Web qui installent des programmes mouchards sont eux-mêmes la cible de pirates. Leur intégrité et sécurité sont alors compromises sans même que leur webmaster en aient conscience avant d'en être avertis par une notification de Google. Si votre site est référencé comme diffusant un programme mouchard, ses visiteurs en seront informés par un avertissement et nous vous communiquerons cette information dans la page Résumé du site des outils pour les webmasters.

 

Si votre site est référencé comme diffusant un programme mouchard, consultez les consignes de StopBadware.org pour les sites Web, puis demandez un examen de votre site. Pour effectuer une demande d'examen :

 

Dans le tableau de bord des outils pour les webmasters, cliquez sur le site à examiner.

Cliquez sur Demander un examen.

Malheureusement, le nettoyage d'un site affecté peut s'avérer très difficile. Le simple nettoyage des fichiers HTML est rarement suffisant. Si un rootkit a été installé, par exemple, vous n'avez d'autre choix que d'effacer le contenu de la machine et de tout réinstaller. Et même dans ce cas, si la principale faille de sécurité n'est pas également éliminée, l'intégrité de votre site peut être de nouveau compromise en quelques minutes.

 

Pages masquées ("cloaking")

 

Le "cloaking" est la pratique qui consiste à présenter aux utilisateurs des URL ou un contenu différents de ceux destinés aux moteurs de recherche. En raison de la présentation de résultats différents selon le user-agent, votre site peut être considéré comme trompeur et être retiré de l'index Google. 

 

Exemples de "cloaking" :

  • Présentation d'une page de texte HTML aux moteurs de recherche, mais affichage d'une page d'images ou Flash aux utilisateurs.
  • Présentation aux moteurs de recherche d'un contenu différent de celui destiné aux utilisateurs.

Si votre site contient des éléments non explorables par les moteurs de recherche (par exemple, fichiers Flash, scripts JavaScript ou images), vous ne devez pas leur fournir de contenu masqué. Vous devez alors tenir compte des visiteurs qui ne peuvent pas non plus consulter ces éléments. Par exemple :

  • Fournissez du texte alt décrivant les images aux visiteurs qui utilisent des lecteurs d'écrans ou des images désactivées sur leurs navigateurs.
  • Fournissez le contenu textuel du script JavaScript dans une balise noscript.

Assurez-vous de fournir un contenu identique dans les deux éléments (par exemple, fournissez le même contenu dans le script JavaScript et la balise noscript). L'insertion de contenu en grande partie différent dans l'élément de substitution peut inciter Google à prendre des mesures en ce qui concerne le site.

 

Redirections JavaScript trompeuses

 

Lorsque Googlebot indexe une page contenant un script JavaScript, il ne peut pas suivre ou indexer les liens cachés dans le script lui-même. L'utilisation d'un script JavaScript est une pratique Web totalement légitime. Toutefois, son utilisation dans le but de tromper les moteurs de recherche ne l'est pas. Par exemple, le fait de placer du texte différent dans le script JavaScript et dans une balise noscript constitue une infraction à nos conseils aux webmasters, car cette pratique présente aux utilisateurs (qui accèdent au texte JavaScript) un contenu différent de celui destiné aux moteurs de recherche (qui accèdent au texte noscript). Il y a également infraction aux conseils aux webmasters lors de l'intégration d'un lien dans un script JavaScript qui redirige l'utilisateur vers une autre page avec l'intention de lui présenter une page différente de celle destinée au moteur de recherche. Lorsqu'un lien de redirection est intégré dans le script JavaScript, le moteur de recherche indexe la page initiale plutôt que de suivre le lien, alors que les utilisateurs sont dirigés vers la cible de la redirection. À l'instar du "cloaking", cette pratique est trompeuse car elle présente aux utilisateurs un contenu différent de celui destiné à Googlebot, et peut diriger un visiteur vers une page autre que celle à laquelle il souhaitait accéder.

 

Notez que le fait de placer des liens dans le script JavaScript ne constitue pas à lui seul une pratique trompeuse. Lors de l'analyse du script JavaScript de votre site afin de vérifier s'il est conforme à nos recommandations, tenez compte de l'intention finale.

 

Tenez compte du fait que les moteurs de recherche ne pouvant généralement pas accéder au contenu du script JavaScript, les liens légitimes qu'il contient ne leur seront donc pas accessibles (de même qu'aux visiteurs sans navigateurs JavaScript). Vous pouvez à la place conserver les liens en dehors du script JavaScript ou les répliquer dans une balise noscript.

 

Pages satellites ("doorway")

 

Les pages satellites sont spécialement conçues pour les moteurs de recherche. Elles contiennent de nombreux liens (souvent plusieurs centaines) qui sont de peu, voire d'aucune, utilité pour le visiteur, et dont le contenu ne présente pas d'intérêt. Les plans Sitemap HTML constituent une ressource précieuse pour vos visiteurs, et garantissent à vos visiteurs une navigation aisée dans ces pages de liens. Si vous avez un certain nombre de liens à inclure, répartissez-les par catégories ou dans plusieurs pages. Mais si vous procédez de cette manière, assurez-vous qu'ils permettent aux visiteurs de naviguer dans les sections de votre site, et qu'ils ne sont pas uniquement destinés aux moteurs de recherche.

 

L'objectif de Google est de fournir à ses utilisateurs les résultats de recherche les plus intéressants et les plus pertinents. Par conséquent, nous désapprouvons les pratiques qui consistent à manipuler les moteurs de recherche et à tromper les utilisateurs en les redirigeant vers des sites autres que ceux sélectionnés, et qui fournissent du contenu destiné uniquement aux moteurs de recherche. Les sites qui utilisent ces pratiques peuvent être retirés de l'index Google et ne plus apparaître dans les résultats de recherche Google.

 

Si votre site a été retiré de nos résultats de recherche, consultez nos conseils aux webmasters pour plus d'informations. Après avoir apporté les modifications nécessaires et vous être assuré que votre site est désormais conforme à nos recommandations, envoyez-le pour qu'il soit réexaminé.

 

Peu ou pas de contenu informatif 

L'une des étapes les plus importantes dans l'amélioration du classement de votre site dans les résultats de recherche Google consiste à s'assurer qu'il contient de nombreuses informations intéressantes, incluant des mots clés pertinents qui sont utilisés de manière appropriée et indiquent l'objet de votre contenu.

 

Cependant, certains webmasters tentent d'améliorer le classement de leurs pages et d'attirer des visiteurs en créant des pages contenant un grand nombre de mots mais peu, voire pas de véritable contenu. Google prendra les mesures nécessaires à l'encontre des domaines qui tentent de se positionner plus haut dans le classement en affichant uniquement du contenu détourné ou autres pages générées automatiquement qui ne sont d'aucune utilité pour les internautes. Exemples :

 

  • Sites affiliés contenant peu d'informations : ces sites collectent des revenus PPC (paiement par clic) en dirigeant les visiteurs vers des sites de programmes d'affiliation, tout en apportant peu, voire pas de valeur ajoutée ou service à l'internaute. Ces sites ne comportent généralement pas de contenu informatif et peuvent être des modèles ou sites simplistes sans contenu original.
  • Pages satellites ("doorway") : pages créées exclusivement pour les moteurs de recherche.
  • Contenu généré automatiquement : contenu généré par programmation. Il s'agit souvent de paragraphes de texte aléatoires qui n'ont aucun sens pour le lecteur, mais qui peuvent contenir des mots clés de recherche.
  • Contenu détourné : certains webmasters utilisent le contenu d'autres sites plus réputés, estimant que l'augmentation du nombre de pages Web avec du contenu aléatoire et peu pertinent est une bonne stratégie à long terme. Le contenu détourné, même à partir de sources de qualité, ne peut apporter aucune valeur ajoutée à vos visiteurs si vous n'y ajoutez pas des informations ou services utiles de votre cru. Prendre le temps nécessaire pour créer un contenu informatif permettant de démarquer votre site en vaut la peine. Cela incitera vos visiteurs à revenir et les résultats de recherche fournis seront utiles.

Être un site affilié ne pose pas de problème tant que vous apportez de la valeur ajoutée à votre site et que vous créez un contenu intéressant donnant aux internautes une raison de le visiter. Par exemple, vous pouvez créer des avis, évaluations, comparaisons de produits.

 

Si votre site a été retiré de nos résultats de recherche, consultez nos conseils aux webmasters pour plus d'informations.

 

Les sujets suivants peuvent aussi vous intéresser...

  • Comment puis-je créer un site facilement explorable par Google ?
  • Les pages dynamiques sont-elles indexées sur Google ?
  • Les sites utilisant des animations Macromedia Flash sont-ils inclus dans l'index de Google ?

 

Comment puis-je créer un site facilement explorable par Google ? 

Actions conseillées

 

Les conseils aux webmasters contiennent des recommandations générales concernant la conception, les aspects techniques et la qualité des sites. Vous trouverez ci-dessous de plus amples informations sur les astuces à connaître pour créer un site plus facilement explorable et indexable par Google.

 

Proposez aux internautes les informations qu'ils recherchent

Rédigez soigneusement les informations fournies sur votre site, notamment sur votre page d'accueil. Il s'agit du point le plus important. Si vos pages présentent des informations utiles, elles attireront de nombreux visiteurs et inciteront les webmasters d'autres sites à créer des liens vers votre site. Créez des pages qui décrivent clairement et précisément l'objet de votre site. Essayez de déterminer les termes que les internautes sont susceptibles d'employer pour rechercher vos pages, puis utilisez ces mêmes termes sur votre site.

 

Vérifiez que d'autres sites proposent des liens vers le vôtre

Ces liens aident nos robots à localiser votre site et augmentent les chances qu'il aura de figurer dans nos résultats de recherche. Pour obtenir des résultats pertinents et intéressants par rapport aux critères d'une recherche, Google utilise la technologie PageRank (classement Google des pages) ainsi que des techniques perfectionnées de mise en correspondance de texte. Google comptabilise, entre autre, le nombre de votes obtenus par chaque page afin de déterminer son classement PageRank. Dans ce cadre, un lien d'une page A vers une page B est interprété comme un vote de la page A en faveur de la page B. Les votes émis par des pages considérées comme "importantes" ont une valeur plus grande et contribuent au classement d'autres pages dans la catégorie des pages "importantes".

 

Notez que nos algorithmes font la distinction entre les liens naturels et non naturels. Les liens naturels vers votre site découlent de la nature dynamique du Web : d'autres sites trouvent votre contenu intéressant et pensent qu'il peut être utile à leurs visiteurs. Les liens non naturels vers votre site sont ajoutés dans le but spécifique de le rendre plus populaire auprès des moteurs de recherche. Les conseils aux webmasters contiennent de plus amples informations sur certains de ces liens (systèmes de liens, pages satellites, etc.).

 

Seuls les liens naturels sont utilisés lors de l'indexation et du classement de votre site.

 

Faciliter l'accès à votre site

Lors de la conception de votre site, vos liens doivent être définis selon une structure logique. Chaque page doit être au moins accessible à partir d'un lien texte statique.

 

Utilisez un navigateur texte tel que Lynx pour examiner votre site. La plupart des robots d'exploration visualisent votre site de la même manière que Lynx. Si certaines fonctionnalités (JavaScript, cookies, ID de session, cadres, balises DHTML ou contenus Macromedia Flash) empêchent l'affichage intégral de votre site dans un navigateur texte, les robots risquent de rencontrer des difficultés similaires lors de leur exploration.

 

Pensez à créer des copies statiques de vos pages dynamiques. L'index Google contient des pages dynamiques, mais ces dernières sont minoritaires. Si vous pensez que vos pages générées dynamiquement (URL contenant des points d'interrogation, par exemple) sont à l'origine des problèmes d'exploration rencontrés par notre robot, vous pouvez créer des copies statiques de ces pages. Si vous optez pour cette solution, n'oubliez pas d'ajouter ces pages dynamiques à votre fichier robots.txt afin d'éviter qu'elles ne soient considérées comme des doublons.

 

Actions déconseillées

N'ajoutez pas de listes de mots clés à vos pages. Ne faites pas non plus appel à des techniques de dissimulation de contenu (cloaking) ou à des pages spécialement conçues pour être détectées par les robots d'exploration. Si votre site contient des pages, des liens ou du texte non destinés aux internautes, Google considérera ces pages et liens comme une tentative de manipulation de ses robots et risque de ne pas référencer votre site.

 

Vous n'êtes en aucun cas obligé de faire appel à des services d'optimisation de moteurs de recherche. Certaines sociétés prétendent pouvoir "garantir" un classement élevé des sites dans les résultats de recherche Google. Certaines sociétés de conseil peuvent en effet vous aider à améliorer la visibilité et le contenu de votre site. D'autres, en revanche, font appel à des pratiques conçues pour induire sciemment en erreur les moteurs de recherche. Faites preuve de prudence. Si votre domaine est affilié à des services de ce type, nous pouvons être amenés à l'exclure de notre index.

 

N'utilisez pas d'images pour afficher des noms, des informations ou des liens importants. Nos robots ne reconnaissent pas le texte contenu dans les graphiques. Utilisez des attributs ALT si vous ne pouvez pas utiliser le format HTML standard pour le contenu principal et les mots clés de votre page.

 

Ne créez pas plusieurs copies d'une même page sous différentes URL. De nombreux sites proposent des versions en texte seul ou des versions imprimables qui reprennent le contenu des pages graphiques correspondantes. Pour garantir le référencement des pages importantes de votre site dans nos résultats de recherche, identifiez les doublons dans un fichier robots.txt afin de bloquer leur exploration par nos robots. Pour plus d'informations sur l'utilisation du fichier robots.txt, consultez nos informations sur le blocage de Googlebot.

 

Les pages dynamiques sont-elles indexées sur Google ?

 

Oui. Google indexe les pages Web générées de façon dynamique, notamment les pages .asp et .php, ainsi que les pages comportant des points d'interrogation dans leurs URL. Cependant, ces pages peuvent poser des problèmes pour notre robot d'exploration et ne pas être prises en compte. Si votre site contient des pages de ce type, vous pouvez envisager de créer des copies statiques de ces pages pour notre robot. Dans ce cas, veillez à inclure un fichier robots.txt qui interdit l'exploration des pages dynamiques afin que celles-ci ne soient pas considérées comme des doublons. De plus, vous pouvez créer un plan Sitemap détaillé de vos pages et l'envoyer, à l'aide du composant Outils pour les webmasters de Google Sitemaps. Les outils Google pour les webmasters représentent un moyen simple de demander l'indexation de vos URL par notre moteur de recherche et d'obtenir des rapports détaillés sur la visibilité de vos pages sur Google. Nous sommes informés automatiquement et en permanence de la situation de vos pages et de toute modification. Notez que l'envoi d'un plan Sitemap ne garantit pas que toutes les pages de votre site seront explorées ou incluses dans nos résultats de recherche. Pour en savoir plus sur Google Sitemaps et les outils pour les webmasters, consultez notre page d'informations. 

 

Les sites utilisant des animations Macromedia Flash sont-ils inclus dans l'index de Google ? 

Oui, les sites utilisant des animations Macromedia Flash sont inclus dans l'index de Google. En revanche, nos robots d'exploration peuvent rencontrer des difficultés pour indexer des pages Flash. Si vous pensez que le contenu Flash de vos pages empêche Google d'explorer votre site, essayez d'utiliser un navigateur texte tel que Lynx pour examiner votre site. Si des fonctionnalités telles que Flash vous empêchent de voir la totalité de votre site dans un navigateur texte, il est possible que les spiders (robots d'exploration) du moteur de recherche rencontrent également des difficultés pour explorer votre site.

 

Vous pouvez envisager de créer des copies HTML de ces pages Flash pour notre robot d'exploration. Dans ce cas, veillez à inclure un fichier robots.txt qui interdit l'exploration des pages Flash afin que ces pages ne soient pas considérées comme un contenu en double.

 

Enfin, vous pouvez également créer et envoyer un plan Sitemap détaillé de vos pages, à l'aide de Google Sitemaps. Google Sitemaps représente un moyen simple de demander l'indexation de vos URL par notre moteur de recherche et d'obtenir des rapports détaillés sur la visibilité de vos pages sur Google. Grâce à Google Sitemaps, nous sommes informés automatiquement et en permanence de l'existence de vos pages et des mises à jour. Notez que l'envoi d'un plan Sitemap ne garantit pas que toutes les pages de votre site seront explorées ou incluses dans nos résultats de recherche.

 

  • Les frames : Les robots ont du mal avec les sites qui ont frames (cadres en Français).Si vous ne pouvez pas faire autrement vérifiez que la description et les mots-clés figurent dans la page qui contient les frames. Utilisez la balise <NOFRAMES> en y insérant du texte enrichi en mot clef pour améliorer les résultats. Prévoyez également un système de contrôle d' affichage de vos pages. La construction la plus fréquente avec des frames consiste à mettre le menu dans une frame et le contenu dans l' autre. Le moteur de recherche indiquera le chemin de la page de contenu. Le surfeur qui viendra sur cette page, via le moteur de recherche, se retrouvera sans menu et risque fort de quitter votre site dès sa lecture terminée.Les designers qui recourent aux "frames", utilisent plusieurs pages html pour présenter le contenu d'une seule page. Les pages avec des "frames" requièrent un travail supplémentaire d'optimisation pour une indexation correcte par les moteurs de recherche. D'autre part elles posent un probléme d'ergonomie si elles incitent un utilisateur à dérouler le contenu de chaque fenêtre au sein d'une même page. Évitez l'utilisation des "frames".

 

  • Le flash : Les Sites 100% en Flash ne sont pas du tout visibles par les robots de recherche. La meilleure solution consisterait à faire une copie du site sans Flash et avec plus de contenu textuel, qui pourra être mieux pris en compte par les moteurs et par les visiteurs avec une connection lente. Autrement dit, si vous tenez absolument à avoir un site 100% en Flash, il est impératif d'avoir son clône en version HTML (texte).

 

  • Balise TITLE inexistante : La Balise TITLE est un champ essentiel. C'est LE critère numéro 1 pour tous les moteurs de recherche dans le positionnement de site Internet. Un site ne comportant aucune balise TITLE ou uniquement des balises indiquant "Document sans nom", n'ont aucune chance de voir grimper leur classement.

 

  • Balise TITLE : Les deux erreurs le plus souvent commises sur les titres de page sont les suivantes :

- Le libellé de la balise <TITLE> n'a pas de rapport avec le contenu de la page : "Bienvenue sur notre site", "Home Page" ...

- Le titre (balise <TITLE>) est le même sur toutes les pages du site Internet

 

  • Balise DESCRIPTION indexistante : La balise Description est également un champ essentiel pour les moteurs de recherche. Un site ne comportant aucune balise Description a peu de chance de voir grimper son classement.

 

  • Balise DESCRIPTION : La balise Description doit indiquer, en une phrase simple, aux robots de recherche quel est le contenu de la page. 

 

  • Manque de contenu

Il y a une règle sur Internet qui s'applique aussi au référencement : le contenu est roi ! Une page qui ne contient pas de texte est souvent mal référencée par les moteurs de recherche. En effet, les moteurs de recherche se basent entre autres sur la pertinence des textes, des titres de vos pages, des titres de chapitres et des liens-textes afin de pouvoir évaluer la cohérence d'une page web et faire coïncider son contenu avec les recherches des internautes. Si ces éléments sont absents du contenu, votre site risque de ne pas occuper la place qu'il mérite. 

 

Trop d' images et peu de texte : éviter d' avoir trop d' élément graphique sur votre page d' accueil. Si le robot ne trouve pas suffisant de texte votre page risque d' être mal prise en compte et donc mal classée. Limitez leur usage et donnez leur l' attribut 'ALT' contenant une description.Si un moteur de recherche lit avant tout le contenu-texte de votre site, pourquoi lui servir une navigation sous forme de liens graphiques ? Privilégiez une navigation sous forme de liens-textes, c'est une opportunité d'utiliser vos mots-clefs et de faciliter le travail d'indexation de vos page

 

Liens inactifs : Les liens inactifs sont une véritable plaie sur un site. Il n’y a rien de tel pour laisser une mauvaise impression à vos visiteurs. Prenez l’habitude de vérifier régulièrement vos liens internes et externes. 

 

Navigation pénible : Rien de plus frustrant que de se trouver bloqué sur un site sans pouvoir retourner à une page qui nous intéresse.Un site Web n’est pas qu’un ensemble de pages qui se suivent les unes après les autres. Il doit comporter une organisation logique suffisamment développée pour lier tous les documents. 

   

  • Proposer une URL qui contient les caractères ?, &, = (pages dynamiques). En revanche les pages dynamiques (PHP, ASP, CFM) ne posent pas de problèmes aux robots si l' URL ne contient pas ces caractères.

 

La balise "Refresh" : Les moteurs pénalisent les sites contenant ce genre de balises lorsque que le délai est faible. Évitez les pour ne pas prendre de risque. Les redirections d' URL ne sont également pas prises en compte, même si elles ne sont pas considérées comme étant des tentatives de fraude. Exemple : la saisie de l' adresse http://www.votresite.com/ qui redirige automatiquement vers http://www.votresite.fr/english/ (avec cette adresse qui devient d' un coup visible dans la barre d' adresse de votre navigateur) ou http://www.votresite.com/ qui redirige vers l' adresse"réelle" http://www.votrehebergeur.com/votresite/. Dans ce cas, l' adresse initiale (www.votresite.com) ne sera jamais référencée.

 

  • Eviter le Javascript produisant des roll-overs sur les liens ou ouvrant les fenêtres pop-up sans avoir doublé les liens graphiques d' une version textuelle "simple" avec la balise <noscript> par exemple. Ces liens ne sont pas suivi par tous les spiders et l' indexation pourrait se limiter à la première page.

 

  • Splash pages 

Une "splash page" est une page d'entrée de site qui présente souvent un beau contenu graphique, ou une animation Flash mais qui a comme seul contenu-texte "entrer" ou "passer l'introduction". Elle ne présente aucun contenu-texte et oblige les visiteurs à faire un click supplémentaire pour accéder au contenu "réel" de votre site. Ce type de pages ne présente aucun intérêt, si ce n'est pour votre designer.

 

Un site en travaux : Attendez que votre site soit terminé avant de le publier et de le soumettre.

 

Un site dont la langue ne correspond pas à l' annuaire : ne référencez pas un site français dans Yahoo! US par exemple, il serait à coup sûr refusé et tout le monde perd du temps.

 

  • Un site "mort" (peu mis à jour) : votre site doit être attrayant. Imaginez que votre quotidien ait le même contenu tous les jours. Imaginez Que PPDA dise exactement la même chose tous les jours. Vous eriez chargés de donner un classement au quotidien ou au journal télévisé. Que feriez vous ? comme le font les robots de recherche pour les sites vous feriez grimper les quotidiens aux informations qui changent et déclasseriez ceux qui sont immobiles !!!!

 

  • Un site creux, sans contenu: Les annuaires sont de plus en plus restrictifs et privilégient en premier lieu les contenus les plus importants. Les annuaires partent du principe que les sites qu 'ils recensent doivent répondre aux questions des internautes. Un site "creux" ne répond à aucune question ! Les sites de type "plaquette" (coordonnées, types de produits vendus par l' entreprise, mot du Président) n' ont plus que très peu de chance d' être intégrées dans les annuaires majeurs. Privilégiez donc la qualité dès le lancement du site et proposez du contenu intéressant aux internautes : dossiers thématiques, actualité, articles de fond, revue de presse, information souvent mise à jour et renouvelée. Les annuaires vous intégreront dans leur base de données rapidement. Un contenu un peu décalé, original, voire marginal, peut également accélérer un référencement. 

 

  • Un site lent à charger : Pensez que bon nombre d' utilisateurs possèdent des mode 56K et que les surfeurs ne l' oublient pas même si ils possèdent un accès rapide. Il existe des outils permettant d' estimer le temps de chargement de vos pages.

 

  • Le nom de domaine est un élément important pour les moteurs qui effectuent les recherches. Ils filtrent de plus en plus les inscriptions, au vu du nombre très important de demandes. Un site qui a un nom de domaine propre (www.monsite.com) aura toujours un petit avantage par rapport à un "site perso" (www.multimania.com/monsite/). C' est également important que les visiteurs puissent se souvenir facilement de l' adresse.

 

  • Faites en sortes que les textes du site répètent plusieurs fois les mots clefs important sans toutefois exagérer. C' est là que se départagent les sites les mieux classés. 

 

  • Certaines astuces qui permettaient auparavant d' améliorer votre classement dans les moteurs de recherche sont devenus très mauvaises, en voici quelques unes :

Cacher des mots clés de la même couleur que le fond de la page :Cette méthode est révolue, il suffit aux moteurs de recherche de trouver cet argument bgcolor="#FFFFFF" et de le comparer à celui-ci color="#FFFFFF". Cela risque détrôner la suppression de la page voire dans certains cas de tout le site de la base de données du moteur de recherche.

 

Répétition de mots clés :Répéter le même mot clé plus de trois fois (en moyenne) de façon trop rapprochée à n' importe quel endroit dans le code source de la page (balise META, ALT, TITLE ou dans le corps de la page).Cela risque détrôner la suppression de la page voire dans certains cas de tout le site de la base de données de l' outils de recherche.

 

L' utilisation de mots sans rapport avec le thème de la page : Dans le but de générer du trafic, on peut être tenté d' utiliser par exemple des noms de marques ou bien de placer des mots à fort trafic tel que MP3 ou sexe dans des balises HTML. Exemple trouvé sur le net : meta name="keywords" content="informatiques, achat, vente, shopping, informatique, scanner, imprimante, sexe, gros seins, moniteurs, disquette, son, ..." Vous pouvez être punissable en utilisant des noms de marques ou de personnes