Loading AI tools
De Wikipédia, l'encyclopédie libre
Le spamdexing ou référencement abusif[1],[2], est un ensemble de techniques consistant à tromper les moteurs de recherche sur la qualité d'une page ou d'un site afin d'obtenir, pour un mot-clef donné, un bon classement dans les résultats des moteurs (de préférence dans les tout premiers résultats, car les utilisateurs vont rarement au-delà de la première page qui, pour les principaux moteurs, ne comprend par défaut que dix adresses).
Elle est parfois sévèrement punie par les moteurs, même s'il n'y a pas de code de conduite précis pour les référenceurs (il est parfois difficile de distinguer le référencement abusif de la SEO de l'optimisation « honnête »). Les techniques habituelles de référencement abusif consistent par exemple à truffer une page satellite de listes de mots-clés (pour attirer les utilisateurs de moteurs qui font une recherche sur ces mots), ou à créer des dizaines de sites qui pointent les uns vers les autres (link farms ou pépinières de liens) pour améliorer leur classement dans les moteurs qui jugent la qualité d'une page en fonction du nombre de liens pointant vers elle.
Le mot « spamdexing » est un néologisme anglophone composé du substantif « spam » et du suffixe « dexing » pris sur le terme « indexing » signifiant référencement. Au Canada, l'Office québécois de la langue française propose comme traduction de « spamdexing » « référencement abusif »[2]. En France, la traduction officielle est également « référencement abusif »[1].
En principe, les moteurs de recherche classent les résultats selon la qualité des pages et leur pertinence par rapport à la requête ; mais les moteurs actuels (s'opposant ainsi aux annuaires, produits par des humains, qui refusent les sites de qualité insuffisante) tentent d'estimer la qualité et la pertinence des pages par des procédés automatiques, dont les principes sont connus, dans leurs grandes lignes, par les spammeurs et les optimiseurs de sites :
www.exemple.com/voyages-pas-chers/voyage-en-chine/voyage-en-chine.html
).Les techniques de référencement évoluent dans le temps et s'adaptent aux moteurs. Une nouvelle technique voit le jour : la « saturation par des intégrations multiples ». Le principe est le suivant : le titulaire du site à promouvoir propose son contenu à une série de partenaires qui ont un nom de domaine avec classement élevé par PageRank et un nombre de pages élevé, ce qui facilitera leur ascension dans les résultats. Exemple : www.site-du-spamdexeur.com propose le contenu. Puis, on retrouve le même contenu sur http://mot-clé.partenaire.com, http://mot-clé.partenaire2.com, etc. En résulte une saturation de la page de résultats des moteurs de recherche. On peut ainsi réussir à obtenir 80 % des résultats de recherche affichés en première page par les moteurs de recherche. Comme la plupart des clics se font sur la première page de résultats d'une requête, ils s'assurent ainsi un maximum de visibilité et évincent leurs concurrents.
Par opposition aux techniques de référencement dites abusives, certaines personnes avancent l'idée d'un référencement « éthique » censé reposer sur un code déontologique. Divers sites, ou associations de référenceurs, se sont avancés à proposer leur vision d'un code déontologique en matière de webmarketing. Ces préceptes n'ont aucune force de loi, varient d'une appréciation individuelle à l'autre, et n'engagent que ceux qui veulent bien se reconnaître dans de tels modèles « éthiques ». Ces mêmes codes d'éthique sont rédigés par intimidation des moteurs de recherche.
Les moteurs de recherche ont un succès inégal face au référencement abusif. Certaines pages peuvent rester bien positionnées alors que d'autres sont lourdement sanctionnés manuellement par des Quality Raters ou algorithmiquement . Ces actions peuvent être difficiles à interpréter, car les moteurs ne donnent pas toujours d'information sur les raisons de leurs sanctions. Cette variabilité dans le traitement tend à confirmer que les algorithmes d'indexation mis en œuvre sont complexes et difficiles à interpréter.
Un moteur comme Google applique des pénalités manuelles à certains sites mais tend à privilégier les solutions algorithmiques[3].
Pour ne pas donner des soupçons à l'utilisateur qui verrait sur son écran une longue liste de mots, les nombreux termes placés dans une page pour « piéger » les moteurs sont souvent camouflés par différents procédés :
example.com/trouver-requete.php
: une telle adresse ressemble à celle d'un fichier statique qui s'appellerait trouver-requete.php
, et qui serait situé sur le serveur du moteur, alors qu'il s'agit en fait d'une page dynamique (la sortie d'un script PHP, affichant les résultats de recherche) créée au moment de la requête : le fait de « déguiser » ainsi l'URL permet de faciliter son indexation si on suppose que les pages dynamiques peuvent ne pas être indexées par les moteurs, ou obtenir un classement inférieur à celui des pages statiques. En général, les pages de résultats des principaux moteurs possèdent des adresses telles que example.com/search.cgi?requete
, où le contenu de la requête n'est pas déguisé en nom de fichier ; de plus, ces moteurs interdisent expressément l'indexation de ces pages au moyen d'un fichier robots.txt ;Les techniques frauduleuses (fermes de liens, cloaking et autres) sont surveillées, et parfois réprimandées, par les moteurs de recherche qui perfectionnent chaque jour leurs algorithmes afin d'éliminer les sites trichant pour leur positionnement.
Lorsque des fraudes sont constatées (par un robot, par un humain, ou par un concurrent), la page ou le site en question est placé sur une liste noire (désindexation du moteur de recherche, ce qui pénalise grandement le site) pour une durée de quelques mois, définitive ou jusqu'à ce que le site respecte les conditions d'indexation de l'outil.
Google a mis en place un « bac à sable » (sandbox) qui est un avertissement avant la mise sur liste noire, mais aussi un moyen d'empêcher les nouveaux sites de grimper trop rapidement sur certains mots-clés dans les résultats de recherche.
Google par ailleurs, propose une page en 93 langues pour maintenir la qualité de l'index avec un rapport de spam lié aux pratiques interdites citées ci-dessus, ce qui permettra d'entrer un jour dans le référencement éthique[4].
Seamless Wikipedia browsing. On steroids.
Every time you click a link to Wikipedia, Wiktionary or Wikiquote in your browser's search results, it will show the modern Wikiwand interface.
Wikiwand extension is a five stars, simple, with minimum permission required to keep your browsing private, safe and transparent.