Remove ads
hyperlien qui dirige les internautes vers des pages, serveurs ou autres ressources définitivement indisponibles De Wikipédia, l'encyclopédie libre
Un lien mort, lien brisé, lien cassé ou lien rompu est un lien hypertexte qui redirige vers un site web ou une page web n'existant plus. À l'échelle du Web, le phénomène correspond au pourrissement des liens, connu en anglais sous le nom de link rot.
Un lien peut rompre pour plusieurs raisons. L'explication la plus simple et la plus courante est que la page web n'existe plus, ce qui mène, la plupart du temps, à une erreur HTTP 404, qui indique que le serveur a bien répondu mais que la page précise est introuvable. D'autres codes de retour sont possibles aussi, la page peut avoir été déplacée ou renommée sur le serveur, ou le serveur lui-même avoir été déplacé ou renommé[1].
Les autres raisons qui font qu'un lien est cassé incluent :
domain.net/pine_tree
peut devenir domain.net/tree/pine
).Plusieurs études ont examiné la prévalence de liens rompus sur le Web, parmi la littérature académique et les bibliothèques numériques[3],[4]. En 2003, l'expérience faite par Fetterly et al.[5] découvrit que chaque semaine environ un lien sur 200 cessait d'être valide. Nelson et Allen (2002)[6] examinèrent le pourrissement des liens dans les bibliothèques numériques et trouvèrent que 3 % d'objets ne furent plus accessibles après une année.
En 2004, une autre étude a montré que les sous-ensembles de liens internet (qui cible des types de fichiers spécifiques ou qui sont hébergés par des institutions académiques) pourrait avoir des vies effectives radicalement différentes[7]. Les URL de publications paraissent avoir une longévité plus longue sur Internet que les autres URL. Une étude de 2015 menée par Weblock a analysé plus de 180 000 liens de ressources dans le corpus de trois principaux éditeurs en libre accès, et a conclu a une durée de vie moyenne de 14 ans, confirmant une étude de 2005 qui concluait que la moitié des URL trouvées dans les articles du Magazine D-Lib étaient encore actives 10 ans après leur publication[8],[9]. D'autres études ont trouvé un taux de liens pourris plus élevé dans la littérature académique, mais montrent une espérance de vie d'au moins quatre ans[10],[11] Une étude de la BMC Bioinformatics a analysé près de 15 000 liens dans les résumés de citations indexées de Thomson Reuteur Web of Science, et a conclu que la durée de vie médiane d'une page internet était de 9,3 années, et que seulement 62% des pages étaient archivées[12].
Une étude menée en 2016-2017 sur les liens Yahoo! Directory (l'annuaire de Yahoo! qui a arrêté d'être mis à jour en 2014, après 21 ans de développement), a conclu que la durée de vie effective des liens était de deux ans[13].
Les stratégies pour prévenir des liens pourris peuvent se concentrer sur où situer le contenu afin que la probabilité qu'il y demeure est la plus élevée, ainsi qu'utiliser des liens d'autorité qui ont moins de probabilité d'être cassé, ou encore réparer les liens dont la cible a été supprimée ou relogée.
La création d'URLs qui ne changeront pas avec le temps est la méthode fondamentale afin de se prévenir de liens pourris. Tim Berners-Lee et d'autres pionniers d'Internet sont les champions de la planification préventive[14].
Les stratégies relatives à l'autorité des liens incluent :
Les stratégies relevant de la protection de liens existants incluent :
La détection de liens cassés peut être faite manuellement ou automatiquement. Les méthodes automatiques incluent des plug-ins pour systèmes de management, ainsi que des vérificateurs autonomes de liens cassés, tel que Xenu's Link Sleuth. La vérification automatique peut ne pas détecter des liens qui renvoie vers du 404, ou des liens qui retourne une réponse 202 OK mais pointent vers du contenu qui a changé[23].
Seamless Wikipedia browsing. On steroids.
Every time you click a link to Wikipedia, Wiktionary or Wikiquote in your browser's search results, it will show the modern Wikiwand interface.
Wikiwand extension is a five stars, simple, with minimum permission required to keep your browsing private, safe and transparent.