Brutt lenke

En død lenke , ødelagt lenke , kobling ødelagt eller lenke ødelagt er en hyperkobling som viderekobler til et nettsted eller en webside ikke lenger eksisterer. På en web skala tilsvarer fenomenet til nedbrytning av lenker , kjent i engelsk som kobling råte .

Årsaker

En lenke kan bryte av flere grunner. Den enkleste og vanligste forklaringen er at nettsiden ikke lenger eksisterer, noe som for det meste fører til en HTTP 404-feil , noe som indikerer at serveren reagerte bra, men den spesifikke siden ikke ble funnet. Andre returkoder er også mulig, siden kan ha blitt flyttet eller gitt nytt navn på serveren, eller selve serveren kan ha blitt flyttet eller omdøpt.

Andre grunner til at en lenke er ødelagt inkluderer:

Utbredelse

Flere studier har undersøkt forekomsten av ødelagte lenker på nettet, blant akademisk litteratur og digitale biblioteker . I 2003 ble eksperimentet gjort av Fetterly et al. fant ut at hver uke omtrent en av 200 lenker opphørte å være gyldig. Nelson og Allen (2002) undersøkte forfall av koblinger i digitale biblioteker og fant at 3% av objektene ikke lenger var tilgjengelige etter ett år.

I 2004 viste en annen studie at delmengder av internettkoblinger (som er målrettet mot spesifikke filtyper eller som er vert for akademiske institusjoner) kunne ha radikalt forskjellige effektive liv. URL-er til publikasjoner ser ut til å ha en lengre levetid på Internett enn andre URL-er. En studie fra Weblock fra 2015 analyserte over 180 000 ressurslinker i corpus av tre store open access-utgivere, og fant en gjennomsnittlig levetid på 14 år, og bekreftet en studie fra 2005 som fant at halvparten av nettadressene som ble funnet i D-Lib Magazine-artikler fortsatt var aktive 10 år etter publisering. Andre studier har funnet en høyere frekvens av råtne lenker i den akademiske litteraturen, men viser en forventet levealder på minst fire år. En BMC Bioinformatics-studie analyserte nesten 15.000 lenker i sammendrag av siteringsindekser fra Thomson Reuteur Web of Science, og konkluderte med at medianen levetiden til en webside var 9,3 år, og at bare 62% av sidene ble arkivert.

En studie utført i 2016-2017 på Yahoo! Directory (Yahoo!-katalogen som sluttet å oppdatere i 2014, etter 21 års utvikling), konkluderte med at den effektive levetiden til koblingene var to år.

Forebygging og oppdagelse

Strategier for å forhindre dårlige lenker kan fokusere på hvor innholdet skal plasseres, slik at sannsynligheten for at det forblir der, er størst, samt å bruke autoritetskoblinger som er mindre sannsynlig å bli ødelagt, eller reparere lenker hvis mål er slettet eller flyttet.

Å lage nettadresser som ikke vil endres over tid er den grunnleggende måten å forhindre dårlige lenker på. Tim Berners-Lee og andre Internett-pionerer er forkjemper for forebyggende planlegging.

Koblingsmyndighetsstrategier inkluderer:

Strategier for å beskytte eksisterende lenker inkluderer:

Oppdagelse av ødelagte lenker kan gjøres manuelt eller automatisk. Automatiske metoder inkluderer plugin-moduler for styringssystemer, samt frittstående brutte koblingsbrikker, for eksempel Xenus Link Sleuth. Den automatiske kontrollen oppdager kanskje ikke koblinger som peker til 404, eller koblinger som gir 202 OK-svar, men peker på innhold som er endret.

Referanser

  1. (i) P. Habibzadeh, "  Decay av referanser til nettsteder i artikler publisert i generelle medisinske tidsskrifter: Mainstream vs Small Journals  " , anvendt klinisk informatikk , vol.  4, n o  4,2013( DOI  10.4338 / aci-2013-07-ra-0055 , lest online , åpnet 7. september 2015 )
  2. "  Døden til en TLD  " [ arkiv av26. juli 2018] , på blog.benjojo.co.uk (åpnet 27. juli 2018 )
  3. P. Habibzadeh , “  Forfall av henvisninger til nettsteder i artikler publisert i General Medical Journals: Mainstream vs Small Journals  ”, Applied Clinical Informatics , vol.  4, n o  4,2013, s.  455–464 ( PMID  24454575 , PMCID  3885908 , DOI  10.4338 / aci-2013-07-ra-0055 )
  4. "  Hiberlink  " [ arkiv av29. januar 2015] , Hiberlink.org (åpnet 15. januar 2015 )
  5. (i) Dennis Fetterly, Mark Manasse, Mark og Janet Najork Wiener, "  A wide-scale study of the Evolution of Web pages  " , WWW '03 Proceedings of the 12. international conference on World Wide Web ,2003, s.  669-678 ( ISBN  1-58113-680-3 , DOI  10.1145 / 775152.775246 , les online )
  6. (i) Michael L. Nelson og Danette B. Allen , "  Objektpersistens og tilgjengelighet i digitale biblioteker  " , D-Lib Magazine , vol.  8, n o  1,januar 2002( DOI  10.1045 / januar 2002-nelson )
  7. Wallace Koehler , “  A longitudinal study of websides continue: a consider of document persistence  ”, Information Research , vol.  Ni, n o  to2004( les online [ arkiv av11. september 2017] , åpnet 31. januar 2019 )
  8. "  All-Time Weblock Report  " [ arkiv av4. mars 2016] ,august 2015(åpnet 12. januar 2016 )
  9. Frank McCown, Sheffan Chan, Michael L. Nelson og Johan Bollen (2005) " Tilgjengeligheten og utholdenheten til nettreferanser  i D-Lib Magazine  " Proceedings of the 5th International Web Archiving Workshop and Digital Preservation (IWAW'05) . Tilgang 2005-10-12. 
  10. Diomidis Spinellis , “  The Decay and Failures of Web Reference  ”, Communications of the ACM , vol.  46, n o  1,2003, s.  71–77 ( DOI  10.1145 / 602421.602422 , les online )
  11. Steve Lawrence , David M. Pennock , Gary William Flake , Robert Krovetz , Frans M. Coetzee , Eric Glover , Finn Arup Nielsen , Andries Kruger og C. Lee Giles , "  Persistence of Web References in Scientific Research  ", Computer , vol.  34, n o  to2001, s.  26–31 ( DOI  10.1109 / 2.901164 )
  12. Jason Hennessey og Steven Xijin Ge , “  A Cross Disciplinary Study of Link Decay and the Effectiveness of Mitigation Techniques  ”, BMC Bioinformatics , vol.  14,2013, S5 ( PMID  24266891 , PMCID  3851533 , DOI  10.1186 / 1471-2105-14-S14-S5 )
  13. Hans van der Graaf , "  Halveringstiden til en lenke er to år  " [ arkiv du17. oktober 2017] , på ZOMDirs blogg (åpnet 31. januar 2019 )
  14. Tim Berners-Lee , "  Cool URIs Don't Change  " [ arkiv av2. mars 2000] ,1998(åpnet 31. januar 2019 )
  15. Leighton Walter Kille , "  The Growing Problem of Internet" Link Rot "og Best Practices for Media and Online Publishers  ' [ arkiv12. januar 2015] , Journalist's Resource, Harvard Kennedy School,8. november 2014(åpnet 16. januar 2015 )
  16. kan oppleve forstyrrelser i tjenesten deres, noe som gjør URL-adresser midlertidig utilgjengelige.
  17. Parham Habibzadeh , “  Er nåværende arkivsystemer pålitelige nok?  ”, International Urogynecology Journal , vol.  26, n o  1030. juli 2015, s.  1553 ( ISSN  0937-3462 , PMID  26224384 , DOI  10.1007 / s00192-015-2805-7 )
  18. "  Internet Archive: Digital Library of Free Books, Movies, Music & Wayback Machine  " [ arkiv26. januar 1997] ,10. mars 2001(åpnet 7. oktober 2013 )
  19. Gunther Eysenbach og Mathieu Trudel , “  Going, going, still there: Using the WebCite service to permanent archive sitated websides  ”, Journal of Medical Internet Research , vol.  7, n o  5,2005, e60 ( PMID  16403724 , PMCID  1550686 , DOI  10.2196 / jmir.7.5.e60 )
  20. Jonathan Zittrain , Kendra Albert og Lawrence Lessig , “  Perma: Scoping and Addressing the Problem of Link and Reference Rot in Legal Citations  ”, Legal Information Management , vol.  14, n o  to12. juni 2014, s.  88–99 ( DOI  10.1017 / S1472669614000255 , les online )
  21. "  Harvard University's Berkman Center lanserer rav, et" gjensidig hjelp "-verktøy for bloggere og eiere av nettsteder for å hjelpe til med å holde nettet tilgjengelig | Berkman Center  ” [ arkiv av2. februar 2016] , på cyber.law.harvard.edu (åpnet 28. januar 2016 )
  22. John Mueller , "  FYI on Google Toolbar's Features Latest  " [ arkiv13. september 2008] , Google Webmaster Central Blog,14. desember 2007(åpnet 9. juli 2008 )
  23. Ziv Bar-Yossef, Andrei Z. Broder, Ravi Kumar og Andrew Tomkins (2004) “Sic transit gloria telae: towards a understanding of the Web's decay” Proceedings of the 13th international conference on World Wide Web - WWW '04 : 328– 337 s. ( DOI : 10.1145 / 988672.988716 ). 

Se også

Relaterte artikler

Bibliografi