Wikipedia: Stort projekt fixar miljoner av sina gamla, trasiga länkar

Wikipedias enorma armé av redaktörer gör sitt bästa för att hoppa på sidor som visar felaktig information eller snabbt skriva om poster som har manipulerats av en skurk, men ibland finns den falska informationen kvar längre än du skulle tycka om.

Med det i åtanke gillar många som använder onlineuppslagsverket att träffa tredjepartslänkarna längst ner på sidan som informationen i huvudartikeln har hämtats från. Dessa länkar bör inte bara bekräfta informationen i Wikipedia-artikeln utan också ge mer djup till ämnet, och är därför en ovärderlig resurs för dem som vill gräva djupare in i en viss ämne.

Rekommenderade videor

Problemet är att ibland tas dessa artiklar – oavsett om de kommer från nyhetsmedia, utbildningsinstitutioner, företag eller forskningsinstitutioner – offline, vilket resulterar i en bruten länk. Detta kan undergräva Wikipedias trovärdighet för dem som vill verifiera information som förekommer i listan.

Den goda nyheten är att ett team av volontärer från Internetarkiv har kunnat återställa kolossala nio miljoner trasiga länkar på Wikipedia, vilket hjälper till att göra dessa irriterande "404-fel/sida ej hittad"-meddelanden till det förflutna.

Internet Archive är ett ideellt digitalt bibliotek som har fört register över varje webbsida satt online sedan 1996, när internet som vi känner det idag var i sina tidigaste skeden av utveckling. Så ja, bland dess häpnadsväckande 338 miljarder arkiverade webbsidor finns alla de som Wikipedia länkade till men som sedan har tagits offline.

Internetarkivets Mark Graham förklarade i ett blogginlägg denna vecka hur det har arkiverat nästan alla webbadresser som hänvisas till på olika Wikipedia-webbplatser i det ögonblick som dessa länkar läggs till eller ändras – med en hastighet av cirka 20 miljoner webbadresser i veckan.

Det har också kört en mjukvarurobot som heter IABot på mer än 20 Wikipedia-språkutgåvor som söker efter trasiga länkar, skrev Graham. När den hittar trasiga länkar, letar IABot efter arkiv i Wayback Machine – en sökbar databas för webbsidor – och andra webbarkiv att ersätta dem med.

"Att återställa länkar säkerställer att Wikipedia förblir korrekt och verifierbart och uppfyller därför en av Wikipedias tre kärninnehållspolicyer: 'Verifierbarhet'", skrev Graham.

Teamet planerar att fortsätta med sina ansträngningar att kontrollera och fixa länkar på fler Wikipedia-sidor och öka hastigheten på dess system, samt titta på hur det kan utöka sin verksamhet utöver online encyklopedi.

På en sidoanteckning, den Wayback-maskin är ett roligt verktyg som alla kan använda. Förutom att hjälpa dig komma åt information från gamla webbplatser, låter den dig också se hur en webbplats design har förändrats under åren – allt du behöver göra är att ange webbplatsens URL. Ange till exempel "youtube.com" och klicka sedan på olika datum i kalendern för att se hur klumpig streamingtjänsten brukade se ut. De arkiverade sidorna är inte dynamiska utan visar istället en ögonblicksbild av hur det såg ut en viss dag.

Många människor som använder Wikipedia och känner till Wayback Machine använder redan verktyget för att komma åt en ögonblicksbild av den förlorade sidan, men Internet Archive's arbetet med att återupprätta länkarna har bidragit till att förbättra webbplatsens användbarhet och även öka dess trovärdighet i bearbeta.

Redaktörens rekommendationer

  • Gamla tekniska ljud bevarade som en del av ett stort ljudprojekt

Uppgradera din livsstilDigitala trender hjälper läsare att hålla koll på den snabba teknikvärlden med alla de senaste nyheterna, roliga produktrecensioner, insiktsfulla redaktioner och unika smygtittar.