Wikipedia: โครงการใหญ่แก้ไขลิงก์เก่าที่เสียหายหลายล้านรายการ

กองบรรณาธิการจำนวนมหาศาลของวิกิพีเดียพยายามอย่างเต็มที่ที่จะข้ามไปยังหน้าต่างๆ ที่แสดงข้อมูลที่ผิดพลาดหรือเขียนใหม่อย่างรวดเร็ว รายการที่ถูกดัดแปลงโดยผู้กระทำความผิด แต่บางครั้งข้อมูลเท็จก็ยังคงอยู่นานกว่าที่คุณคิด ชอบ.

ด้วยเหตุนี้ ผู้คนจำนวนมากที่ใช้สารานุกรมออนไลน์จึงชอบที่จะคลิกลิงก์ของบุคคลที่สามที่ด้านล่างของหน้าซึ่งมีแหล่งข้อมูลในบทความหลัก ลิงก์เหล่านั้นไม่เพียงแต่จะยืนยันข้อมูลในบทความ Wikipedia เท่านั้น แต่ยังให้ข้อมูลเชิงลึกอีกด้วย ในเรื่องนั้นและเป็นทรัพยากรอันล้ำค่าสำหรับผู้ที่ต้องการเจาะลึกลงไปในเรื่องใดเรื่องหนึ่งโดยเฉพาะ หัวข้อ.

วิดีโอแนะนำ

ปัญหาคือบางครั้งบทความเหล่านั้น — ไม่ว่าจะมาจากสื่อข่าว สถาบันการศึกษา ธุรกิจ หรือสถาบันวิจัย — ถูกออฟไลน์ ส่งผลให้ลิงก์เสียหาย สิ่งนี้สามารถบ่อนทำลายความน่าเชื่อถือของ Wikipedia สำหรับผู้ที่ต้องการตรวจสอบข้อมูลที่ปรากฏในรายชื่อ

ข่าวดีก็คือว่าทีมอาสาสมัครจาก คลังอินเทอร์เน็ต สามารถกู้คืนลิงก์ที่เสียหายจำนวนมหาศาลเก้าล้านลิงก์บนวิกิพีเดียได้ ช่วยให้ข้อความ "ไม่พบข้อผิดพลาด 404/เพจ" ที่น่ารำคาญเหล่านั้นกลายเป็นอดีตไปแล้ว

Internet Archive เป็นห้องสมุดดิจิทัลที่ไม่แสวงหากำไรซึ่งเก็บบันทึกหน้าเว็บทุกหน้า วางตลาดออนไลน์ตั้งแต่ปี 1996 ซึ่งเป็นช่วงที่อินเทอร์เน็ตที่เรารู้จักในปัจจุบันอยู่ในช่วงแรกสุด การพัฒนา. ใช่แล้ว ในบรรดาหน้าเว็บที่เก็บถาวรจำนวน 338 พันล้านหน้านั้นเป็นหน้าเว็บทั้งหมดที่ Wikipedia เชื่อมโยงอยู่ แต่ได้ถูกทำให้ออฟไลน์ตั้งแต่นั้นมา

Mark Graham จาก Internet Archive อธิบายไว้ใน โพสต์ในบล็อก สัปดาห์นี้มีวิธีการเก็บถาวรเกือบทุก URL ที่อ้างอิงบนเว็บไซต์ Wikipedia ต่างๆ ทันทีที่มีการเพิ่มหรือเปลี่ยนแปลงลิงก์เหล่านั้น ในอัตราประมาณ 20 ล้าน URL ต่อสัปดาห์

นอกจากนี้ยังใช้งานหุ่นยนต์ซอฟต์แวร์ที่เรียกว่า IABot ในรุ่นภาษาวิกิพีเดียมากกว่า 20 ฉบับเพื่อค้นหาลิงก์ที่ใช้งานไม่ได้ Graham เขียน เมื่อพบลิงก์ที่ใช้งานไม่ได้ IABot จะค้นหาไฟล์เก็บถาวรใน Wayback Machine ซึ่งเป็นฐานข้อมูลที่ค้นหาได้สำหรับหน้าเว็บ และไฟล์เก็บถาวรของเว็บอื่น ๆ เพื่อแทนที่ด้วย

“การกู้คืนลิงก์ทำให้มั่นใจได้ว่า Wikipedia ยังคงถูกต้องและตรวจสอบได้ และสอดคล้องกับนโยบายเนื้อหาหลักสามประการของ Wikipedia: 'การตรวจสอบได้'” Graham เขียน

ทีมงานวางแผนที่จะดำเนินการตรวจสอบและแก้ไขลิงก์บนเว็บไซต์ Wikipedia และเพิ่มจำนวนต่อไป ความเร็วของระบบ พร้อมดูว่าจะสามารถขยายการทำงานนอกเหนือจากออนไลน์ได้อย่างไร สารานุกรม.

ในบันทึกด้านข้าง เครื่องเวย์แบ็ค เป็นเครื่องมือสนุกๆ ที่ใครๆ ก็สามารถใช้ได้ นอกจากช่วยให้คุณเข้าถึงข้อมูลจากไซต์เก่าแล้ว มันยังช่วยให้คุณเห็นว่าการออกแบบของไซต์เปลี่ยนแปลงไปอย่างไรในช่วงหลายปีที่ผ่านมา สิ่งที่คุณต้องทำคือป้อน URL ของไซต์ ตัวอย่างเช่น ป้อน "youtube.com" จากนั้นคลิกวันที่อื่นในปฏิทินเพื่อดูว่าบริการสตรีมมิ่งเคยดูยุ่งยากเพียงใด หน้าที่เก็บถาวรไม่ใช่แบบไดนามิก แต่จะแสดงภาพรวมของลักษณะที่ปรากฏในแต่ละวันแทน

หลายๆคนที่ใช้ วิกิพีเดีย และรู้เกี่ยวกับ Wayback Machine แล้วใช้เครื่องมือในการเข้าถึงสแนปชอตของเพจที่หายไป แต่เป็น Internet Archive การทำงานเพื่อสร้างลิงก์ขึ้นมาใหม่ได้ช่วยปรับปรุงการใช้งานของเว็บไซต์ และยังเพิ่มความน่าเชื่อถือใน กระบวนการ.

คำแนะนำของบรรณาธิการ

  • เสียงเทคโนโลยีเก่าได้รับการเก็บรักษาไว้โดยเป็นส่วนหนึ่งของโปรเจ็กต์เสียงขนาดใหญ่

อัพเกรดไลฟ์สไตล์ของคุณDigital Trends ช่วยให้ผู้อ่านติดตามโลกแห่งเทคโนโลยีที่เปลี่ยนแปลงไปอย่างรวดเร็วด้วยข่าวสารล่าสุด รีวิวผลิตภัณฑ์สนุกๆ บทบรรณาธิการที่เจาะลึก และการแอบดูที่ไม่ซ้ำใคร

หมวดหมู่

ล่าสุด

Super Bowl LI นำเสนอการเล่นซ้ำของผู้เล่น POV - โดยไม่ต้องต่อกล้อง

Super Bowl LI นำเสนอการเล่นซ้ำของผู้เล่น POV - โดยไม่ต้องต่อกล้อง

มุมมองตาผู้เล่น FOX Sportsกระตือรือร้นที่จะใช้ป...

เรโนลต์ถูกกล่าวหาว่าโกงการปล่อยมลพิษ

เรโนลต์ถูกกล่าวหาว่าโกงการปล่อยมลพิษ

Ronan Glon/เทรนด์ดิจิทัลคลื่นกระแทกเรื่องอื้อฉา...

U.K. Smart Home Company Hive มาถึงสหรัฐอเมริกาแล้ว

U.K. Smart Home Company Hive มาถึงสหรัฐอเมริกาแล้ว

สภาพอากาศจากลิเวอร์พูลถึงลีดส์มีแนวโน้มที่จะไม่...