Вікіпедія: великий проект виправляє мільйони своїх старих непрацюючих посилань

Величезна армія редакторів Вікіпедії робить усе можливе, щоб перескочити на сторінки з помилковою інформацією або швидко переписати записи, які були підроблені зловмисниками, але іноді неправдива інформація залишається актуальною довше, ніж ви б люблю.

Пам’ятаючи про це, багато людей, які користуються онлайн-енциклопедією, люблять натискати на сторонні посилання внизу сторінки, з якої було взято інформацію в основній статті. Ці посилання повинні не лише підтверджувати інформацію у статті Вікіпедії, але й пропонувати більше інформації до теми, а тому є безцінним ресурсом для тих, хто бажає глибше заглибитися в конкретне тема.

Рекомендовані відео

Проблема в тому, що інколи ці статті — будь то із засобів масової інформації, освітніх закладів, компаній чи дослідницьких установ — переходять у режим офлайн, що призводить до непрацюючого посилання. Це може підірвати довіру до Вікіпедії для тих, хто хоче перевірити інформацію, що міститься в списку.

Доброю новиною є те, що команда волонтерів з Інтернет-архів

зміг відновити колосальні дев’ять мільйонів непрацюючих посилань у Вікіпедії, допомогвши зробити ці надокучливі повідомлення «помилка 404/сторінку не знайдено» в минулому.

Інтернет-архів — це некомерційна цифрова бібліотека, яка зберігає записи кожної веб-сторінки онлайн з 1996 року, коли Інтернет, яким ми його знаємо сьогодні, перебував на ранніх стадіях розвитку. Тож так, серед приголомшливих 338 мільярдів заархівованих веб-сторінок є всі ті, на які Вікіпедія посилалася, але які згодом були виведені з мережі.

Марк Грем з Internet Archive пояснив публікація в блозі цього тижня, як він архівував майже кожну URL-адресу, на яку посилаються на різних сайтах Вікіпедії, щойно ці посилання додавалися чи змінювалися — приблизно 20 мільйонів URL-адрес на тиждень.

Він також запустив програмного робота під назвою IABot у більш ніж 20 мовних версіях Вікіпедії для пошуку непрацюючих посилань, писав Грем. Коли він знаходить непрацюючі посилання, IABot шукає архіви в Wayback Machine — базі даних для пошуку веб-сторінок — та інші веб-архіви, щоб замінити їх.

«Відновлення посилань гарантує, що Вікіпедія залишається точною та доступною для перевірки, а отже, відповідає одній із трьох основних політик щодо вмісту Вікіпедії: «Можливість перевіряти», — написав Грем.

Команда планує продовжувати свої зусилля з перевірки та виправлення посилань на більшій кількості сайтів Вікіпедії та їх збільшення швидкість своєї системи, а також подивіться, як вона може розширити свою роботу за межі онлайн енциклопедія.

На замітку, Wayback Machine це цікавий інструмент, яким може скористатися кожен. Окрім доступу до інформації зі старих сайтів, це також дає змогу побачити, як дизайн сайту змінювався протягом багатьох років — все, що вам потрібно зробити, це ввести URL-адресу сайту. Введіть, наприклад, «youtube.com», а потім клацніть різні дати в календарі, щоб побачити, як незграбно виглядав потоковий сервіс. Архівні сторінки не є динамічними, а натомість показують знімок того, як вони виглядали в певний день.

Багато людей, які використовують Вікіпедія і знають про Wayback Machine, вже використовують інструмент для доступу до знімка втраченої сторінки, але Інтернет-архів робота з відновлення посилань допомогла покращити зручність використання сайту, а також підвищити його довіру в процес.

Рекомендації редакції

  • Звуки старих технологій, збережені як частина величезного аудіопроекту

Оновіть свій спосіб життяDigital Trends допомагає читачам стежити за динамічним світом технологій завдяки всім останнім новинам, цікавим оглядам продуктів, проникливим редакційним статтям і унікальним у своєму роді коротким оглядам.