Link Rot là gì?

Arcady / Shutterstock.com

Nếu bạn đang duyệt web và gặp phải trang lỗi 404 hoặc chuyển hướng không mong muốn, bạn đã thấy liên kết đang hoạt động. Theo thời gian, các liên kết giữ các trang web với nhau bị phá vỡ, đe dọa lịch sử văn hóa chung của chúng ta. Đây là lý do tại sao điều đó xảy ra.

Link Rot là gì?

Thối liên kết là khi các liên kết trong trang web bị hỏng theo thời gian, tạo ra một liên kết bị hỏng hoặc chết. “Liên kết bị hỏng”, chúng tôi có nghĩa là một liên kết không còn trỏ đến mục tiêu dự kiến ​​của nó kể từ khi liên kết được tạo lần đầu tiên. Khi bạn nhấp vào một trong các liên kết bị hỏng này, bạn sẽ gặp lỗi 404 hoặc bạn nhìn thấy trang hoặc trang web sai.

Liên kết Rot là phổ biến. Một nghiên cứu của Harvard năm 2021 đã kiểm tra các siêu liên kết trong hơn 550.000 bài báo của New York Times từ năm 1996 đến 2019 và phát hiện ra rằng 25% liên kết đến các trang cụ thể là không thể truy cập được, với tốc độ phân rã tăng lên đáng kể tùy thuộc vào độ cũ của các liên kết (ví dụ: khoảng 6 % của năm 2018 liên kết là câu chết 72% của 1998 liên kết). Một nghiên cứu khác cho thấy trong số 360 liên kết được thu thập vào năm 1995, chỉ có 1,6% còn hoạt động vào năm 2016.

Tại sao Link Rot lại xảy ra?

Web là một phương tiện linh hoạt, phi tập trung và không có sự kiểm soát tập trung, vì vậy nội dung có thể không có sẵn bất cứ lúc nào mà không cần cảnh báo. Máy chủ đến và đi, trang web ngừng hoạt động, dịch vụ chuyển sang máy chủ mới, phần mềm nhận bản cập nhật, ấn phẩm chuyển sang nền tảng quản lý nội dung mới và không di chuyển nội dung, miền hết hạn, v.v.

Có một vấn đề liên quan khác trên web được gọi là “nội dung trôi dạt”, trong đó liên kết vẫn hoạt động nhưng nội dung chứa trong liên kết đã thay đổi so với liên kết ban đầu, điều này có thể gây ra sự cố vì tác giả ban đầu của liên kết có ý định trỏ đến thông tin khác.

Có gì tệ khi mất các trang web cũ?

Đó là bản chất của thế giới mà mọi thứ suy tàn và biến mất. Để giữ cho thông tin tồn tại là một quá trình hoạt động cần thời gian, năng lượng và nỗ lực. Vì vậy, vấn đề chính của việc thay đổi liên kết không nhất thiết là chúng ta cần phải lưu trữ tất cả thông tin mãi mãi, mà là thông tin điện tử và tài liệu tham khảo có khả năng trở nên mỏng manh và dễ bị tổn thương hơn so với những thông tin giấy thường được sử dụng trước đây.

Nhiều tác giả của các bài báo , bài báo học thuật , và thậm chí cả quyết định của tòa án sử dụng liên kết web như một cơ chế trích dẫn để cung cấp các nguồn ngữ cảnh quan trọng cho thông tin được trình bày. Đó cũng là một vấn đề với Wikipeda . Như Jonathan Zittrain đã giải thích trong một bài báo năm 2021 về mục tiêu liên kết cho The Atlantic , “Nguồn cung ứng là chất keo kết dính tri thức của nhân loại lại với nhau. Đó là thứ cho phép bạn tìm hiểu thêm về những gì chỉ được đề cập ngắn gọn trong một bài báo như bài báo này và để những người khác kiểm tra lại sự thật như tôi đại diện cho họ. “

Nếu các liên kết bị phá vỡ và các nguồn không có sẵn, người đọc sẽ khó đánh giá liệu tác giả có trình bày một cách trung thực và chính xác nguồn thông tin ban đầu hay không. Và thậm chí ngoài liên kết, một số trang web cung cấp thông tin trực tuyến mà không thể tìm thấy ở bất kỳ nơi nào khác. Việc đánh mất những trang đó sẽ tạo ra những lỗ hổng trong kiến ​​thức chung của nhân loại và những lỗ hổng trong kết cấu nền văn hóa chia sẻ của chúng ta.

Giải pháp để Link Rot là gì?

Các chuyên gia coi mục liên kết và trôi dạt nội dung là đặc hữu của web vì nó hiện đang được thiết kế. Điều đó có nghĩa là một phần bản chất cơ bản của web sẽ không mất đi trừ khi chúng tôi cố gắng tích cực sửa chữa hoặc giảm thiểu nó.

Một trong những giải pháp hiệu quả nhất cho vấn đề luân chuyển liên kết cho đến nay đã xuất hiện vào năm 1996 với Internet Archive, nơi đã duy trì một kho lưu trữ công khai của hàng tỷ trang web trong 25 năm qua. Nếu bạn tìm thấy một liên kết bị hỏng, hãy truy cập Wayback Machine của Internet Archive và dán liên kết vào thanh tìm kiếm của nó. Nếu trang web đã được nắm bắt, bạn sẽ có thể duyệt qua kết quả. Hoặc nếu trang web gần đây đã ngừng hoạt động, bạn có thể xem nội dung gốc từ bản sao được lưu trong bộ nhớ cache mà Google lưu trữ.

Ngoài Internet Archive, một dự án do Harvard đứng đầu có tên Perma.cc nắm bắt các phiên bản vĩnh viễn của các trang web với mục đích trích dẫn học thuật và pháp lý lâu dài. Một tập hợp các thư viện duy trì các liên kết, vì vậy chúng sẽ tồn tại trong một thời gian. Mục đích là tạo ra các liên kết không bị thối rữa — chúng sẽ tồn tại miễn là lưu trữ Perma.cc được duy trì.

Các giải pháp tiềm năng khác để khắc phục sự cố liên kết vẫn đang trên đà chảy máu, bao gồm các giải pháp Web 3.0 tiềm năng và lưu trữ dữ liệu phân tán nhờ các giao thức như IPFS . Mặc dù trớ trêu thay, hàng trăm năm nữa, có thể những trang web duy nhất từ ​​thời đại này còn tồn tại sẽ là những trang web được mọi người in ra giấy. Ở ngoài đó an toàn!

Đọc tiếp

Có thể bạn quan tâm

Có thể bạn quan tâm