Đối với hầu hết người dùng Internet, thế giới trực tuyến bắt đầu và kết thúc với Google.com. Tuy nhiên, Google không thể tìm thấy mọi thứ trên Web, đó là bởi vì có một web sâu (deep) và vô hình (invisible) mà Google không thể truy cập được. Đây là lý do tại sao bạn cần các công cụ tìm kiếm đặc biệt để tìm thông tin không dễ dàng có được. Đọc tiếp để tìm hiểu về Web ẩn và các công cụ tìm kiếm web sâu tốt nhất.
Mục lục
Web vô hình – Invisible Web là gì?
Để tìm hiểu về Web vô hình và công cụ tìm kiếm web sâu có thể trợ giúp như thế nào, trước tiên chúng ta cần thảo luận về ba lớp khác nhau của Web.
Cắt nghĩa nhanh:
- “Surface Web” là nơi hầu hết người dùng Internet sẽ ở lại. Đó là trang Web mà Google tìm kiếm. Các công cụ tìm kiếm thu thập thông tin và lập chỉ mục tất cả các trang web nằm trong Surface Web. Đây là những gì cư sĩ hiểu là Internet.
- “Deep Web”, hay Web sâu, là một danh sách tổng hợp các cơ sở dữ liệu, máy chủ và chương trình sẽ không xuất hiện trong kết quả tìm kiếm trực tuyến hoặc trực tiếp trên Web. Phần lớn, các chuyên gia coi Shallow Web lớn hơn đáng kể so với Surface Web.
- “Dark Web” là thứ mà bạn thường nghe thấy trong tin tức hoặc trong phim. Đây được coi là nơi diễn ra nhiều hoạt động bất hợp pháp hơn, chẳng hạn như buôn bán ma túy và vũ khí. Đó không phải là toàn bộ của Dark Web, nhưng nó yêu cầu một trình duyệt rất chuyên dụng như Tor để có quyền truy cập.
- Sự khác biệt giữa Deep Web và Dark Web là gì?
Vậy Web vô hình là gì? Đối với hầu hết các phần, nó tồn tại trong phạm vi của Deep Web nơi mà các trình thu thập thông tin web có mục đích chung không tiếp cận được. Ví dụ, hầu hết các bản ghi công khai được lưu trữ trong cơ sở dữ liệu chứ không phải trên các trang web tĩnh riêng lẻ. Điều này làm cho nó “ẩn” với Google, nhưng chúng tôi có thể lấy thông tin này từ các công cụ tìm kiếm web sâu .
1. Ahmia
Ahmia là một trong những công cụ tìm kiếm được thiết kế để sử dụng trên trình duyệt Tor. Nó được mọi người sử dụng rộng rãi trên trình duyệt đó, nhưng bạn cũng có thể sử dụng nó trên các trình duyệt thông thường như một giải pháp thay thế tập trung vào quyền riêng tư cho các công cụ như Google. Nó sẽ cung cấp cho bạn nhiều kết quả hơn những gì bạn sẽ tìm thấy trên Google và không sắp xếp hoặc lọc những gì bạn tìm thấy dựa trên quảng cáo.
Nó có nguồn gốc từ cộng đồng và mã nguồn mở, nhưng điều đó không có nghĩa là nó hoàn toàn miễn phí cho tất cả. Ahmia vẫn lọc ra các trang web lạm dụng và nguy hiểm, đồng thời là công cụ nâng cao nhận thức về các trang web cố gắng lừa người dùng.
2. USA.gov
Như bạn có thể tưởng tượng, kho lưu trữ chính thức của chính phủ về tất cả thông tin công khai về các cơ quan, tiểu bang, luật, thông tin thuế, việc làm của Hoa Kỳ, v.v. chứa rất nhiều thông tin. Từ đây, bạn có thể liên kết thông qua trang web của các trang web cụ thể và thậm chí cả chính quyền bộ lạc, truy cập vào tất cả các loại hồ sơ từ giấy khai sinh và khai tử cho đến thông tin pháp lý cũ. Đó là một nguồn thông tin mạnh mẽ cho những người nghiêm túc.
3. DuckDuckGo
DuckDuckGo tập trung nhiều vào quyền riêng tư và không theo dõi người dùng, đồng thời cho phép bạn tìm kiếm trên Surface Web. Tuy nhiên, DuckDuckGo cũng có một mặt ẩn đó là cho phép bạn tìm kiếm trên Deep Web. Khi bạn ghép nối DDG với phiên bản .onion, bạn có thể thực hiện tìm kiếm lớn hơn nhiều trên web bao gồm Deep Web. Lưu ý rằng điều này sẽ yêu cầu trình duyệt Tor .
4. Wayback Machine
Điều làm cho Wayback Machine thực sự đặc biệt là, không giống như các công cụ tìm kiếm như Google và Bing chỉ xem xét những gì có sẵn trên một trang web ngày nay, Wayback Machine cung cấp một cái nhìn về nội dung không còn nữa. Cung cấp hơn 100 terabyte dữ liệu hoặc 593 tỷ trang web, bạn có thể xem lịch sử của bất kỳ trang web công cộng nào.
5. notEvil
Tương tự như DuckDuckGo, notEvil yêu cầu trình duyệt Tor để truy cập, nhưng bạn có nhiều khả năng nhận được kết quả với hơn 32 triệu trang web có sẵn. Nhập url http://hss3uro2hsxfogfq.onion vào thanh địa chỉ và bạn có thể bắt đầu tìm kiếm trên deep web. Thuật toán được cho là được cập nhật thường xuyên và giao diện người dùng rất đơn giản, vì vậy nếu bạn đang tìm kiếm một điểm truy cập vào Deep Web, đây là một nơi tốt để bắt đầu.
6. Torch
Một trong những trang web sâu / tối lâu đời nhất, nổi tiếng công khai, Torch có sẵn bằng bất kỳ trình duyệt Tor nào (Tor Search = Torch). Hứa hẹn thời gian phản hồi ba giây là khá tốt đối với một trang web đã tồn tại trong lĩnh vực này. Giống như trường hợp của hầu hết các trang web trong danh sách này, Torch muốn cho bạn biết rằng nó sẽ không theo dõi hoặc kiểm duyệt bạn và tuyệt đối tôn trọng quyền riêng tư của bạn. Nhược điểm lớn nhất của Torch? Những mục quảng cáo.
7. Directory of Open Access Journals
Đã bao nhiêu lần bạn xem một tạp chí học thuật mà bạn muốn tiếp cận chỉ để nhận thấy rằng bạn cần đăng ký? Thư mục Tạp chí Truy cập Mở ở đây để trợ giúp. Nó có hơn 11.800 tạp chí trên 80 ngôn ngữ từ 126 quốc gia khác nhau. Các môn học bao gồm nông nghiệp, giáo dục, lịch sử, y học, luật, khoa học quân sự, khoa học công nghệ và hơn thế nữa.
8. Elephind
Nếu đã từng có lúc bạn muốn xem lại những tờ báo lịch sử tồn đọng trên thế giới, thì Elephind là dành cho bạn. Với hơn 3,8 triệu tờ báo trên 4.300 đầu sách khác nhau, có tổng cộng hơn 200 triệu tài liệu lưu trữ cho bạn tùy ý sử dụng. Khi nói đến loại hình nghiên cứu phù hợp, sinh viên, nhà gia phả học và hơn thế nữa sẽ thấy đây là địa điểm hoàn hảo.
9. WorldCat
Các trang web như WorldCat giúp đưa Deep Web xoay quanh việc lập chỉ mục cơ sở dữ liệu lên hàng đầu. Đi từ thư viện này sang thư viện khác để tìm một mặt hàng rất tốn thời gian, vì vậy hãy tin tưởng rằng WorldCat có thể thực hiện công việc cho bạn. Sách, DVD, CD, bài báo và hơn thế nữa đều có sẵn dưới dạng chủ đề của công cụ tìm kiếm. Nếu bạn muốn tạo một danh sách các mục cho tương lai, bạn có thể đăng ký tài khoản của riêng mình.
10. Spokeo
Spokeo là tất cả về bản chất lấy con người làm trung tâm của web sâu. Tuyên bố có quyền truy cập vào hơn 12 tỷ hồ sơ công khai, Spokeo là một nơi tuyệt vời để bắt đầu kiểm tra số điện thoại ngược lại. Nếu bạn muốn chuyển sang thứ gì đó ẩn hơn một chút, bạn có thể tìm kiếm địa chỉ email, hồ sơ tội phạm, hồ sơ trên mạng xã hội, địa chỉ hiện tại và trước đây, v.v. Spokeo hầu hết mọi người đều làm việc cho bạn – tất cả đều có số điện thoại gồm mười chữ số.
11. The Hidden Wiki
Khi bạn đang tìm kiếm tổng hợp các trang web .onion đang hoạt động, điểm dừng đầu tiên của bạn nên là The Hidden Wiki . Bạn sẽ cần Tor để xem địa chỉ .onion, nhưng đó là một nơi tuyệt vời để khám phá một số điểm giới thiệu tốt nhất về Invisible Web. Nhưng bất kỳ ai không quen thuộc với Dark Web nên hết sức cẩn thận.
Các câu hỏi thường gặp
1. Invisible Web có phải là thứ mà tôi nên học cách sử dụng không?
Thành thật mà nói, đó là một câu hỏi chỉ bạn có thể trả lời. Bạn muốn sử dụng Web ẩn để làm gì? Nếu đó là để tìm sách thư viện hoặc xem qua các tờ báo cũ, nó chắc chắn có lợi ích của nó. Tuy nhiên, việc sử dụng các trang web như Spokeo chỉ nên được thực hiện với mục đích tốt nhất.
2. Web Invisible có an toàn không?
Nếu bạn bắt đầu lội vào vùng nước của Dark Web, vấn đề không phải là an toàn mà là về tính hợp pháp. Nếu bạn ở trong lãnh thổ của Deep Web, bạn có thể làm rất nhiều điều mà vấn đề an toàn trực tuyến không phải là mối quan tâm lớn. Hiểu cách sử dụng Tor là một trong những cách tốt nhất để làm quen với Deep Web và những gì bạn thực sự có thể làm.
3. Tôi có thể gặp rắc rối khi sử dụng Deep Web không?
Nếu bạn đang sử dụng các trang web như Spokeo để tra cứu đồng nghiệp hoặc hàng xóm, thì có, đó có thể không phải là hoạt động mà bạn muốn tham gia. Nếu bạn đang sử dụng nó để xem kho thư viện, báo cũ hoặc để tìm các tạp chí học thuật thì hoàn toàn tốt.
Kết thúc
Vào cuối ngày, việc tìm kiếm trên Deep Web nên được thực hiện một cách thận trọng. Một số công cụ tìm kiếm web sâu ở đây hoàn toàn có thể khám phá, nhưng một khi bạn vào thế giới Tor , tính năng bảo vệ trực tuyến của bạn sẽ được nâng cao. Rất dễ dàng để nhấp vào một cái gì đó và đi xuống một lỗ hổng trên Internet mà bạn có thể không muốn ghé thăm. Nếu bạn lo lắng về những tìm kiếm bạn đã thực hiện trên Google, hãy tìm hiểu cách xóa lịch sử tìm kiếm trên Google của bạn