banner

[Rule] Rules  [Home] Main Forum  [Portal] Portal  
[Members] Member Listing  [Statistics] Statistics  [Search] Search  [Reading Room] Reading Room 
[Register] Register  
[Login] Loginhttp  | https  ]
 
Forum Index Thông tin new bugs và exploits HVA News - Deep Web ( Web Ẩn ) là gì  XML
  [News]   HVA News - Deep Web ( Web Ẩn ) là gì 05/06/2012 13:15:42 (+0700) | #1 | 264692
[Avatar]
xnohat
Moderator

Joined: 30/01/2005 13:59:19
Messages: 1210
Location: /dev/null
Offline
[Profile] [PM] [Email] [WWW] [Yahoo!] [MSN]
HVA News - Deep Web ( Web Ẩn ) là gì




Deep Web ( tạm dịch là Web Ẩn ) là các nguồn dữ liệu, thông tin dạng Web trên internet nhưng không thể tìm thấy trên các máy tìm kiếm thông thường hiện nay như Google, Bing…

Có rất nhiều nghiên cứu cho thấy, các máy tìm kiếm hiện nay chỉ lập được chỉ mục ( indexing ) cho một phần rất nhỏ của tất cả các nội dung web hiện có trên internet, còn một phần rất lớn của internet hoàn toàn không được biết đến bởi hầu hết người dùng internet.

Bạn sẽ nghĩ gì nếu bạn được cho biết rằng ngầm bên dưới của internet là cả một thế giới nội dung rộng lớn gấp nhiều lần hơn thế giới World Wide Web mà chúng ta có thể tiếp cận hiện nay ? Chúng tôi cho rằng bạn sẽ cảm thấy thực sự sốc. Các chuyên gia ước tính rằng các Web Ẩn mà các máy tìm kiếm hiện nay không thể chạm tới, chứa lượng nội dung nhiều gấp 500 lần so với World Wide Web.

Để có thể giải thích đơn giản và dễ hiểu hơn về khái niệm Web Ẩn, chuyên gia về Web Ẩn Mike Bergman, sáng lập viên của công ty BrightPlanet đã đưa ra một hình ảnh so sánh. Các dữ liệu có thể truy cập được của internet hiện nay thông qua cách tìm kiếm trên các máy tìm kiếm (Google, Bing…) giống như bề mặt của đại dương ( xem hình minh họa đầu bài ), rất nhiều thứ có giá trị có thể được tìm thấy trên bề mặt của đại dương internet, thế nhưng những mỏ dữ liệu, thông tin có kích thước lớn hơn nhiều, giá trị hơn nhiều lại nằm sâu, thậm chí rất sâu dưới bề mặt yên ả của internet, các dữ liệu này thường bị bỏ lỡ bởi các máy tìm kiếm không thể với tới chúng.

Thông thường các máy tìm kiếm sẽ lục lọi trên internet để thu thập các dữ liệu bằng một dạng phần mềm gọi là “Crawler” ( chương trình thu thập thông tin ). Công nghệ này hoàn toàn không hiệu quả trong việc lục tìm các nguồn dữ liệu ẩn trên internet ( Web Ẩn ), chúng ta có thể phân các dạng Web Ẩn thành các loại sau:
  • Dữ liệu web động: các trang web động có nội dung được sinh ra dựa vào các yêu cầu truy vấn nội dung đặc biệt hoặc truy cập thông qua các biểu mẫu truy vấn nội dụng ( ví dụ các biểu mẫu ở mục tìm kiếm của hva )
  • Các nội dung không được tạo liên kết hyperlink: các trang nội dung web không được liên kết tới từ bất kỳ trang web nào và bản thân nó cũng không có liên kết tham chiếu nào đến trang web khác. Giống như việc bạn đưa lên internet một tờ giấy A4 chỉ chứa nội dung mà không hề có một cái link nào hết cả vậy ( chú giải của người dịch )
  • Các trang web phải xác thực truy cập: các trang web yêu cầu muốn truy cập nội dung của nó thì thực hiện việc đăng ký và đăng nhập
  • Các trang web có nội dung thay đổi theo ngữ cảnh: các trang web này hiển thị nội dung thay đổi tùy thuộc vào một số điều kiện tác động, ví dụ như người dùng từ các dải IP của châu Á truy cập vào thì sẽ được xem nội dung phù hợp cho khu vực châu Á.
  • Các nội dung web bị giới hạn truy cập: một số trang web giới hạn việc truy cập tới các nội dung của nó bằng một số phương pháp kỹ thuật như file Robots.txt, CAPTCHAs hoặc tham số HTTP headers để ngăn cấm các máy tìm kiếm truy cập nội dung cua nó, cũng như tạo phiên bản cache nội dụng.
  • Nội dung sinh từ script hoặc Flash, Ajax: một số trang web chỉ có thể truy cập thông qua một liên kết được sinh ra bởi một đoạn mã JavaScript ( mà hva là một ví dụ trực tiếp ), hoặc nội dung được nhúng bên trong Flash hoặc chỉ có thể được tải về thông qua Ajax.
  • Nội dung phi HTML hoặc text: tức là các nội dung là text ( văn bản ) nhưng được hiển thị bên trong một tấm hình, video hoặc một số định dạng file mà các máy tìm kiếm không thể đọc được.
  • Nội dung văn bản chỉ có thể truy cập thông qua giao thức Gopher hoặc các file được lưu trữ trên các máy chủ FTP thì không được lập chỉ mục bởi hầu hết các máy tìm kiếm hiện nay: các máy tìm kiếm thông dụng như Google mặc nhiên không lập chỉ mục cho các trang không dùng giao thức HTTP hoặc HTTPS

Thế giới Web Ẩn song song này còn rộng lớn hơn nữa với rất nhiều nguồn thông tin, dữ liệu đa dạng thuộc các hệ thống mạng ( có đấu nối với internet ) của các doanh nghiệp, các chính phủ và cả của các tổ chức tội phạm mạng ( như các nguồn dữ liệu bị đánh cắp và công bố bởi Anonymous, LulzSec… ).

Trong trí tưởng tượng của nhiều người, khái niệm Web Ẩn thường đi kèm với ý tưởng về các nguồn dữ liệu bị đánh cắp, các nguồn dữ liệu bí mật thuộc các hệ thống bí ẩn không thể truy cập được. Dĩ nhiên, điều này thực sự chỉ là một sự hiểu biết sai lầm về Web Ẩn, các nội dung này vẫn có thể truy cập được theo một cách nào đó và trong một giới hạn nào đó, tuy nhiên ta sẽ chắc chắn rất khó để tìm thấy chúng bằng cách lục lọi trên một máy tìm kiếm phổ thông nào đó. Web Ẩn chính là giới hạn kỹ thuật mà các máy tìm kiếm hiện nay đang cố vượt qua.

Theo TheHackerNews

xnohat – HVA News


Tham khảo:

[1] http://thehackernews.com/2012/05/what-is-deep-web-first-trip-into-abyss.html
iJust clear, "What I need to do and how to do it"/i
br
brBox tán gẫu dời về: http://www.facebook.com/hvaonline
[Up] [Print Copy]
  [News]   HVA News - Deep Web ( Web Ẩn ) là gì 07/06/2012 06:35:47 (+0700) | #2 | 264785
idid231
Member

[Minus]    0    [Plus]
Joined: 03/06/2011 09:36:19
Messages: 32
Offline
[Profile] [PM]
Vậy đối tượng hướng tới của Web Ẩn chỉ là những kẻ siêu tin học? Bởi có giỏi thì mới tìm thấy dạng web như vậy.
Mà em cũng chưa hiểu loại web này phục vụ mục đích gì. Người quản trị thường muốn tăng rank cho site của mình, đằng này lại muốn Ẩn đi, chắc chỉ toàn mục đích đen tối.
Các trang dạng "phải xác thực truy cập" không rõ là tiếp thị bằng cách nào để đem về nguồn thu nhỉ? Bởi em thấy porn thì nhiều trang bị crack acc lắm, bảo mật không cao thì khách chạy hết mất.
[Up] [Print Copy]
  [News]   HVA News - Deep Web ( Web Ẩn ) là gì 07/06/2012 08:48:20 (+0700) | #3 | 264792
cr4zyb0y
Member

[Minus]    0    [Plus]
Joined: 27/05/2010 11:50:30
Messages: 51
Offline
[Profile] [PM]

idid231 wrote:
Vậy đối tượng hướng tới của Web Ẩn chỉ là những kẻ siêu tin học? Bởi có giỏi thì mới tìm thấy dạng web như vậy.
Mà em cũng chưa hiểu loại web này phục vụ mục đích gì. Người quản trị thường muốn tăng rank cho site của mình, đằng này lại muốn Ẩn đi, chắc chỉ toàn mục đích đen tối.
Các trang dạng "phải xác thực truy cập" không rõ là tiếp thị bằng cách nào để đem về nguồn thu nhỉ? Bởi em thấy porn thì nhiều trang bị crack acc lắm, bảo mật không cao thì khách chạy hết mất. 


Mục tiêu của Web Ẩn* là Ẩn, còn về đối tượng thì không có giới hạn. Ai có nhu cầu thì sử dụng thôi.

Không cần giỏi mới tìm thấy, chỉ cần biết thì vào thôi.

Vì là ẩn danh trên mạng này, nên các website trong mạng ẩn này hầu hết là phục vụ các dịch vụ như bán hacked credit card, các thể loại giải trí khiêu dâm, các dịch vụ hack thuê, còn có cả dịch vụ viết paper, tìm tài liệu thuê nữa smilie.

* mình chỉ nói phần web ẩn hướng tới tính ẩn danh của người dùng, phần lớn còn lại là các web nội bộ của doanh nghiệp, chính phủ, tổ chức ... thì không vào được nên không đề cập ở đây.
[Up] [Print Copy]
  [News]   HVA News - Deep Web ( Web Ẩn ) là gì 07/06/2012 10:28:36 (+0700) | #4 | 264797
[Avatar]
TheShinichi
Member

[Minus]    0    [Plus]
Joined: 25/03/2005 01:40:31
Messages: 182
Offline
[Profile] [PM]
Web Ẩn thì tớ cũng có vài cái smilie

Ví dụ như 1 cái blog nền WordPress tớ tạo để ghi chú các kiến thức để tham khảo này. Chẳng có bất kỳ liên kết nào đến nó, và nó cũng chẳng liên kết với ai cả. Chỉ có tớ mới biết đường vào, vậy tớ là "siêu tin học" nhỉ ? smilie

Và vô số những thứ khác ẩn, đôi khi chúng ta có trong tay mà không biết là nó ẩn smilie
[Up] [Print Copy]
  [News]   HVA News - Deep Web ( Web Ẩn ) là gì 07/06/2012 14:02:50 (+0700) | #5 | 264814
idid231
Member

[Minus]    0    [Plus]
Joined: 03/06/2011 09:36:19
Messages: 32
Offline
[Profile] [PM]
À ý em là những trang web nhiều người truy cập, có thể tạm gọi "nổi tiếng trong UG", chợ đen có phải Web Ẩn không nhỉ? Em cũng chưa tìm hiểu rõ chợ đen hoạt động như thế nào smilie
Còn như trang wordpress dạng nhật ký như của bác thì useless với người ngoài, k tính smilie Nhưng nếu chợ đen là 1 dạng Web ẩn thì khi có nhu cầu ngta sẽ tự biết tìm ra nó, không cần "siêu tin học" smilie
[Up] [Print Copy]
[digg] [delicious] [google] [yahoo] [technorati] [reddit] [stumbleupon]
Go to: 
 Users currently in here 
1 Anonymous

Powered by JForum - Extended by HVAOnline
 hvaonline.net  |  hvaforum.net  |  hvazone.net  |  hvanews.net  |  vnhacker.org
1999 - 2013 © v2012|0504|218|