Il Web invisibile è la parte del World Wide Web, che non è indicizzabile dai motori di ricerca ed è quindi invisibile. A differenza del Web di superficie, il Web invisibile è costituito da dati e informazioni che non possono essere cercati con i motori di ricerca per vari motivi. Gli utenti non possono accedere a queste informazioni utilizzando i motori di ricerca tradizionali. I siti Web, le app e le risorse non indicizzati includono informazioni protette nelle aree di e-mail, online banking, database specializzati e altri servizi a pagamento, ad esempio tramite un paywall. Inoltre, ci sono siti Web non collegati e protetti da password, nonché tipi di media e archivi che non possono essere scansionati con l’attuale tecnologia dei motori di ricerca.
Informazioni generali
I diversi nomi per il World Wide Web sono spesso confusi. Termini come Dark Web, Deep Web, Invisible / Visible Web o la cosiddetta Darknet sono soggetti a delimitazioni e definizioni poco chiare. Lo studio empirico più importante su questo argomento risale al 2001 ed è probabilmente obsoleto ora. Sebbene la dimensione dei vari tipi di Internet sia stata esaminata lì, le definizioni sono state create anche in un ulteriore studio dello stesso anno che sono spiegate nell’articolo Deep Web. Parlare di un Web invisibile ha senso solo se viene menzionato anche il motore di ricerca utilizzato. Perché i motori di ricerca rendono le risorse visibili anche nel Web invisibile e tutto ciò che non è stato ancora indicizzato dai motori di ricerca è, in linea di principio, invisibile alla maggior parte degli utenti di Internet.
Come funziona
Il Web invisibile può essere visto come un’area di Internet che non è stata (ancora) indicizzata o è stata sottoposta a varie restrizioni di accesso. Una metafora che viene spesso utilizzata in questo contesto è quella dell’oceano. In una sezione trasversale, le informazioni che compongono il World Wide Web possono essere rappresentate come le varie profondità e strati dell’oceano. Un motore di ricerca come Google sarebbe quindi una barca da pesca pesca nelle acque poco profonde. Tuttavia, ci sono molte altre informazioni che sono irraggiungibili per la barca da pesca, perché le reti non arrivano fino a quel punto. Di conseguenza, i seguenti termini sono comuni tra gli esperti IT:
- Surface Web: Le risorse informative sono collegate da collegamenti ipertestuali. I motori di ricerca possono eseguire la scansione e indicizzare queste informazioni. La maggior parte degli utenti conosce questo tipo di web come Internet, che usano ad esempio in una ricerca.
- Shallow Web: Il Web superficiale è lo sfondo della tecnologia dell’informazione di molte pagine. Questo include database, server e istruzioni di programmazione, che sono memorizzati nei database. Ad esempio, i siti web vengono generati direttamente da questi database quando vi si accede dagli utenti. Ciò include, in particolare, siti Web script e dinamici che sono collegati a collegamenti ipertestuali e creati utilizzando PHP e altri linguaggi di programmazione. I link attirano i motori di ricerca a questi siti web, ma di solito indicizzano solo le versioni statiche di questi siti web.
- Deep Web o Hidden Web: queste informazioni e risorse sono solitamente nascoste e non ci sono collegamenti ad esso. Per cercare queste informazioni, sono necessari motori di ricerca e tecnologie specifici per ottenere l’accesso. Il browser Tor è un esempio di tale tecnologia. Le directory Deep Web agiscono come motori di ricerca specifici che possono essere utilizzati per accedere alle informazioni, a meno che non siano soggette ad altre restrizioni di accesso (come password, crittografia, firewall).
Nella terminologia di cui sopra, il Web invisibile è una combinazione del Web superficiale e del Web profondo. Per ottenere il contenuto e le informazioni del Web invisibile, sono necessarie query individuali basate sui linguaggi di programmazione utilizzati o sui motori di ricerca specifici che forniscono un indice. Poiché una varietà di database soggetti e risorse server sono tematicamente organizzati e scritti in un particolare linguaggio di programmazione, una ricerca di queste informazioni è quasi impossibile per i motori di ricerca generali come Google, Yahoo o Bing. In questo senso, il contenuto è invisibile, ma in linea di principio può essere raggiunto utilizzando motori di ricerca verticali, tecnologie specifiche e le istruzioni di programmazione corrette.
Esempi
Alcuni esempi del Web invisibile:
- Database da cui vengono generati i siti web (siti web dinamici).
- Database scopo accademico che richiedono la registrazione.
- Siti web non collegati e protetti da password.
- Reti con accesso limitato che richiedono tecnologie specifiche.
Rilevanza per il marketing online
Mentre i collegamenti da reti accademiche (link.edu) e siti Web governativi sono molto popolari nel marketing online, si consiglia cautela con i contenuti dal Web invisibile. Ogni risorsa dovrebbe essere valutata individualmente e il profilo di collegamento di un sito web dovrebbe essere regolarmente rivisto. Simile al Dark Web, alcuni link possono apparire a Google come se fossero un cattivo quartiere. I siti collegati non hanno la fiducia dei motori di ricerca e di conseguenza, tali collegamenti possono avere un impatto negativo sulla risorsa collegata.
Tuttavia, un primo collegamento a un sito web è una prova di fiducia per i motori di ricerca tradizionali. Attraverso questo collegamento, spesso acquisiscono conoscenza di una nuova risorsa. Si consiglia inoltre di verificare se il sito web da commercializzare è accessibile per i motori di ricerca convenzionali. Ad esempio, il file htaccess, i meta tag e i robot.txt dovrebbe essere esaminato se concedono l’accesso ai motori di ricerca o se il contenuto è nascosto o invisibile. Crawlability e indicizzazione sono prerequisiti centrali per il successo su Internet se il marketing online deve essere fatto per un sito web.
- libro Bianco: Il Deep Web: Affioramento Valore Nascosto quod.lib.umich.edu. Url consultato il 24 ottobre 2016
- Il Web Invisibile: Scoprire Fonti Motori di Ricerca non Possono Vedere ideals.illinois.edu. Url consultato il 24 ottobre 2016
- La Guida Definitiva per il Web Invisibile oedb.org. Url consultato in data 24, 2016
Links
- Panoramica Verticale Motori di Ricerca per Esplorare il Web Invisibile