näkymätön verkko on se osa World Wide Webiä, joka ei ole hakukoneiden indeksoitavissa ja on siksi näkymätön. Toisin kuin Surface Web, näkymätön Web koostuu tiedoista ja tiedoista, joita ei voi etsiä hakukoneilla eri syistä. Käyttäjät eivät voi käyttää näitä tietoja käyttämällä perinteisiä hakukoneita. Indeksoimattomat verkkosivustot, sovellukset ja resurssit sisältävät suojattuja tietoja sähköpostin, verkkopankkien, erikoistuneiden tietokantojen ja muiden maksullisten palvelujen aloilla, esimerkiksi paywallin kautta. Lisäksi on linkittämättömiä ja salasanasuojattuja verkkosivustoja sekä mediatyyppejä ja arkistoja, joita ei voi ryömiä nykyisellä hakukonetekniikalla.
Yleistiedot
World Wide Webin eri nimet sekoitetaan usein keskenään. Termeihin, kuten Dark Web, Deep Web, Invisible / Visible Web tai niin sanottu Darknet, sovelletaan epäselviä rajauksia ja määritelmiä. Tärkein empiirinen tutkimus aiheesta on vuodelta 2001, ja se on todennäköisesti vanhentunut nyt. Vaikka siellä tutkittiin Internetin eri tyyppien kokoa, samana vuonna tehdyssä jatkotutkimuksessa luotiin myös määritelmiä, jotka on selitetty artikkelissa Deep Web. Näkymättömästä verkosta puhuminen on järkevää vain, jos mainitaan myös käytetty hakukone. Koska hakukoneet tekevät resursseja näkyväksi myös näkymättömässä verkossa ja kaikki, mitä hakukoneet eivät ole vielä indeksoineet, on periaatteessa näkymätöntä useimmille Internetin käyttäjille.
miten se toimii
näkymätöntä verkkoa voidaan pitää internetin alueena, jota ei joko ole (vielä) indeksoitu tai johon on kohdistettu erilaisia pääsyrajoituksia. Tässä yhteydessä käytetään usein vertauskuvaa merestä. Poikkileikkauksessa World Wide Webin muodostava tieto voidaan esittää valtameren eri syvyyksinä ja kerroksina. Googlen kaltainen hakukone olisi silloin matalissa vesissä kalastava kalastusvene. On kuitenkin paljon muutakin tietoa, joka on kalastusveneelle tavoittamatonta, koska verkot eivät ulotu niin kauas. Näin ollen seuraavat termit ovat yleisiä IT-asiantuntijoiden keskuudessa:
- Surface Web: tietoresurssit linkitetään hyperlinkeillä. Hakukoneet voivat indeksoida nämä tiedot. Suurin osa käyttäjistä tuntee tällaisen verkon internetinä, jota he käyttävät esimerkiksi hakuun.
- Shallow Web: Shallow Web on monen sivun tietotekninen Tausta. Näitä ovat tietokannat, palvelimet ja ohjelmointiohjeet, jotka tallennetaan tietokantoihin. Esimerkiksi sivustot syntyvät suoraan näistä tietokannoista, kun käyttäjät pääsevät niihin käsiksi. Tällaisia ovat erityisesti Skriptatut ja dynaamiset verkkosivut, jotka on linkitetty hyperlinkkiin ja luotu PHP: llä ja muilla ohjelmointikielillä. Linkit houkuttelevat hakukoneita näille verkkosivustoille, mutta ne yleensä indeksoivat vain näiden verkkosivustojen staattiset versiot.
- Deep Web tai Hidden Web: nämä tiedot ja resurssit ovat yleensä piilossa, eikä niihin ole linkkejä. Näiden tietojen etsimiseen tarvitaan erityisiä hakukoneita ja teknologioita. Tor-selain on esimerkki tällaisesta tekniikasta. Deep Web-hakemistot toimivat erityisinä hakukoneina, joilla tietoa voidaan käyttää, ellei siihen sovelleta muita pääsyrajoituksia (kuten salasanoja, salausta, palomuureja).
edellä mainitussa terminologiassa näkymätön verkko on yhdistelmä matalaa ja syvää verkkoa. Näkymättömän verkon sisällön ja tiedon saavuttamiseksi tarvitaan joko yksittäisiä kyselyitä, jotka perustuvat käytettäviin ohjelmointikieliin tai erityisiä hakukoneita, jotka tarjoavat indeksin. Koska monet aihepiirin tietokannat ja palvelinresurssit on järjestetty temaattisesti ja kirjoitettu tietyllä ohjelmointikielellä, näiden tietojen haku on lähes mahdotonta yleisille hakukoneille, kuten Googlelle, Yahoolle tai Bingille. Tässä mielessä siellä oleva sisältö on näkymätöntä, mutta periaatteessa saavutettavissa vertikaalisten hakukoneiden, erityisteknologioiden ja oikeiden ohjelmointiohjeiden avulla.
Examples
Some examples of the Invisible Web:
- tietokannat, joista verkkosivustot luodaan (dynaamiset verkkosivustot).
- akateemiset käyttötarkoitustietokannat, jotka edellyttävät rekisteröintiä.
- linkittämättömät ja Salasanasuojatut verkkosivut.
- Liityntärajoitetut verkot, jotka vaativat erityistä teknologiaa.
relevanssi verkkomarkkinoinnille
vaikka akateemisten verkostojen (.edu-linkit) ja hallituksen verkkosivujen linkit ovat varsin suosittuja verkkomarkkinoinnissa, näkymättömän verkon sisällön kanssa on syytä olla varovainen. Jokainen resurssi olisi arvioitava erikseen ja verkkosivuston linkkiprofiili olisi tarkistettava säännöllisesti. Synkän verkon tapaan tietyt linkit saattavat näyttää Googlelle ikään kuin ne olisivat huonoa seutua. Linkitetyillä sivustoilla ei ole hakukoneiden luottamusta, joten tällaiset linkit voivat vaikuttaa negatiivisesti linkitettyyn resurssiin.
ensimmäinen linkki verkkosivulle on kuitenkin osoitus perinteisten hakukoneiden luottamuksesta. Tämän linkin kautta he saavat usein tietoa uudesta resurssista. On myös hyvä tarkistaa, onko markkinoitavalla verkkosivustolla pääsy tavanomaisille hakukoneille. Esimerkiksi htaccess-tiedosto, metatunnisteet ja robotit.txt: tä tulisi tutkia, myöntävätkö ne hakukoneille pääsyn vai onko sisältö piilossa vai näkymättömissä. Crawlability ja indeksoitavuus ovat keskeisiä edellytyksiä menestys Internetissä, jos online markkinointi on tehtävä verkkosivuilla.
- White Paper: the Deep Web: Surfacing Hidden Value quod.lib.umich.edu. Retrieved on October 24, 2016
- The Invisible Web: discovering Sources Search Engines Can ’ t See ideals.illinois.edu. Retrieved on October 24, 2016
- the Ultimate Guide to the Invisible Web oedb.org. haettu lokakuussa 24, 2016
Weblinks
- yleiskatsaus vertikaalisista hakukoneista näkymättömän verkon tutkimiseen