Internet Archive Wayback Machine ePortal.rs

Internet Archive Wayback Machine – znate li šta je to?

Internet Archive Wayback Machine, poznat i kao samo Wayback Machine, predstavlja jedinstvenu digitalnu biblioteku koja čuva istoriju svetske mreže. Kao vremenska kapsula internet prostora, ova platforma omogućava pristup arhiviranim verzijama veb stranica kroz godine.

Bez obzira na to da li su stranice uklonjene, promenjene ili nedostupne, Wayback Machine pruža mogućnost da se istraže prošli trenuci digitalnog sveta. U ovom članku istražujemo osnove i značaj ove izuzetne platforme, kao i načine na koje Wayback Machine utiče na naše razumevanje, pristup i očuvanje digitalne baštine.

Šta je Internet Archive Wayback Machine?

Internet Archive Wayback Machine je digitalna arhiva informacija na internetu. Osnovao ju je neprofitna organizacija Internet Arhiv sa sedištem u San Francisku 2001. godine. Korisnici mogu pristupiti arhiviranim verzijama veb stranica putem Wayback Machine-a. Wayback Machine sadrži više od 832 milijarde arhiviranih veb stranica, koje datiraju još od 1996. godine.

Pored veb stranica, Internet Arhiv čuva i knjige, filmove, televizijske emisije, muziku i druge sadržaje. Internet Arhiv zauzima više od 40 petabajta prostora za skladištenje podataka, a Wayback Machine zauzima značajan deo tog prostora.

Zašto je Wayback Machine važan?

Internet Arhiv bio je jedna od prvih organizacija koja je arhivirala internet. Stoga, Wayback Machine predstavlja jedinstveni zapis ranijih dana interneta, pre nego što su ga većina organizacija počela arhivirati.

Internet neprekidno raste i menja se, a veb stranice mogu biti obrisane ili izmenjene u bilo kom trenutku, ne ostavljajući iza sebe nikakav trag. Internet Archive Wayback Machine čuva istoriju interneta čak i nakon što su te stranice izmenjene ili obrisane.

Kako radi Internet Archive Wayback Machine?

Internet Archive Wayback Machine automatski pretražuje i snima trenutne prikaze veb stranica u različitim trenucima. Ovi prikazi se zatim čuvaju, povezani sa vremenskim oznakama i omogućavaju korisnicima pristup.

Internet Archive Wayback Machine koristi nekoliko različitih web pretraživača – neke iz izvora trećih strana, a neke iz Internet Arhiva. Korisnici takođe mogu podneti zahtev za ručnu arhivaciju stranice.

Veb sajtovi se obično grade koristeći kombinaciju datoteka, poput datoteka sa slikama, Hipertekst Markup Language (HTML), JavaScript-a i kaskadnih stilskih listova. Svaka datoteka ima svoj URL, koji Wayback Machine snima kako bi prikazao punu stranicu onako kako izgleda korisniku. Na primer, slike na veb stranici imaju svoje odvojene URL-ove od glavne stranice. URL-ovi datoteka mogu biti snimljeni u različitim trenucima u odnosu na URL stranice sama. Na primer, slika može biti pretražena i zabeležena danima nakon što je osnovni HTML stranice pretražen.

Da bi pretraživali sa početne stranice Wayback Machine-a, korisnici unose URL veb sajta u pretraživač i raspon datuma za sadržaj koji žele da pristupe.

Stranica sa rezultatima pretrage Wayback Machine-a prikazuje grafikon koji pokazuje broj puta kada je veb stranica pretražena od 1996. godine i kalendar koji lista pretraživanja po danima. Korisnici mogu da pređu mišem preko svakog pretraživanja kako bi videli datum, vreme i razlog za svako.

Wayback Machine ima nekoliko različitih funkcija za prikaz podataka veb stranica, uključujući sledeće:

  • Stranica sa kolekcijama. Ovo omogućava korisnicima da vide zašto je stranica pretražena.
  • Stranica promena. Ovo pokazuje koliko se stranica promenila tokom vremena.
  • Funkcija poređenja. Ovo omogućava korisnicima da uporede dva različita snimka iz dva različita vremena jedan pored drugog.
  • Funkcija rezimea. Ovo prikazuje informacije o celom domenu.
  • Sitemap funkcija. Ovo prikazuje informacije o strukturi povezivanja sajta tokom vremena.
  • Korisnici mogu da kliknu na određeni snimak i vide poreklo stranice. Takođe mogu da sačuvaju stranice u svoj lični veb arhiv u svom nalogu.

Pored pretrage po URL-u, korisnici mogu pretraživati po ključnoj reči. Pretraga ključnih reči na Wayback Machine-u razlikuje se od pretrage ključnih reči na Google-u ili sličnim pretraživačima. Pretraga ključnih reči na Wayback Machine-u traži ceo domen o određenoj ključnoj reči, a ne pojedinačne stranice.

Funkcija Sačuvaj stranicu sada čuva samo jedan URL unet u pretraživač. Takođe postoje i proširenja za Chrome Wayback Machine-a, dodaci za veb pretraživače, WordPress dodatak i iOS aplikacija.

Internet Archive Wayback Machine
Internet Archive Wayback Machine Logo

Kako se koristi ova mašina?

Evo nekoliko osnovnih načina korišćenja Wayback Machine-a:

  • Pregled i poređenje promena između dve verzije veb stranice.
  • Pregled zašto ili kada je stranica pretražena.
  • Pregled ko pretražuje koje veb stranice.
  • Pregled starih verzija veb stranica.
  • Pregled veb stranica koje više ne postoje.
  • Rešavanje problema sa veb stranicom.
  • Ručno čuvanje stranica na Wayback Machine-u.
  • Linkovanje ka starim veb stranicama.
  • Sprovođenje velikih pretraga.

Ove osnovne funkcije imaju mnoge primene, uključujući optimizaciju pretrage na internetu (SEO), razvoj veb stranica, novinarstvo, prikupljanje obaveštajnih podataka iz otvorenih izvora (OSINT) i pravno istraživanje. Na primer, korisnici motivisani SEO-om mogu pronaći stare verzije veb sajtova koji nikada nisu preusmereni na žive verzije i popraviti slomljene linkove. Takođe mogu ponovo posetiti stare verzije stranica koje su bolje radile kako bi videli da li postoje elementi vredni ponovnog uključivanja u novi sadržaj.

Korisnici takođe mogu pogledati Wayback Machine kako bi videli koliko često konkurenti ažuriraju sadržaj. Pravni istraživači mogu koristiti alat za prikupljanje dokaza za pravni slučaj. Web developeri mogu koristiti alat za rešavanje problema ili debagovanje veb stranica pristupom prošlim verzijama veb stranica kako bi videli kada je određeni bag uveden tokom vremena. Novinari mogu koristiti uslugu za pristup istorijskim dokumentima ili za proveru činjenica. Bezbednosni istraživači mogu tražiti OSINT sakriven u starijim verzijama veb stranica ili obrisanim informacijama. I arhivisti na Vikipediji mogu koristiti Wayback Machine kako bi pomogli u smanjenju propadanja linkova.

Aplikacioni programski interfejs (API) Wayback Machine-a omogućava korisnicima automatizaciju funkcija povlačenja podataka u velikim razmerama. API-ji mogu čitati i pisati metapodatke iz i u stavke u Internet Arhivu. Takođe mogu pisati i čitati medijske ili druge datoteke iz i u stavke. Wayback Machine ima nekoliko API-ja, uključujući sledeće:

  • Wayback Availability JSON. Ovo testira da li je URL arhiviran i dostupan u Wayback Machine-u.
  • Memento. Ovo pruža dodatne interfejse za upite snimaka u Wayback Machine-u.
  • Wayback CDX Server. Ovo omogućava složeno filtriranje, upite i analizu podataka o snimcima Wayback Machine-a.
  • Usluga pretplate Internet Arhiva – Archive-It – omogućava organizacijama arhiviranje veb sajtova i kreiranje prilagođenih kolekcija sadržaja.

Istorija Wayback Machine-a

Internet Archive Wayback Machine je osnovan 1996. godine kako bi arhivirao internet u njegovim počecima i ostvario cilj pružanja univerzalnog pristupa svim znanjima. Internet Arhiv je neprofitna organizacija osnovana od strane Brewster Kahle-a i Bruce-a Gilliat-a. Wayback Machine je počeo indeksirati veb stranice 1996. godine i formalno je pušten u javnost 2001. godine, u kojem je već sadržao preko 10 milijardi arhiviranih stranica. Kahle je osnovao kompaniju za profitiranje web pretraživanja Alexa Internet, koja danas ostaje jedan od najistaknutijih web pretraživača Internet Arhiva.

Internet Arhiv sada su domaćini nekoliko drugih projekata, uključujući arhiv slika Nacionalne aeronautičke i svemirske administracije i veb stranicu sa informacijama o knjigama Open Library. Internet Arhiv takođe sarađuje sa mnogim institucijama kako bi održao ove biblioteke, uključujući Kongresnu biblioteku i Smithsonijev institut.

Naziv Wayback Machine je referenca na animirani crtani film “Avanture Rockyja i Bullwinkla i prijatelja”. U njemu, likovi su koristili mašinu WABAC – izgovarajući wayback – kako bi putovali kroz vreme i učestvovali u raznim istorijskim događajima.

Koja su ograničenja ove platforme?

Nisu sve veb stranice arhivirane u Wayback Machine-u. Neki sajtovi blokiraju web pretraživače Wayback Machine-a. Drugi možda nisu arhivirani iz različitih razloga, poput zahteva specifičnih vlasnika sajtova za anonimnost ili stranice koje zahtevaju lozinku za pristup. Ponekad, robotski.txt fajl sajta sprečava da sajt bude pretražen. Robotski.txt fajlovi usmeravaju web pretraživače i pokazuju koje sajtove mogu, a koje ne mogu posetiti. Stranice bez ulaznih veza sa drugih veb sajtova teže je arhivirati. U nekim slučajevima, JavaScript može biti teško arhivirati. HTML je najlakši tip sadržaja za arhiviranje u Wayback Machine-u.

Dodatno, učestalost snimaka može varirati, pa nije svaka promena na veb sajtu zabeležena. Ponekad može proći i nekoliko meseci pre nego što se stranica pojavi u Wayback Machine-u nakon što je prikupljena.

Uopšteno govoreći, Wayback Machine ne prikuplja ili arhivira lične e-mejlove ili četove iz privatnih izvora. Takođe ne prikuplja dobro dinamične informacije. Na primer, korisnik ne bi mogao pristupiti Google pretraživaču iz 2010. godine i koristiti ga za pretragu drugih veb sajtova.