Čo je stroj Wayback a prečo je užitočný?
Internet Webové Stránky Hrdina / / April 22, 2021
Posledná aktualizácia dňa
Stroj Wayback je najobľúbenejšou časťou Webové stránky internetového archívu. Bezplatný online nástroj, ktorý bol prvýkrát predstavený v roku 2001, vám umožní „vrátiť sa v čase“ a pozrieť sa, ako vyzerali webové stránky na celom svete v danom okamihu. Funkcia Wayback Machine obsahuje 562 miliárd v čase písania tohto článku, pričom každý rok pribúdajú ďalšie.
Tu je pohľad na Wayback Machine a na to, čo ho robí špeciálnym.
Úvod do internetového archívu
Internetový archív, ktorý vytvorili Brewster Kahle a Bruce Gilliat, je nezisková organizácia so stanoveným poslaním „univerzálny prístup ku všetkým vedomostiam“. Od začiatku, organizácia poskytla bezplatný prístup verejnosti k digitalizovaným materiálom, ako sú webové stránky, knihy, zvukové nahrávky vrátane živých koncertov, videí, obrázkov a softvéru programov.
K dnešnému dňu všetko, čo zhromaždil internetový archív, zaberá viac ako 70 Petabajty serverového priestoru, vrátane dvoch kópií všetkého. Organizácia je financovaná z darov, grantov a poplatkov za služby digitalizácie kníh. Z dôvodu ochrany súkromia Internetový archív nesleduje adresy IP svojich čitateľov a v celom rozsahu používa protokol HTTPS.
Stroj Wayback
Iba jedna časť internetového archívu, Wayback Machine, bola navrhnutá na zachytenie zmeneného alebo odstráneného obsahu webových stránok. Od uvedenia sa stal jedným z najpopulárnejších a najuznávanejších miest na webe. Kahle a Gilliat pomenovali tento web po fiktívnom prístroji na cestovanie v čase v animovanej sérii zo 60. rokov The Rocky and Bullwinkle Show.
Aj keď Internetový archív spustil túto stránku pre verejnosť až v októbri 2001, Wayback Machine začal archivovať webové stránky vo vyrovnávacej pamäti od mája 1996. Do roku 2001 digitálne pásky uchovávali informácie, ktoré boli prístupné iba vybraným vedcom a výskumníkom. Keď sa všetko o päť rokov neskôr zverejnilo verejnosti (ako sa dlho plánovalo), obsahovalo to už viac ako 10 miliárd archivovaných stránok.
Skladovanie a zbierky
Dnes tento web uchováva historické údaje z webu v klastri uzlov systému Linux. Stroj Wayback Machine sťahuje všetky verejne prístupné informácie a dátové súbory na webové stránky prostredníctvom svojho mechanizmu prehľadávania. Nie je tu však zahrnuté všetko, čo je zverejnené na webe, pretože určitý obsah je obmedzený alebo uložený v databázach, ktoré nie sú prístupné. Z tohto dôvodu sú niektoré webové stránky prehľadávané lepšie ako iné, v závislosti od toho, ako vývojári vytvorili web naraz.
Všimnete si tiež, že čím novší je archív, tým viac obsahu je k dispozícii na danom webe. Nový nástroj, ktorý internetový archív predstavil v roku 2005, je jedným z dôvodov, prečo sú novšie údaje úplnejšie. Archive-It.org pomáha prekonávať nezrovnalosti na čiastočne uložených webových stránkach tým, že umožňuje inštitúciám a tvorcom obsahu zbierať a uchovávať zbierky digitálneho obsahu.
O prehľadávaní
Webové prehľadávače, ktoré sa niekedy nazývajú spider alebo spiderbot, sú rovnako staré ako samotný internet. Tieto prehľadávače sú internetoví roboti, ktorí neustále prehľadávajú web na účely indexovania, čo z nich robí dôležitú súčasť každého moderného vyhľadávacieho nástroja. Prehľadávače používané v stroji Wayback Machine na vytváranie digitálnych snímok webových stránok pochádzajú z rôznych zdrojov, ktoré sa časom zmenili.
Ako si rýchlo všimnete, frekvencia snímok sa na jednotlivých webových stránkach veľmi líši. Typicky, čím je väčšia (a možno populárnejšia) webová stránka, tým viac sa indexovo prehľadáva. Navyše veľa závisí od toho, ako často má web zmeny stránok. Aj tie najmenšie webové stránky sa nakoniec prehľadajú, pokiaľ neexistuje dôvod, že nie sú. Napríklad weby chránené heslom sa neprehľadávajú a nie sú zahrnuté ani weby, ktorých vlastníci požiadali o ich zahrnutie.
Používanie stroja Wayback
Web Wayback Machine je ľahko použiteľný pre každého. Ak chcete nájsť historické snímky webových stránok, zadajte ich názov do vyhľadávacieho nástroja. Na stránke s výsledkami vyhľadávania hypertextové odkazy označujú dátumy a časy, kedy bola stránka archivovaná. Kliknutím na odkaz zobrazíte stránku „späť v čase“.
V nasledujúcich príkladoch môžete vidieť prednú stránku webovej stránky spoločnosti Apple zaznamenanú vo februári 2005 a novembri 2014 a domovskú stránku CNN z obdobia v marci 2004 a septembri 2010.
Poznámka: Tieto indexové prehľadávania zahŕňajú aj odkazy na iné stránky zaznamenané v daný deň, nielen na domovské stránky.
Pokročilé nástroje
Vytvorený pre výskumníkov i verejnosť, Wayback Machine má niekoľko zabudovaných nástrojov, ktoré by bežným používateľom mohli chýbať. Napríklad podľa návrhu sú stránky s výsledkami vyhľadávania ľahko použiteľné. Ako bolo vysvetlené: „Ak nájdete archivovanú stránku, na ktorú by ste sa chceli odkazovať na svojej webovej stránke alebo v článku, môžete skopírovať adresu URL. Môžete dokonca použiť fuzzy zhodu adries URL a špecifikáciu dátumu... ale to je o niečo pokročilejšie. “
Stroj Wayback Machine umožňuje vlastníkom stránok tiež použiť funkciu „Uložiť stránku teraz“ na uloženie konkrétnej stránky. A napriek tomu to nie je dokonalé. Funkcia v súčasnosti nepridáva adresu URL webu k žiadnym budúcim indexovým prehľadávaním. Žiadosť navyše neukladá viac ako jednu stránku. Je to však dobrý prvý krok k archivácii domovskej stránky vášho webu, aby ste dosiahli historický záznam.
Na nové hľadanie nemusíte stroj Wayback navštíviť zakaždým. Namiesto toho môžete vyhľadať obsah zadaním adresy na paneli nástrojov webového prehliadača. Použite tento formát pre všetky vyhľadávania: http://web.archive.org/*/www.yoursite.com/*. Napríklad použite http://web.archive.org/*/www.groovypost.com/* nájsť archivované stránky pre GroovyPost!
Mobilné a vývojárske nástroje
Wayback Machine sa nakoniec nenachádza iba cez web. Môžete nájsť aplikáciu Wayback Machine pre iOS a Android. Existujú aj rozšírenia pre Chrome, Safari a Firefox. Vývojári si tiež budú chcieť pozrieť rozhrania API internetového archívu Wayback Machine. Uľahčujú vývojárom načítanie informácií o údajoch o zachytení Wayback.
Stroj internetového archívu Wayback podporuje niekoľko rôznych rozhraní API. Týmto uľahčuje vývojárom načítanie informácií o zachytených dátach Wayback.
Návrat „späť v čase“ pre vaše obľúbené webové stránky je dôvodom č. 1 na návštevu stroja Wayback Machine. Je to tiež vynikajúci nástroj pre kohokoľvek, kto skúma históriu webových stránok pre školské projekty alebo na obchodné účely. Čokoľvek urobíte, navštívte stroj Wayback Machine a v niekoľkých jednoduchých krokoch uvidíte, čo môžete objaviť.
Ďalšie informácie o predplatiteľskej službe Internet Archive-It nájdete na oficiálna web stránka a začnite prispievať ešte dnes!