Představte si situaci: vytváříte web. Najměte si webmastera nebo to udělejte sami a utrácejte za to spoustu peněz a osobního času. Hostíte své duchovní dítě a s láskou jej naplňujete informacemi, aniž byste přemýšleli o tom, že je třeba uložit kopii webu, abyste nepřišli o data.
Jednoho dne, který pro vás není tak skvělý, přejdete na svůj web, ale nefunguje to. Začnete zjišťovat, co se děje, a, děs, datové centrum shořelo nebo hosting spadl. Nebo se tam dostal virus a zničil vaše data. Ztráta informací na webu je srovnatelná se ztrátou informací na počítači. Jak si tedy ponechat kopii webu?
Pojďme se nejprve zabývat definicí. Proces archivace webu je uchování aktuální verze stránky nebo webu v archivu pro pozdější práci s nimi. Pro tyto účely se používá specializovaný software. Největší společností na světě je Internet Archive, o kterém budeme hovořit níže.
Pro soukromý archiv můžete použít offline prohlížeče, které byly speciálně navrženy pro práci offline. Pomohou tvořitmístní kopie jednotlivých webových stránek nebo celých stránek. Patří mezi ně například:
- Prohlížeč HTTrack pro více platforem, který podporuje 29 světových jazyků a je schopen obnovit přerušené stahování, aktualizovat zrcadlo webu.
- Sdílený bezplatný Offline Explorer, který vám umožňuje stahovat nejen soubory nebo stránky, ale celé stránky z internetu přes FTP, HTTP, HTTPS, RTSP, MMS, BitTorrent.
- Správce stahování Správce stahování zdarma. Integruje se se všemi prohlížeči, má vestavěný FTP, podporuje protokol BitTorrent, umí vytvářet torrent soubory, zachytávat odkazy ze schránky.
- Uzavřený zdroj Teleport Pro pro Windows. Program vám umožňuje stahovat celé stránky.
- Bezplatný konzolový neinteraktivní program pro stahování souborů a stránek z internetu Wget. Program podporuje protokoly HTTPS, HTTP, FTP a může také pracovat přes HTTP proxy server. Vhodné pro Linux.
Vytvoření zálohy na hostingu
U svého poskytovatele hostingu můžete nastavit zálohu webu. Chcete-li to provést, musíte přejít na panel správce, do sekce pro vytváření záloh. Každý hosting má svůj vlastní administrátorský panel a je těžké říci, kde přesně tuto sekci hostí ten váš. Pokud si s tím nevíte rady, napište na technickou podporu.
Vytvoření zálohy pomocí pluginů
Pokud je váš web hostován na platformě CMS, jako je např. WordPress, můžete si uložit kopii svého webu instalací pluginu wp-db-backup (www.wordpress.org/plugins/wp-db-backup/) nebo podobného. Správnou konfigurací pluginu obdržíte zálohu stránek každý den nebo každý týden, jak si přejete.
Jak uložit kopii webu do počítače
Stránku si můžete uložit do počítače pomocí FTP klienta. Pokud používáte program FileZilla, vytvořte v počítači složku „Záloha“(název složky může být jakýkoli). Připojte se k serveru pomocí FTP klienta a jednoduše přetažením vytvořte úplnou zálohu webu do složky „Záloha“.
Kromě toho můžete využít službu Site2ZIP (archivovat stránky), program pro stahování WinHTTrack WebSite Copier. Jak zobrazit uloženou kopii webu? Chcete-li to provést, otevřete složku, do které byl web uložen, a klikněte na soubor index.html.
Internetový archiv
V roce 1996 v San Farncisco založil Brewster Cale neziskový Internet Archive. Shromažďuje kopie všech webových stránek, audio a video nahrávky, grafické soubory a programy. Archivy shromážděného materiálu jsou zde uloženy po velmi dlouhou dobu a do jeho databází má každý volný přístup.
Pokud vás zajímá, jak otevřít uloženou kopii webu, přejděte na stránku archive.org/web/ a do příslušného pole zadejte adresu webu nebo stránky. Na konci roku 2012 měl internetový archiv 10 petabajtů – to je 10 000 terabajtů! A do poloviny roku 2016 nashromáždil 502 miliard kopií.webové stránky.
Ukládání webu do mezipaměti pomocí vyhledávačů
Uložená kopie webu Google není nic jiného než mezipaměť stránek webu vytvořená vyhledávačem. Každý uživatel může kdykoli použít kopii stránky pro své potřeby. Jejich ukládání na servery vyhledávačů vyžaduje spoustu zdrojů a je na to vyčleněno mnoho peněz, ale taková pomoc se vyplatí, protože stále chodíme do vyhledávačů. Je pravda, že tato metoda je vhodná pouze pro existující weby nebo pro ty, které byly nedávno odstraněny. Pokud se to stalo již dávno, vyhledávač data vymaže.
Specializovaný vyhledávač
Kromě toho, že můžete ručně vyhledávat stránky uložené v mezipaměti na Googlu nebo Yandexu, můžete použít specializovaný vyhledávač cachedview.com. Má analog: cachedpages.com.
Pokud si chcete uložit kopii webu nebo jeho jednotlivé stránky, můžete to udělat sami a zdarma na archive.is. Kromě toho existuje také globální vyhledávání verzí, které si kdy uživatel uložil.
Vytvoření webového archivu v národních knihovnách
Národní knihovny dnes stojí před úkolem vytvářet archivy internetových dokumentů, které jsou součástí vědeckého, kulturního a historického dědictví lidstva. Ale to je velmi problematické.
Studie ukázaly, že počet webových dokumentů na webu exponenciálně roste a v průměru jeden dokument žijeod jednoho do čtyř měsíců. Jako zúčtovací jednotku pro archiv webových dokumentů je nejpohodlnější použít webovou stránku. Proces vytváření fondu spočívá ve vytvoření kopie nebo „zrcadlení“webu. Protože se informace na něm v průběhu času mění, musí knihovna v pravidelných intervalech vytvářet zrcadla stejného webu.
Ve Švédsku je tedy 60 000 webových stránek, což je 20krát více než počet tradičních tištěných publikací. Kopie tištěných dokumentů ve švédské knihovně zabírají 1,7 km polic ročně. Webový archiv by zaplnil 25 km regálů! Nyní jejich archiv obsahuje 138 milionů souborů o celkové hmotnosti 4,5 gigabajtů.
Internet roste každým dnem. Existuje mnoho společností a webů, které se starají o uchovávání kopií webových stránek ve svých archivech. Ale nespoléhejte jen na ně. Provádějte včasné zálohy a o svůj web nikdy nepřijdete.