Feu una còpia mirall fora de línia d'un lloc amb Wget a Windows i Linux
De vegades, heu d’obtenir una còpia navegable d’un lloc web perquè pugueu accedir-hi sense connexió, posar una memòria USB o fins i tot penjar-la al vostre telèfon intel·ligent i llegir-la quan voleu o viatgeu. Tot i que als navegadors i sistemes operatius moderns és fàcil desar una pàgina web en PDF, pot ser molest processar cada pàgina. Aquí ve wget.
Anunci publicitari
Wget és un gestor de descàrregues de codi obert. És una aplicació de consola desenvolupada principalment per a Linux, però portada amb èxit en altres sistemes operatius, inclosos Windows i MacOS.
on puc imprimir documents des del meu correu electrònic
Si no esteu familiaritzat amb wget, heu de provar-ho definitivament. És molt potent. Permet obtenir fitxers de llocs web mitjançant HTTP, HTTPS i FTP, els protocols d’Internet que estem utilitzant actualment. El seu comportament està controlat per arguments de línia d'ordres.
Wget admet una gran varietat d'opcions per recuperar fitxers en connexions lentes o inestables, inclosos els intents, continuar des d'on va deixar i molt més. Admet el fitxer 'robots.txt', de manera que pot funcionar com un rastrejador web. Només pot recuperar fitxers modificats, admet comodins, límits de tipus de fitxer i extensions regulars.
Wget admet la recuperació recursiva de llocs web HTML i servidors FTP, cosa que us permet crear un mirall de lloc web. A continuació s’explica com es pot fer.
Abans de continuar, heu d’obtenir l’aplicació wget.
Obteniu Wget a Windows
Normalment faig servir binaris d’aquestes fonts:
Tots dos fan la seva feina.
Obteniu Wget a Linux
Utilitzeu el gestor de paquets de la vostra distribució. Alguns exemples (run com a arrel ):
Debian / Ubuntu / Mint:
apt install wget
CentOS / Redhat
yum instal·lar wget
Arch Linux
pacman -Sy wget
Void Linux
xbps-install -S wget
Per fer una còpia fora de línia d'un lloc amb Wget,
- Obert símbol del sistema / terminal .
- Al Windows, escriviu el camí d'accés complet al fitxer wget.exe.
- A Linux, escriviu només wget.
- Ara, escriviu els arguments següents per obtenir l'ordre següent:
wget --mirror --convert-links --adjust-extension --page-requisites --no-parent https://site-to-download.com
- Substituïu el fitxer
https://site-to-download.com
porció amb l'URL del lloc real del qual voleu reflectir.
Estàs acabat!
Aquests són els commutadors que fem servir:
--mirall
- aplica diverses opcions perquè la descàrrega sigui recursiva.--no-pare
- No rastregeu el directori principal per obtenir només una part del lloc.--convert-links
- fa que tots els enllaços funcionin correctament amb la còpia fora de línia.--page-requisits
- descarregueu fitxers JS i CSS per conservar l’estil de pàgina original quan navegueu per un mirall local.--adjust-extension
- afegeix les extensions adequades (per exemple, html, css, js) als fitxers si es van recuperar sense elles.
Això és.