GNU Wget

utilitaire en ligne de commande pour télécharger des fichiers depuis le Web

Wget est un client HTTP, HTTPS et FTP développé en janvier 1996 par Hrvoje Nikšić puis maintenu par le projet GNU depuis février 1997. Son interface en ligne de commande permet de récupérer du contenu d’un serveur Web ou FTP. C’est un logiciel libre dont le nom est dérivé de l’anglais World Wide Web et get.

GNU Wget
Description de l'image Official gnu.svg.
Description de cette image, également commentée ci-après
Capture d'écran de Wget exécuté dans un environnement Linux
Informations
Développé par Projet GNUVoir et modifier les données sur Wikidata
Première version Voir et modifier les données sur Wikidata
Dernière version 1.25.0 ()[1]Voir et modifier les données sur Wikidata
Dépôt git.savannah.gnu.org/cgit/wget.git et git.savannah.gnu.org/git/wget.gitVoir et modifier les données sur Wikidata
Écrit en CVoir et modifier les données sur Wikidata
Système d'exploitation GNU, GNU/Linux, FreeBSD, NetBSD, OpenBSD, Haiku, HP-UX, Tru64 UNIX, Solaris, macOS, Microsoft Windows et LinuxVoir et modifier les données sur Wikidata
Formats écrits WARC (en)Voir et modifier les données sur Wikidata
Type Client HTTP
Client FTP (en)
Utilitaire de ligne de commande (d)
Gestionnaire de téléchargement
Paquet GNUVoir et modifier les données sur Wikidata
Licence Licence publique générale GNU version 3 ou ultérieureVoir et modifier les données sur Wikidata
Site web www.gnu.org/software/wgetVoir et modifier les données sur Wikidata

Chronologie des versions

Caractéristiques techniques

modifier

Wget permet notamment de créer des miroirs de sites, ou d’effectuer des téléchargements récursifs. Son nom vient de World Wide Web et de GET qui est le nom de la commande utilisée dans le protocole HTTP pour récupérer un fichier. Il est capable de communiquer avec les protocoles HTTP et FTP.

Il est écrit en C dans un style extrêmement portable. C’est un programme en ligne de commande utilisé principalement sur les systèmes Unix. Des frontaux graphiques tels que gwget et des versions pour Windows existent également.

Wget est non interactif, ce qui signifie qu’il peut travailler en arrière-plan, sans que l'utilisateur ne soit identifié sur sa machine. Au contraire, la plupart des navigateurs web nécessitent la présence constante de l'utilisateur, ce qui peut être très gênant lors de transferts importants de données.

Lorsqu’il crée un miroir ou qu’il « télécharge récursivement », wget respecte le protocole robots.txt. Wget peut être paramétré pour convertir en local les liens des fichiers HTML téléchargés afin qu’ils soient consultables hors-ligne.

Les caractères génériques de nom de fichiers et les images miroirs récursives de répertoire sont disponibles lors d’un transfert via FTP. wget peut lire l’estampille temporelle fournie par les serveurs HTTP et les serveurs FTP, et l’enregistrer localement. Wget peut ainsi vérifier si un fichier distant a été modifié depuis la dernière recherche, et éventuellement télécharger automatiquement la nouvelle version. Wget est donc un outil approprié pour créer des miroirs de sites FTP, ou de pages d’accueil.

Wget a été conçu pour être robuste si la connexion réseau est lente ou instable ; si un téléchargement échoue à cause d’un problème de réseau, il va réessayer jusqu’à ce que tout le fichier soit récupéré, en reprenant là où il s’était arrêté.

Wget supporte les serveurs proxy, ce qui peut réduire la charge du réseau, accélérer le téléchargement et permettre un accès derrière un pare-feu.

Historique

modifier

Wget ne gérait pas les fichiers de plus de 2 gigaoctets avant la version 1.10.

GNU Wget fut par la suite maintenu quelques années par Micah Cowan, auquel succéda Giuseppe Scrivano en 2010[note 1].

Wget2, le successeur de wget, est en cours de développement[2]. De nombreuses modifications seront apportées pour améliorer les performances, avec notamment : le support de HTTP/2, la compression HTTP, la parallélisation des connexions ou encore l'utilisation de l'entête HTTP (en) If-Modified-Since[3].

Implémentations graphiques

modifier

Notes et références

modifier

Références

modifier
  1. (en) Darshit Shah (d), « wget-1.25.0 released [stable] », (consulté le )
  2. (en) « Wget - Free Software Foundation », sur gnu.org (consulté le ).
  3. (en) « Wget / wget2 · GitLab », sur GitLab (consulté le )
  4. « GWGET - Download Manager for GNOME2 », projects.gnome.org, 8 juillet 2011.
  1. En avril 2010, conjointement avec Karl Berry; il était alors le mainteneur des projets GNU IceCat et MyServer.

Sur les autres projets Wikimedia :

Voir aussi

modifier