Comment forcer le redownload avec wget?

J'ai eu la mauvaise surprise que wget ne redécharge pas quand un fichier du même nom existe déjà.

Existe-t-il une option pour le forcer à redécharger sans supprimer le fichier d'abord sur linux?

wget -O - $url >/path/to-file 

Ou, si vous faites une mise en miroir, vous pouvez utiliser l'indicateur -c . Cela fera en sorte que les fichiers soient "continus", mais étant donné qu'ils sont déjà à la taille, le serveur a déclaré à wget, il les "continuera" dès le début.

Cela dépend beaucoup des options que vous avez apportées sur la ligne de commande. J'ai constaté que le comportement par défaut sur mes systèmes est de télécharger à nouveau, mais ajoutez un numéro au nom de fichier pour le rendre différent.

Voici la description de l'option -no-clobber de man wget (pour wget 1.11.4) – notez les interactions avec d'autres options, en particulier -r et -p . (L'accent est mis.)

-Caroline du Nord
– pas de clobber
Si un fichier est téléchargé plus d'une fois dans le même répertoire, le comportement de Wget dépend de quelques options, y compris -nc. Dans certains cas, le fichier local sera bloqué ou écrasé lors du téléchargement répété. Dans d'autres cas, il sera conservé.

Lors de l'exécution de Wget sans -N, -nc, -r ou p, le téléchargement du même fichier dans le même répertoire entraînera la conservation de la copie originale du fichier et la deuxième copie appelée fichier.1. Si ce fichier est encore téléchargé, la troisième copie sera nommée fichier.2, et ainsi de suite. Lorsque -nc est spécifié, ce comportement est supprimé, et Wget refuse de télécharger les nouvelles copies du fichier. Par conséquent, "" no-clobber "" est en fait un nom incorrecte dans ce mode — ce n'est pas clobbering qui est empêché (comme les suffixes numériques empêchaient déjà le clobbering), mais plutôt l'économie de plusieurs versions qui est empêchée.

Lors de l'exécution de Wget avec -r ou -p, mais sans -N ou -nc, la ré-téléchargement d'un fichier entraînera la nouvelle copie simplement écrasant l'ancien. L'ajout de -nc empêchera ce comportement, ce qui entraînera la préservation de la version d'origine et des nouvelles copies sur le serveur à ignorer.

Lorsque vous exécutez Wget avec -N, avec ou sans -r ou -p, la décision de télécharger une copie plus récente d'un fichier dépend de l'horodatage local et distant et de la taille du fichier. -nc peut ne pas être spécifié en même temps que -N.

Notez que lorsque -nc est spécifié, les fichiers avec les suffixes .html ou .htm seront chargés à partir du disque local et analysés comme s'ils avaient été récupérés sur le Web.

Ceci est contrôlé par l' -nc ou -nc --no-clobber .

C'est compliqué et dépend d'autres options, mais vous avez le choix d'émettre ou de renommer des fichiers redéschargés fichier.1, fichier.2

La page man semble dire que si vous n'utilisez pas l' option «non-clobber» , les fichiers redownloads seront renumérotés. Voyez-vous des fichiers avec des suffixes numériques?

En tout cas, voir la man page