En général, j'ai observé ce qui suit:
Des questions:
Il existe une grande variété de formats de compression et de méthodes disponibles, certains ne se comprient pas du tout et sont conçus pour stocker plusieurs fichiers dans une archive, et d'autres compresseurs expérimentaux plus récents (basés sur le PAQ ) sont conçus pour être compressés aussi agressivement que possible, Quel que soit le temps nécessaire pour effectuer ladite opération.
Vous devez évaluer les fonctionnalités dont vous avez besoin à partir de votre choix de méthode de compression, et considérer également le contexte dans lequel il sera utilisé.
Différentes caractéristiques et considérations incluent:
En règle générale, ZIP est le format le plus omniprésent, mais les dimensions supérieures à 4 Go ne sont généralement pas prises en charge (le cas échéant), le support de sécurité est généralement considéré comme médiocre (le mot de passe standard peut être compromis avec une attaque en texte brut et un autre chiffrement est Généralement implémenté comme un dérivé non officiel du format par les fournisseurs commerciaux de logiciels ZIP).
En dehors de cela, la plupart des autres formats populaires auront une forme de support sur tous les systèmes d'exploitation en installant plus de logiciels.
Mon choix personnel est 7-Zip , car il a une compression formidable et flexible; En dépit d'avoir une interface utilisateur particulière sur Windows. Il existe des compresseurs pour Linux et Mac OS X (même si pas sur la base de GUI en standard).
Une chose qui vient à l'esprit est une publication de blog (de deux ans) de Jeff Atwood: la compression de fichiers à l'ère multi-core . Dans cet article, il constate que bzip2 surpasse 7-zip lors de l'exécution de plus de deux noyaux.
À votre première question, 7-Zip est un archivage qui peut utiliser de nombreux algorithmes pour compresser et décompresser les données.
Pour votre deuxième question, assurez-vous que la plate-forme prend en charge les outils qui prennent en charge le format donné. Par exemple, j'éviterais d' utiliser RAR sur un Mac. Bien qu'il soit possible d'utiliser, et il existe des utilitaires gratuits qui le supportent, ils n'ont pas l'interface beaucoup plus riche que les utilitaires Windows qui prennent en charge RAR ont (selon mon expérience).
Comme d'autres l'ont mentionné, le choix d'un format de compression particulier dépend fortement de l'utilisation et du public visé.
Les archives .tar.gz et tar.bz2 sont idéales pour une utilisation sur les systèmes Linux (et par extension pour le partage de fichiers avec des utilisateurs Linux) car les outils tar, gzip et bzip2 sont en grande partie omniprésents sur la plate-forme et parce que le format .tar est plein Prise en charge des autorisations Unix et d'autres propriétés spécifiques à la plate-forme. Le choix entre gzip et bzip2 pour compresser l'archive tar est principalement une décision concernant le rapport vitesse / compression, avec bzip2 livrant des fichiers plus petits mais avec une vitesse de compression beaucoup plus lente. Les inconvénients de ces formats incluent moins de compatibilité avec Windows et le (potentiel) besoin de décompresser l'archive entière pour extraire un seul fichier.
Les archives ZIP peuvent être extraites sur la plupart des plates-formes en utilisant des outils natifs, donc c'est un choix idéal pour envoyer une archive à un utilisateur non technique qui ne serait pas à l'aise avec l'installation de logiciels d'archives tiers tels que 7-Zip. Le niveau de compression n'est pas aussi bon que les algorithmes plus avancés et ne supporte pas les autorisations Unix, mais c'est un excellent format si vous souhaitez envoyer une archive de photos de vacances à votre grand-mère, par exemple. ZIP fournit également une protection motrice de base, et peut rapidement extraire un fichier de n'importe où dans l'archive.
7-Zip est bon si vous voulez les meilleurs taux de compression possibles. Comme ZIP, il ne prend pas en charge les autorisations de fichiers Unix ou la propriété, et n'est pas également installé par défaut sur la plupart des plates-formes, ce qui rend un peu plus de travail à utiliser, mais cela peut valoir la peine si Windows gagne le taux de compression. Dans un environnement Linux, il serait préférable d'utiliser les outils de compression 'xz' ou 'lzma' avec Tar, qui fonctionnent exactement de la même manière que 'gzip' et 'bzip2' mais utilisent l'algorithme LZMA plus avancé comme 7 -Zip *: français.
À titre d'exemple, j'utilise les formats mentionnés dans ces cas:
J'évite tout RAR et chaque fois que je reçois un fichier RAR de quelqu'un que je connais, je lui dis qu'il ne faut pas utiliser ce format car il est propriétaire, et probablement il / elle utilise un logiciel sans licence (la plupart des gens téléchargent la version d'essai de WinRAR et continuent d'utiliser Pour toujours).
PS: Je cours Ubuntu (principalement) et Windows (à double démarrage et VirtualBox).
Il existe au moins quatre emplois distincts qui sont souvent confondus, car les outils populaires les intègrent:
L'omniprésence de .tar.gz et .tar.bz correspond à la philosophie Unix des petits outils en faisant un seul travail, sur un seul outil qui fait tout. Le format de fichier TAR ne prend pas en charge la compression ou le cryptage, mais il peut être compressé par n'importe quel compresseur (y compris comme .tar.zip ou .tar.7z). Le travail de GZip et BZip2 consiste simplement à compresser un flux de fichiers vers un autre flux de fil, la couche de compression n'a pas besoin de se soucier de la préservation des métadonnées ou du cryptage ou de la somme de contrôle. Au fil du temps, plusieurs raccourcis ont été réalisés dans le programme tar
pour fonctionner plus facilement avec un compresseur.
Dans le format de fichier zip et 7z, ces travaux distincts sont effectués par un seul programme dans un seul format de super fichier.
Pourquoi la tendance ci-dessus semble-t-elle se tenir, même si tous ces formats sont portables? Y a-t-il des avantages particuliers à utiliser un format d'archive particulier sur une plate-forme particulière?
Parce qu'il a été comme cela a été fait, les codes sources du programme sont traditionnellement distribués sous la forme .tar.gz ou .tar.bz2, car la préservation des autorisations des fichiers, le temps de modification, etc. sont importants pour les différents outils utilisés pour la programmation (p. Ex. Make).
L'étape d'archivage et de compression distincte a très bien fonctionné pendant des années, il a un avantage évident de pouvoir combiner et combiner l'archivage et la compression, et son inconvénient (un processus de compression en 2 étapes) peut être facilement contourné par le développement d'outils plus intelligents ( Le programme de compression linux le plus moderne compressera directement vers .tar.gz ou .tar.bz2, en cachant l'étape intermédiaire).
Il n'y a pas de raison forte de passer à d'autres formats de fichiers, les compresseurs plus récents n'ont pas un taux de compression nettement meilleur pour justifier la rupture de la tradition et le tar peut tout préserver.