dwww Home | Manual pages | Find package

bzip2(1)                    General Commands Manual                   bzip2(1)

NOM
       bzip2, bunzip2 - compresseur de fichiers par tri de blocs, v1.0.8
       bzcat - décompresse les fichiers sur la sortie standard
       bzip2recover - récupère des données de fichiers bzip2 endommagés

SYNOPSIS
       bzip2 [ -cdfkqstvzVL123456789 ] [ noms_fichiers ... ]
       bzip2 [ -h|--help ]
       bunzip2 [ -fkvsVL ] [ noms_fichiers ... ]
       bunzip2 [ -h|--help ]
       bzcat [ -s ] [ noms_fichiers ... ]
       bzcat [ -h|--help ]
       bzip2recover nom_fichier

DESCRIPTION
       bzip2  compresse  des fichiers en utilisant l'algorithme de compression
       de texte par tri de blocs de Burrows-Wheeler et le codage d'Huffman. La
       compression est généralement nettement meilleure que celle atteinte par
       des compresseurs plus conventionnels basés sur  LZ77/LZ78  et  approche
       les performances de la famille des compresseurs statistiques PPM.

       Les  options  de ligne de commandes sont délibérément très similaires à
       celles de GNU gzip, mais elles ne sont pas identiques.

       bzip2 attend une liste de noms de fichiers pour accompagner les options
       de ligne de commandes. Chaque fichier est remplacé par une version com-
       pressée de lui-même, avec le nom « nom_original.bz2 ».  Chaque  fichier
       compressé  a  la  même  date de modification, les mêmes permissions et,
       quand c'est possible, les mêmes propriétés que celles du fichier origi-
       nal,  de  sorte que ces caractéristiques peuvent être correctement res-
       taurées au moment de la décompression. Le traitement du nom du  fichier
       est  naïf  dans le sens qu'il n'y a pas de mécanisme pour préserver les
       noms, permissions, propriétés et dates des  fichiers  situés  dans  des
       systèmes  de  fichiers où ces concepts font défaut, ou qui souffrent de
       restrictions strictes sur la  longueur  des  noms  de  fichiers,  comme
       MS-DOS.

       bzip2  et bunzip2, par défaut, n'écraseront pas les fichiers existants.
       Si vous voulez que cela se produise, utilisez l'option -f.

       Si aucun nom de fichier n'est  indiqué,  bzip2  compresse  de  l'entrée
       standard  vers  la  sortie standard. Dans ce cas, bzip2 n'écrira pas la
       sortie compressée sur un terminal, puisque cela serait incompréhensible
       et donc inutile.

       bunzip2  (ou bzip2 -d) décompresse tous les fichiers spécifiés. Les fi-
       chiers qui n'ont pas été créés par bzip2 seront détectés et ignorés  et
       un  avertissement  sera  émis. bzip2 tente de deviner le nom du fichier
       pour le fichier décompressé à partir de celui du fichier  compressé  de
       la manière suivante :

              nom_fichier.bz2    devient   nom_fichier
              nom_fichier.bz     devient   nom_fichier
              nom_fichier.tbz2   devient   nom_fichier.tar
              nom_fichier.tbz    devient   nom_fichier.tar
              autre_nom          devient   autre_nom.out

       Si  le nom du fichier ne se termine pas par une des terminaisons recon-
       nues, .bz2, .bz, .tbz2 ou .tbz, bzip2 signale qu'il ne peut pas deviner
       le  nom du fichier original et utilise le nom d'origine en lui ajoutant
       .out.

       Comme pour la compression, si aucun nom de  fichier  n'est  fourni,  la
       commande décompresse de l'entrée standard vers la sortie standard.

       bunzip2  décompressera correctement un fichier qui est la concaténation
       de deux fichiers compressés ou plus. Le résultat est  la  concaténation
       des  fichiers  non  compressés correspondants. Le test d'intégrité (-t)
       des fichiers compressés concaténés est aussi prise en charge.

       Il est également possible de compresser ou décompresser vers la  sortie
       standard  en  fournissant  l'option -c. Plusieurs fichiers peuvent être
       compressés ou décompressés ainsi. Les sorties résultantes sont envoyées
       de façon séquentielle à la sortie standard. La compression de plusieurs
       fichiers de cette manière génère un flux  contenant  la  représentation
       des  divers fichiers compressés. Un flux de ce type ne peut être décom-
       pressé correctement que par bzip2 version 0.9.0 ou ultérieure. Les ver-
       sions antérieures de bzip2 s'arrêtent après la décompression du premier
       fichier du flux.

       bzcat (ou bzip2 -dc) décompresse tous les fichiers  spécifiés  vers  la
       sortie standard.

       bzip2  lira  les arguments à partir des variables d'environnement BZIP2
       et BZIP, dans cet ordre, et les traitera avant tout argument lu à  par-
       tir  de  la ligne de commande. Cela offre une façon pratique de fournir
       des arguments par défaut.

       La compression est toujours effectuée, même si le fichier compressé est
       légèrement  plus  grand  que le fichier original. Les fichiers de moins
       d'une centaine d'octets ont tendance à s'agrandir dans la mesure où  le
       mécanisme de compression comporte une surcharge constante de l'ordre de
       50 octets. Des données aléatoires (y compris la sortie  de  la  plupart
       des  compresseurs  de fichiers) sont codées à environ 8,05 bits par oc-
       tet, aboutissant à une expansion autour de 0,5 %.

       En tant que vérification interne, bzip2 utilise des  CRC  32 bits  pour
       s'assurer que la version décompressée d'un fichier est identique au fi-
       chier d'origine. Ceci permet une protection contre  la  corruption  des
       données compressées et contre des bogues non détectés de bzip2 (heureu-
       sement très improbable). La probabilité qu'une  corruption  de  données
       passe  inaperçue  est  infime,  environ une chance sur 4 milliards pour
       chaque fichier compressé. Soyez conscients, toutefois, que la vérifica-
       tion  se produit pendant la décompression, et qu'elle ne peut donc vous
       informer que lorsque quelque chose s'est mal passé. Cela  ne  peut  pas
       vous aider à récupérer les données non compressées d'origine. Vous pou-
       vez utiliser bzip2recover pour essayer de récupérer des données de  fi-
       chiers endommagés.

       Valeurs  de  retour :  0  pour une sortie normale, 1 pour des problèmes
       d'environnement (fichier non trouvé, options invalides,  erreurs  d'en-
       trée/sortie, etc.),  2  pour  indiquer un fichier compressé corrompu, 3
       pour une erreur de consistance interne (un bogue, par  exemple)  qui  a
       fait paniquer bzip2.

OPTIONS
       -c --stdout
              Compresser ou décompresser vers la sortie standard.

       -d --decompress
              Forcer  la décompression. bzip2, bunzip2 et bzcat constituent en
              fait le même programme, et la décision quant aux actions  à  en-
              treprendre  est déterminée sur la base du nom utilisé. Cette op-
              tion annule ce mécanisme et force bzip2 à décompresser.

       -z --compress
              Le complément de -d : force la compression, quel que soit le nom
              d'invocation.

       -t --test
              Vérifier l'intégrité des fichiers spécifiés, mais ne pas les dé-
              compresser. Cela réalise réellement une décompression d'essai et
              jette le résultat.

       -f --force
              Forcer  l'écrasement  des fichiers en sortie. Normalement, bzip2
              n'écrasera pas les fichiers  de  sortie  préexistants.  L'option
              force  également bzip2 à briser les liens physiques (hard links)
              de fichiers, ce qu'il ne ferait pas autrement.

              Normalement, bzip2 refuse de décompresser des  fichiers  qui  ne
              possèdent pas les octets magiques d'en-tête corrects. Néanmoins,
              s'il est forcé (-f), néanmoins, il passe ces fichiers  sans  les
              modifier. C'est ainsi que GNU gzip se comporte.

       -k --keep
              conserver  (ne  pas  supprimer)  les fichiers d'entrée durant la
              compression ou la décompression.

       -s --small
              Réduire l'utilisation de la mémoire pour la compression, la  dé-
              compression  et  la vérification. Les fichiers sont décompressés
              et testés en utilisant un algorithme modifié qui  requiert  uni-
              quement  2,5 octets  par bloc d'un octet. Cela signifie que tout
              fichier peut être décompressé dans  2 300 Ko  de  mémoire,  même
              s'il  le  sera à une vitesse deux fois plus lente que la vitesse
              normale.

              Durant la compression, -s sélectionne  une  taille  de  bloc  de
              200 Ko, ce qui limite l'utilisation de mémoire à environ le même
              nombre, aux dépens du coefficient de compression. Bref, si votre
              machine possède peu de mémoire vive (8 Mo ou moins), utilisez -s
              pour tout ce que vous faites. Voir GESTION DE  LA  MÉMOIRE  plus
              bas.

       -q --quiet
              Supprimer  les messages d'avertissement non essentiels. Les mes-
              sages se rattachant aux erreurs d'E/S et à  d'autres  événements
              critiques ne sont pas supprimés.

       -v --verbose
              Mode  bavard  – montre le coefficient de compression pour chaque
              fichier traité. Des -v supplémentaires augmentent le  niveau  de
              détail, en affichant des tas d'informations qui sont principale-
              ment utiles à des fins de diagnostic.

       -h --help
              Afficher un message d'aide puis quitter.

       -L --license -V --version
              Afficher la version du logiciel, les termes de sa licence et les
              conditions d'utilisation.

       -1 (ou --fast) à -9 (ou --best)
              Fixer  la  taille de bloc à 100, 200, ... 900 ko pendant la com-
              pression. Cette option n'a aucun  effet  sur  la  décompression.
              Voir  GESTION  DE  LA  MÉMOIRE  ci-dessous.  Les alias --fast et
              --best existent principalement pour la  compatibilité  avec  GNU
              gzip.  En particulier, --fast ne rend pas les traitements signi-
              ficativement plus rapides. Et  --best sélectionne simplement  le
              comportement par défaut.

       --     Traite  tous  les  arguments suivants comme des noms de fichier,
              même s'ils débutent par un tiret. Il est ainsi possible de trai-
              ter  des  fichiers dont le nom débute par un tiret, par exemple
              « bzip2 -- -mon_fichier ».

       --repetitive-fast --repetitive-best
              Ces options sont redondantes dans les  versions 0.9.5  et  ulté-
              rieures.  Elles  fournissent  un  contrôle assez grossier sur le
              comportement de l'algorithme de  tri  dans  les  versions  anté-
              rieures, ce qui était parfois utile. Les versions 0.9.5 et ulté-
              rieures disposent d'un algorithme amélioré qui rend  l'usage  de
              ces options inutile.

GESTION DE LA MÉMOIRE
       bzip2  compresse  des  fichiers importants par blocs. La taille de bloc
       affecte à la fois le coefficient de compression atteint et la  quantité
       de  mémoire nécessaire pour la compression et la décompression. Les op-
       tions -1 à -9 précisent la taille de bloc utilisée, de 100 000 octets à
       900 000 octets  (par défaut) respectivement. Au moment de la décompres-
       sion, la taille de bloc utilisée pour la compression est lue  à  partir
       de  l'en-tête  du  fichier compressé, et bunzip2 s'alloue ensuite juste
       assez de mémoire pour décompresser le fichier. Puisque les  tailles  de
       blocs sont conservées dans les fichiers compressés, il s'ensuit que les
       options -1 à -9 ne sont pas pertinentes et qu'elles sont donc  ignorées
       durant la décompression.

       Les besoins en mémoire de la compression et de la décompression, en oc-
       tets, peuvent être estimés à :

              Compression :   400 k + ( 8 x taille de bloc )

              Décompression : 100 k + ( 4 x taille de bloc ), ou
                              100 k + ( 2.5 x taille de bloc )

       Des largeurs de blocs plus importantes voient les  bénéfices  marginaux
       retirés diminuer rapidement. L'essentiel de la compression provient des
       deux ou trois cents premiers ko de la taille de bloc, un fait à retenir
       quand on utilise bzip2 sur de petites machines. Il est également impor-
       tant de savoir que les  exigences  mémoire  de  la  décompression  sont
       fixées au moment de la compression par le choix d'une taille de bloc.

       Pour  les  fichiers  compressés  avec  la  taille de bloc par défaut de
       900 Ko, bunzip2 aura besoin d'environ 3 700 Ko pour  la  décompression.
       Pour  permettre  la  décompression de tout fichier sur une machine avec
       4 Mo de RAM, bunzip2 possède une option pour décompresser  en  n'utili-
       sant  que  la  moitié  environ  de  ces  3 700 Ko,  à savoir à peu près
       2 300 Ko. Malheureusement, la vitesse de  décompression  est  également
       réduite  de  moitié, et donc vous ne devriez utiliser cette option (-s)
       qu'en cas de nécessité absolue.

       En général, essayez d'utiliser la taille de bloc mémoire la plus grande
       permise,  puisque  cela maximise la qualité de la compression atteinte.
       Les vitesses de compression et de décompression ne sont en fait pas af-
       fectées par la taille de bloc.

       Un autres aspect significatif s'applique aux fichiers qui peuvent tenir
       dans un seul bloc – c'est-à-dire la plupart des fichiers que vous  ren-
       contrez  en  utilisant une grande taille de bloc. La quantité réelle de
       mémoire utilisée est proportionnelle à la taille du fichier, puisque le
       fichier  est  plus petit qu'un bloc. Par exemple, compresser un fichier
       de 20 000 octets avec l'option -9 forcera le compresseur à allouer  en-
       viron  7 600 Ko de mémoire, mais n'en utilisera réellement que 400 Ko +
       20 000 * 8 = 560 Ko. De même, le décompresseur allouera 3 700  Ko  mais
       n'utilisera que 100 Ko + 20 000 * 4 = 180 Ko.

       Voici  une  table  qui résume l'utilisation maximale de la mémoire pour
       différentes tailles de blocs, ainsi que la taille compressée totale  de
       14 fichiers du Calgary Text Compression Corpus totalisant 3 141 622 oc-
       tets. Cette table donne un certain aperçu sur l'évolution  de  la  com-
       pression  avec  la  taille  de  bloc.  Ces chiffres tendent à minimiser
       l'avantage des tailles de blocs plus importantes pour les fichiers plus
       imposants, car le Corpus est dominé par des petits fichiers.

                    Usage       Usage        Usage       Taille du
          Option    compr. décompr. décompr. -s    Corpus

            -1      1200k       500k         350k      914704
            -2      2000k       900k         600k      877703
            -3      2800k      1300k         850k      860338
            -4      3600k      1700k        1100k      846899
            -5      4400k      2100k        1350k      845160
            -6      5200k      2500k        1600k      838626
            -7      6100k      2900k        1850k      834096
            -8      6800k      3300k        2100k      828642
            -9      7600k      3700k        2350k      828642

RÉCUPÉRATION DE DONNÉES DE FICHIERS ENDOMMAGÉS
       bzip2  compresse  les fichiers en blocs d'une longueur d'habituellement
       900 Ko. Chaque bloc est traité indépendamment des autres. Si un  défaut
       du support physique ou une erreur de transmission provoque l'endommage-
       ment d'un fichier .bz1 multi-blocs, il peut être possible de  récupérer
       des données à partir des blocs non endommagés du fichier.

       La  représentation compressée de chaque bloc est délimitée par un motif
       de 48 bits, ce qui permet de trouver les limites  des  blocs  avec  une
       probabilité  raisonnable. Chaque bloc comporte également son propre CRC
       32 bits, de sorte que les blocs corrompus peuvent être  distingués  des
       autres.

       bzip2recover  est un programme simple dont le but est de rechercher les
       blocs dans les fichiers .bz2, et d'écrire chaque bloc détecté dans  son
       propre  fichier  .bz2.  Vous pouvez alors utiliser bzip2 -t pour tester
       l'intégrité des fichiers résultants et décompresser ceux  qui  ne  sont
       pas endommagés.

       bzip2recover  prend  un  seul argument, le nom du fichier endommagé, et
       écrit   un   certain   nombre    de    fichiers    « rec0001file.bz2 »,
       « rec0002file.bz2 », etc, contenant les blocs extraits. Les noms de fi-
       chiers en sortie sont conçus  de  sorte  que  l'utilisation  de  jokers
       (wildcards)  dans des traitements ultérieurs – par exemple, « bzip2 -dc
       rec*file.bz2 > données_récupérées » – liste les fichiers  dans  le  bon
       ordre.

       bzip2recover  devrait  être  utilisé  principalement  pour  traiter les
       grands fichiers .bz2, puisque ceux-ci contiennent de nombreux blocs. Il
       est  clairement inutile d'essayer de l'utiliser sur des fichiers endom-
       magés d'un seul bloc, car un seul bloc endommagé ne peut pas être récu-
       péré.  Si  vous  voulez  minimiser toute perte potentielle de données à
       cause d'erreurs de transmission, vous devriez envisager d'utiliser  une
       taille de bloc plus restreinte.

NOTES SUR LES PERFORMANCES
       La  phase de tri de la compression réunit les chaînes de caractères si-
       milaires présentes dans le fichier.  À  cause  de  cela,  les  fichiers
       contenant de très longues suites de symboles répétés, comme « aabaabaa-
       baab ... » (répétés plusieurs centaines de fois) peuvent être  compres-
       sés plus lentement que d'habitude. Les versions 0.9.5 et ultérieures se
       conduisent nettement mieux que les versions précédentes de ce point  de
       vue.  Le  rapport entre le temps de compression dans le pire des cas et
       dans le cas moyen est de l'ordre de 10 pour 1. Pour les versions  anté-
       rieures,  ce rapport était de 100 pour 1. Vous pouvez utiliser l'option
       -vvvv pour voir la progression dans les détails, si vous le souhaitez.

       La vitesse de décompression n'est pas affectée par ces phénomènes.

       bzip2 alloue d'habitude plusieurs Mo de mémoire pour  ses  besoins,  et
       ensuite charge le tout d'une manière assez aléatoire. Cela signifie que
       les performances, à la fois pour la compression  et  la  décompression,
       sont largement déterminées par la vitesse à laquelle votre machine peut
       traiter les défauts de cache. À cause de cela, de petites modifications
       du  code  pour réduire le taux d'échec en cache ont donné des améliora-
       tions de performances  disproportionnées.  bzip2  aura  sans  doute  de
       meilleur performances sur des machines avec de très grands caches.

AVERTISSEMENTS
       Les  messages  d'erreurs  d'E/S ne sont pas d'une grande utilité. bzip2
       essaie vraiment de détecter les erreurs d'E/S et de  s'arrêter  propre-
       ment, mais les détails du problème rencontré peuvent parfois induire en
       erreur.

       Cette page de manuel concerne la version 1.0.8 de  bzip2.  Les  données
       compressées  créées  par  cette version sont entièrement compatibles de
       façon descendante et ascendante avec les  versions  antérieures 0.1pl2,
       0.9.0, 0.9.5, 1.0.0, 1.0.1, 1.0.2 et ultérieures, à l'exception que les
       versions 0.9.0 et ultérieures peuvent correctement décompresser de mul-
       tiples fichiers compressés et concaténés. La version 0.1pl2 ne sait pas
       le faire; elle s'arrêtera après la décompression du premier fichier  du
       flux.

       Les  versions bzip2recover antérieures à 1.0.2 utilisait des entiers de
       32 bits pour représenter les positions des bits dans les fichiers  com-
       pressés ; de ce fait, elles ne pouvaient traiter de fichiers compressés
       de plus de 512 Mo de long. Les versions 1.0.2 et ultérieures  utilisent
       des  entiers  de  64 bits sur certaines plateformes qui les prennent en
       charge (cibles gérées par GNU et Windows). Pour savoir si  bzip2recover
       a  été  construit avec ou sans cette limitation, exécutez-le sans argu-
       ment. Dans tous les cas, vous pouvez reconstruire une version non limi-
       tée  si  vous pouvez le recompiler avec MaybeUInt64 défini comme un en-
       tier 64 bits non signé.

AUTEUR
       Julian Seward, jseward@acm.org.

       https://sourceware.org/bzip2/

       Les idées intégrées à bzip2 sont dues (entre autres) aux personnes sui-
       vantes  :  Michael  Burrows et David Wheeler (pour la transformation de
       tri de blocs), David Wheeler (à nouveau, pour le codeur Huffman), Peter
       Fenwick (pour le modèle de codage structuré du bzip original et pour de
       nombreux raffinements), et Alistair Moffat, Radford Neal et Ian  Witten
       (pour le codeur arithmétique du bzip original). Je suis très reconnais-
       sant à ces personnes pour leur aide, leur soutien  et  leurs  conseils.
       Voyez le manuel dans la distribution source pour obtenir des liens vers
       les sources de documentation. Christian von Roques m'encouragea à cher-
       cher  des  algorithmes  de tri plus rapides, pour accélérer la compres-
       sion. Bela Lubkin m'encouragea à améliorer la performance  de  la  com-
       pression  dans  le pire des cas. Beaucoup de personnes m'ont envoyé des
       correctifs, aidé pour des problèmes de portabilité, prêté des machines,
       donné des conseils et ont été généralement utiles.

TRADUCTION
       La  traduction française de cette page de manuel a été créée par Frédé-
       ric Delanoy <delanoy_f@yahoo.com> et Jean-Pierre Giraud <jean-pierregi-
       raud@neuf.fr>

       Cette traduction est une documentation libre ; veuillez vous reporter à
       la       GNU       General       Public        License        version 3
       ⟨https://www.gnu.org/licenses/gpl-3.0.html⟩  concernant  les conditions
       de copie et de distribution. Il n'y a aucune RESPONSABILITÉ LÉGALE.

       Si vous découvrez un bogue dans la traduction de cette page de  manuel,
       veuillez envoyer un message à ⟨debian-l10n-french@lists.debian.org⟩.

                                                                      bzip2(1)

Generated by dwww version 1.15 on Sat Jun 29 01:37:19 CEST 2024.