GZIP(1) | General Commands Manual | GZIP(1) |
gzip, gunzip, zcat - kompresuje i dekompresuje pliki
gzip [ -acdfhklLnNrtvV19 ]
[-S rozszerzenie] [ nazwa ... ]
gunzip [ -acfhklLnNrtvV ] [-S\fP rozszerzenie]
[ nazwa ... ]
zcat [ -fhLV ] [ nazwa ... ]
Gzip redukuje rozmiar podanych plików używając algorytmu Lempel-Ziv (LZ77). Zawsze, jeżeli jest to możliwe, do nazwy pliku dodawane jest rozszerzenie .gz, przy zachowaniu informacji o właścicielu pliku, trybie dostępu, oraz czasie dostępu i modyfikacji. (Domyślnym rozszerzeniem nazwy pliku jest .z dla MSDOS, OS/2 FAT, Windows NT FAT i Atari). Jeżeli nie podano nazwy żadnego pliku, lub podano nazwę "-", dane do kompresji pobierane są ze standardowego wejścia, a po skompresowaniu zapisywane na standardowe wyjście. Gzip kompresuje jedynie zwykłe pliki. W szczególności ignoruje dowiązania symboliczne.
Jeżeli nazwa skompresowanego pliku jest za długa dla systemu plików, gzip obcina ją. Gzip usiłuje obcinać jedynie części nazw plików dłuższe niż 3 znaki. (Część nazwy pliku znajduje się pomiędzy kropkami). Jeżeli nazwa składa się tyko z krótkich części, obcinane są najdłuższe z nich. Na przykład, jeżeli długość nazwy plików jest ograniczona do 14 znaków, gzip.msdos.exe jest kompresowane do gzi.msd.exe.gz. Jeżeli w systemie plików nie ma ograniczenia długości nazwy pliku, nazwa nie jest obcinana.
Domyślnie gzip zachowuje oryginalną nazwę pliku oraz czas modyfikacji i dostępu wewnątrz skompresowanego pliku. Jest ona używana podczas dekompresji z opcją -N. Jest to użytecznie, gdy nazwa skompresowanego pliku została obcięta lub czas modyfikacji nie został zachowany po transferze pliku.
Skompresowane pliki mogą być odtworzone do pierwotnej postaci przy użyciu poleceń gzip -d, gunzip lub zcat. Jeżeli oryginalna nazwa pliku zachowana wewnątrz pliku skompresowanego nie może być odtworzona w danym systemie plików, na podstawie oryginalnej nazwy tworzona jest nowa.
Gunzip uruchamiany jest z listą plików w linii poleceń. Następnie każdy plik, którego nazwa kończy się rozszerzeniem .gz, -gz, .z, -z lub _z (wielkość znaków bez znaczenia) i w nagłówku pliku znajduje się prawidłowa liczba (magic number) jest dekompresowany i zastępowany oryginalnym plikiem bez jednego z powyższych rozszerzeń. Gunzip rozpoznaje też specjalne rozszerzenia nazw plików .tgz i .taz jako skróty dla, odpowiednio, .tar.gz i .tar.Z. Podczas kompresji pliku z rozszerzeniem .tar, jeżeli jest to konieczne, gzip używa rozszerzenia .tgz zamiast obcinania nazwy pliku.
Gunzip może dokonać dekompresji plików stworzonych przez programy gzip, zip, compress, compress -H lub pack. Format pliku wejściowego jest rozpoznawany automatycznie. Podczas dekompresji plików w pierwszych dwóch formatach gunzip sprawdza 32-bitową sumę kontrolną CRC. W wypadku plików stworzonych przez programy pack i gunzip sprawdzana jest długość zdekompresowanego pliku. Standardowy format programu compress nie umożliwiał kontroli poprawności. Jednak niekiedy gunzip jest w stanie wykryć uszkodzony plik .Z. Jeżeli w trakcie dekompresji takiego pliku pojawią się błędy, nie należy sądzić, że plik jest w porządku, bo program uncompress nie zgłaszał problemów. Oznacza to tylko, że uncompress nie kontroluje poprawności plików wejściowych. Format plików compress -H systemu SCO (kompresja metodą LZH) również nie obsługuje kontroli poprawności, lecz także możliwe jest podstawowe sprawdzenie spójności pliku.
Pliki stworzone przez program zip mogą być zdekompresowane tylko, jeżeli w archiwum .zip znajduje się jeden plik i jest on skompresowny metodą 'deflation'. Jest to opcja przeznaczona do konwersji plików .tar.zip do formatu .tar.gz. Aby zdekompresować plik .zip zawierający pojedynczy plik, można użyć poleceń gunzip < foo.zip czy gunzip -S .zip foo.zip.Do dekompresji archiwów .zip zawierających więcej niż jeden plik należy użyć programu unzip zamiast gunzip.
Zcat działa tak samo, jak gunzip -c. (W niektórych systemach zcat może być zainstalowany jako gzcat, aby zachować oryginalne dowiązanie do programu compress). Zcat dekompresuje pliki z listy podanej w linii poleceń lub pobiera dane ze standardowego wejścia, a następnie zapisuje zdekompresowane dane na standardowym wyjściu. Zcat dokonuje dekompresji plików po sprawdzeniu, że w nagłówku pliku znajduje się właściwa liczba (magic number); nie jest wymagane, aby nazwa pliku miała rozszerzenie .gz.
Gzip korzysta z algorytmu Lempel-Ziv użytego w programach zip i PKZIP. Wydajność kompresji zależy od wielkości danych wejściowych oraz rozmieszczenia w danych jednakowych podciągów. Dane takie, jak kod źródłowy lub tekst w języku angielskim są zwykle redukowane o 60-70%. Osiągany stopień kompresji jest przeważnie dużo większy niż przy użyciu kodowania LZW (używanym przez program compress), Huffmana (pack) lub adaptywnym kodowaniu Huffmana (compact).
Kompresja jest przeprowadzana zawsze, nawet jeżeli plik wyjściowy jest większy niż oryginalny. W najgorszym przypadku narzut może wynosić kilka bajtów dla nagłówka i 5 bajtów dla każdego bloku o długości 32K. Ewentualnie współczynnik powiększenia pliku może wynosić 0,015% dla bardzo dużych plików. Należy zauważyć, że prawie nigdy nie zwiększa się liczba bloków używanych przez plik na dysku. Gzip zachowuje tryb dostępu, właściciela pliku oraz czas dostępu i modyfikacji pliku podczas kompresji i dekompresji.
compressed size: rozmiar skompresowanego pliku
uncompressed size: rozmiar zdekompresowanego pliku
ratio: współczynnik kompresji (0.0% jeżeli nieznany)
uncompressed_name: nazwa zdekompresowanego pliku
Rozmiar zdekompresowanego pliku jest wypisywany jako -1 dla plików nie będących w formacie gzip, jak na przykład pliki .Z. Aby poznać rozmiar takiego pliku po dekompresji, można użyć polecenia:
zcat file.Z | wc -c
Po podaniu również opcji --verbose dodatkowo są wyświetlane następujące informacje:
method: metoda kompresji
crc: 32-bitowa suma kontrolna CRC zdekompresowanych danych
date & time: pole daty/czasu oryginalnego pliku
Aktualnie dostępne metody kompresji to deflate, compress, lzh (SCO compress -H) oraz pack. Suma CRC dla plików w formacie innym niż gzip jest podawana jako ffffffff.
Po podaniu opcji --name podawane są dane oryginalnego pliku zawarte w pliku skompresowanym (nazwa, data/czas), jeżeli zostaną tam znalezione.
Po podaniu opcji --verbose wyświetlany jest wspólny rozmiar i współczynnik kompresji wszystkich plików, chyba że nie dla wszystkich plików te dane są dostępne. Po podaniu opcji --quiet linie nagłówka i podsumowania nie są wyświetlane.
Przy dekompresowaniu dodaje .suf na początku listy rozszerzeń do wypróbowania, przy tworzeniu nazwy pliku wyjściowego z nazwy pliku wejściowego.
Skompresowane pliki mogą być ze sobą łączone; w takim wypadku gunzip zdekompresuje wszystkie pliki jednocześnie. Na przykład:
gzip -c plik1 > foo.gz
gzip -c plik2 >> foo.gz
Następnie
gunzip -c foo
jest równoznaczne z
cat plik1 plik2
W wypadku, gdy jeden z połączonych plików zostanie uszkodzony, pozostałe wciąż mogą być odzyskane (po usunięciu uszkodzonego pliku). Jednak znacznie lepsze efekty daje jednoczesne kompresowanie wszystkich plików:
cat plik1 plik2 | gzip > foo.gz
daje lepsze wyniki kompresji niż
gzip -c plik1 plik2 > foo.gz
Aby ponownie skompresować połączone ze sobą pliki w celu uzyskania lepszej kompresji, należy wykonać polecenie:
gzip -cd stary.gz | gzip > nowy.gz
Jeżeli skompresowny plik został utworzony z kilku plików, informacje o rozmiarze i sumie CRC uzyskane opcją --list dotyczą tylko ostatniego pliku. Informację orozmiarze wszystkich plików po dekompresji można uzyskać przy pomocy polecenia:
gzip -cd plik.gz | wc -c
Jeżeli chcesz umieścić w archiwum kilka plików, a następnie mieć możliwość oddzielnego ich odzyskania, użyj programów takich jak tar lub zip. Tar w wersji GNU obsługuje opcję -z, która powoduje wywołanie programu gzip w sposób niewidzialny dla użytkownika. Gzip został zaprojektowany jako uzupełnienie programu tar; nie może go zastąpić.
The obsolescent environment variable GZIP can hold a set of default options for gzip. These options are interpreted first and can be overwritten by explicit command line parameters. As this can cause problems when using scripts, this feature is supported only for options that are reasonably likely to not cause too much harm, and gzip warns if it is used. This feature will be removed in a future release of gzip.
You can use an alias or script instead. For example, if gzip is in the directory /usr/bin you can prepend $HOME/bin to your PATH and create an executable script $HOME/bin/gzip containing the following:
#! /bin/sh
export PATH=/usr/bin
exec gzip -9 "$@"
znew(1), zcmp(1), zmore(1), zforce(1), gzexe(1), zip(1), unzip(1), compress(1)
Format pliku gzip jest opisany w: P. Deutsch, GZIP file format specification version 4.3, <https://www.ietf.org/rfc/rfc1952.txt>, Internet RFC 1952 (maj 1996). Format deflacji zipjest opisany w: P. Deutsch, DEFLATE Compressed Data Format Specification version 1.3, <https://www.ietf.org/rfc/rfc1951.txt>, Internet RFC 1951 (maj 1996).
Kod wyjścia jest normalnie równy 0; jeżeli wystapi błąd, kod wyjścia jest równy 1. Jeżeli wystąpi ostrzeżenie, kod wyjścia jest równy 2.
zcat file > recover
When writing compressed data to a tape, it is generally necessary to pad the output with zeroes up to a block boundary. When the data is read and the whole block is passed to gunzip for decompression, gunzip detects that there is extra trailing garbage after the compressed data and emits a warning by default. You can use the --quiet option to suppress the warning.
Format gzip reprezentuje rozmiar wejścia modulo 2^32, a więc opcja --list zwraca niepoprawne rozmiary i współczynniki kompresji dla nieskompresowanych plików o rozmiarze 4 GB i większych. Aby obejść ten problem i poznać prawdziwy rozmiar dużego nieskompresowanego pliku, można wydać następujące polecenie:
zcat file.Z | wc -c
Opcja --list wypisuje rozmiar jako -1 i CRC jako ffffffff, jeżeli plik znajduje się na nośniku o dostępie sekwencyjnym.
Niekiedy (rzadko) zdarza się, że kompresja z opcją --best daje gorsze rezultaty niż z opcją domyślną (-6). Niektóre pliki, w których powtarza się bardzo dużo sekwencji, są lepiej kompresowane programem compress niż gzip.
Copyright © 1998-1999, 2001-2002, 2012, 2015-2018 Free
Software Foundation, Inc.
Copyright © 1992, 1993 Jean-loup Gailly
Permission is granted to make and distribute verbatim copies of this manual provided the copyright notice and this permission notice are preserved on all copies.
Permission is granted to copy and distribute modified versions of this manual under the conditions for verbatim copying, provided that the entire resulting derived work is distributed under the terms of a permission notice identical to this one.
Permission is granted to copy and distribute translations of this manual into another language, under the above conditions for modified versions, except that this permission notice may be stated in a translation approved by the Foundation.
Autorami polskiego tłumaczenia niniejszej strony podręcznika są: Łukasz Kowalczyk <lukow@tempac.okwf.fuw.edu.pl>, Michał Górny <zrchos+manpagespl@gmail.com> i Michał Kułach <michal.kulach@gmail.com>
Niniejsze tłumaczenie jest wolną dokumentacją. Bliższe informacje o warunkach licencji można uzyskać zapoznając się z GNU General Public License w wersji 3 lub nowszej. Nie przyjmuje się ŻADNEJ ODPOWIEDZIALNOŚCI.
Błędy w tłumaczeniu strony podręcznika prosimy zgłaszać na adres manpages-pl-list@lists.sourceforge.net.
podręcznik użytkownika |