- CS-A0100
- 2. Wikipedia-projekti
- 2.3 Tiedonpakkaus ja purku
Tiedonpakkaus ja purku¶
Koska tiedosto on hyvin iso, se on pakattu bzip2-ohjelmalla; näet tämän siitä, että tiedoston nimen lopussa on pääte .bz2
. Bzip2 on eräs nykyään yleisesti käytettyjä tiedonpakkausohjelmia (toinen vastaava ohjelma on gzip
, jonka tunnistaa päätteestä .gz
).
Katso ensin pakatun tiedoston koko (ls -l
) ja ota tämä tieto talteen (tarvitset sitä pian). Helpoiten tämä onnistuu yksinkertaisesti ohjaamalla ls
-komennon tuloste sopivaan tiedostoon, vaikkapa näin:
ls -l > ennen-purkua.txt
Puretaan nyt tiedosto:
bunzip2 fiwiki.txt.bz2
Tämä komento purkaa tiedonpakkauksen, luo tiedoston fiwiki.txt
, jossa on alkuperäinen sisältö, ja lopuksi poistaa pakatun tiedoston fiwiki.txt.bz2
, jota emme enää tarvitse.
Tarkista nyt (ls -l
), minkä kokoinen tiedosto on purkamisen jälkeen.
Voisit halutessasi pakata tiedoston uudestaan komennolla bzip2 fiwiki.txt
, mutta emme nyt tee sitä, vaan siirrymme seuraavaksi tutkimaan tiedoston sisältöä…