- CS-A0100
- 2. Wikipedia-projekti
- 2.3 Tiedonpakkaus ja purku
Tiedonpakkaus ja purku¶
Koska tiedosto on hyvin iso, se on pakattu bzip2-ohjelmalla; näet tämän siitä, että tiedoston nimen lopussa on pääte .bz2. Bzip2 on eräs nykyään yleisesti käytettyjä tiedonpakkausohjelmia (toinen vastaava ohjelma on gzip, jonka tunnistaa päätteestä .gz).
Katso ensin pakatun tiedoston koko (ls -l) ja ota tämä tieto talteen (tarvitset sitä pian). Helpoiten tämä onnistuu yksinkertaisesti ohjaamalla ls-komennon tuloste sopivaan tiedostoon, vaikkapa näin:
ls -l > ennen-purkua.txt
Puretaan nyt tiedosto:
bunzip2 fiwiki.txt.bz2
Tämä komento purkaa tiedonpakkauksen, luo tiedoston fiwiki.txt, jossa on alkuperäinen sisältö, ja lopuksi poistaa pakatun tiedoston fiwiki.txt.bz2, jota emme enää tarvitse.
Tarkista nyt (ls -l), minkä kokoinen tiedosto on purkamisen jälkeen.
Voisit halutessasi pakata tiedoston uudestaan komennolla bzip2 fiwiki.txt, mutta emme nyt tee sitä, vaan siirrymme seuraavaksi tutkimaan tiedoston sisältöä…