Suuruusluokkia

Jotta isonkin datan kanssa tulee toimeen, on hyvä oppia hahmottamaan suuruusluokkia.

Paljonko paperille mahtuu dataa ihan tavallisena tekstinä? Kokeile vaikkapa Microsoft Wordissa! Kirjoita tavallista suomenkielistä tekstiä A4-arkille, 11 pisteen Times New Roman -fontilla, 2,5 cm marginaaleilla, normaalilla helppolukuisella rivivälillä. Merkitse tekstikappaleet sisennyksillä. Suunnilleen kuinka monta merkkiä (välilyönteineen) mahtuu yhdelle sivulle?

Ota nyt edellisessä tehtävässä kirjoittamasi yhdelle sivulle mahtuva teksti. Kopioi se tekstieditoriin ja tallenna tekstitiedostoksi (.txt), normaalilla UTF-8-koodauksella. Suunnilleen kuinka monta tavua tiedosto vie?

Nyt meillä on jonkinlainen käsitys siitä, miten tekstitiedoston tavumäärä vastaavat tekstisivuja, tehdään muutama suuruusluokka-arvio.

Miten iso tekstitiedosto olisi tulostettuna suunnilleen 250 sivua?

Suunnilleen minkä kokoisen tekstitiedoston saisi kaksipuoleisina tulosteina sopimaan Aalto-yliopiston tietotekniikan talon isoimpaan luentosaliin (T1)?

Ihmisen genomin kartoittaminen oli yksi massiivisista kansainvälisistä tutkimushankkeista, mutta mietitään hetki, kuinka massiviinen asia ihmisen genomi oikeastaan on?

Tutkimusprojektia varten tarvitsisit ihmisen genomia. Sellaisen saisi ladattua pakattuna tiedostona verkosta. Missähän kokoluokassa liikutaan? Pyri arvioimaan tätä esimerkiksi etsimällä tietoa ihmisen genomin koosta; valitse lähinnä oikeaa oleva suuruusluokka:

Tähän asti olemme tarkastelleet lähinnä tiedon tallentamista, mutta tietoa on usein myös siirrettävä koneelta toiselle. Mietitään hiukan, minkä kokoisen tiedoston saa vielä siirrettyä kohtuuajassa.

Varsin tyypillinen kodin Internet-yhteys voi olla esimerkiksi "100 Mbps", siis 100 megabittiä sekunnissa (huomaa, että verkkoyhteyden nopeutta mitataan yleensä bitteinä eikä tavuina). Arvioi, minkä kokoisen tiedoston voi siirtää tällaisen verkkoyhteyden yli parissa minuutissa? Valitse lähinnä oikeaa oleva suuruusluokka:

Palautusta lähetetään...