Ennakkotehtävät Tampereen yliopiston datajournalismin kurssille

Opetan datajournalismin kurssilla Tampereen yliopistossa 15.3. Tämä on ennakkotehtävä kurssin opiskelijoille.

Lue luku Introduction teoksesta Data Journalism Handbook.

Hae Maailmanpankin Data Bankista Eurooppaa koskevia työttömyyslukuja ja tee niistä interaktiivinen grafiikka käyttäen Infogr.am-palvelua. Jos haluat lisää vaikeusastetta, käytä Google Fusion Tablesia tai Tableau Publicia. Koodaajat voivat käyttää myös Datawrapperia.

Oppia ohjelmien käyttöön voi hakea täältä.

Päivän harjoituksia varten tarvitset myös Google-tunnukset, joten hanki ne etukäteen. Lisäksi tietokoneessasi on hyvä olla asennettuna Excel, Open Office tai vastaava taulukkolaskentaohjelma.

Postita Infogramista (tai muista) saamasi linkki tämän viestin kommentteihin. Käyn joitain niistä luennolla läpi.

Datajournalismin harjoitus: Analysoi kehitysavun vaikutusta

Luennoin tänään Metropoliassa datajournalismista. Tämä on kurssilaisille tarkoitettu kotitehtävä.

Tee interaktiivinen visualisointi, joka kuvaa Saharan eteläpuolisen Afrikan maiden saamaa kehitysapua ja BKT:n muutosta vuosina 1970-2005, Kysymys on: Miten kehitysapu on vaikuttanut maiden kansantuotteeseen?

Voit toimia esimerkiksi näin:

1) Hae data Maailmanpankin datavarainnosta täältä. Voit valita myös muita indikaattoreita, jos haluat.

2) Puhdista, laske ja analysoi dataa niin, että sinulla on tiedot vuosilta 1970-2005. Voit joutua muuttamaan rajausta, jos datassa on puutteita.

3) Visualisoi dataa käyttäen esimerkiksi Infogr.am tai Google Fusion Tables -palveluita.

Voit vaikeuttaa tehtävää tekemällä työn jollain muulla työkalulla tai ohjelmoimalla itse. Voit myös ottaa vähemmän maita ja vuosia, mikäli työ tuntuu vaikealta.

Deadline tehtävälle on 12.2. kello 12.00. Postita silloin linkki työhösi tämän blogin kommentteihin. Mainitse kommentissasi, jos et halua linkkiä ja tehtävää julkistettavan.

Lista datajournalistin työkaluista

Minulta kysytään usein, mitä työkaluja datajournalistin pitää osata. Vastaan aina, että työkalujen löytäminen on datajournalistin tärkein ammattitaito, mutta Excel on kaiken pohja.

Olen luennoimassa Metropoliassa datajournalismista, ja luennolle laadin listan tarvittavista työkaluista. Tästä voisi olla iloa muillekin.

Työ jakaantuu neljään vaiheeseen: datan hankkimiseen, puhdistamiseen, analysointiin ja visualisointiin. Joka vaiheessa  tarvitaan omia työkaluja.

Datan hankkiminen. Tärkein työkalu on nettiselain, koska iso osa datasta on netissä. Välillä voi joutua pyytämään, jolloin puhelin ja sähköposti ovat käteviä. Välillä, jos dataa louhitaan, niin Scraperwiki ja OutWit Hub ovat skräppäämiseen hyviä välineitä.

Jos data tulee avoimen rajapinnan kautta, JSONin ymmärtämisestä on iso etu.

Datan puhdistaminen. Excel on ykkösvalinta. Usein sillä näkee, mitkä osat datasta eivät kuulu joukkoon. Google Refinessä on monia hyviä työkaluja kirjoitusvirheiden löytämiseksi.

Jos puhdistaminen sisältää myös datojen yhdistelemisen, tietokantaohjelma Access on kullan arvoinen. Jotain datoja ja koordinaatistoja olen yhdistänyt GeoJSON-muotoon myös varta vasten kirjoittamillani Ruby-ohjelmilla.

Datan analysoiminen. Edelleen: Excel on tärkein. Kynä, paperi ja laskukone on toiseksi tärkein työväline. Ja vaikka Excelin pivot-taulukot ovat hyviä, niillä ei pysty tekemään ihan kaikkea (tai ainakaan minä en pysty). Silloin käytän Accessia.

Datan visualisoiminen. Visualisoiminen on näkyvin osa datajournalismia, ja siksi usein visualisointityökaluja pidetään alan ainoina välineinä.

Aloittelijoille suosittelisin Infogr.amia ja Tableau Publicia erilaisten käppyröiden tekemiseen. Karttoja voi tehdä Google Fusion Tablesilla ja kyselyitä Google Docsin formeilla.

Kehittyneemmässä vaiheessa Highcharts yhdistettynä Datawrapperiin mahdollistaa monipuolisempien käppyröiden tekemisen. Jos taas haluaa tehdä visuaalisesti näyttäviä, omalaatuisia grafiikoita, kannattaa tutustua Raphaëliin ja D3:n. Karttojen tekemiseen ykköstyökalu on Leaflet.

Kollegat, kommentoikaa: Mitä työkaluja te käytätte ja mitä olen unohtanut?

Ennakkotehtävä Metropolian datajournalismin kurssille

Opetan datajournalismin kurssilla Metropolia-ammattikorkeakoulussa. Tämä on ennakkotehtävä kurssin opiskelijoille:

Lue luku Introduction teoksesta Data Journalism Handbook.

Hae Tilastokeskuksen sivuilta ajankohtaisia työttömyyslukuja ja tee niistä interaktiivinen grafiikka käyttäen Infogr.am-palvelua. Jos haluat lisää vaikeusastetta, käytä Google Fusion Tablesia tai Tableau Publicia. Koodaajat voivat käyttää myös Datawrapperia.

Tuo 6.2. luennolle linkki, niitä esitetään 2-3. Voit postittaa linkin tämän kirjoituksen kommentteihin.