Lista datajournalistin työkaluista

Minulta kysytään usein, mitä työkaluja datajournalistin pitää osata. Vastaan aina, että työkalujen löytäminen on datajournalistin tärkein ammattitaito, mutta Excel on kaiken pohja.

Olen luennoimassa Metropoliassa datajournalismista, ja luennolle laadin listan tarvittavista työkaluista. Tästä voisi olla iloa muillekin.

Työ jakaantuu neljään vaiheeseen: datan hankkimiseen, puhdistamiseen, analysointiin ja visualisointiin. Joka vaiheessa  tarvitaan omia työkaluja.

Datan hankkiminen. Tärkein työkalu on nettiselain, koska iso osa datasta on netissä. Välillä voi joutua pyytämään, jolloin puhelin ja sähköposti ovat käteviä. Välillä, jos dataa louhitaan, niin Scraperwiki ja OutWit Hub ovat skräppäämiseen hyviä välineitä.

Jos data tulee avoimen rajapinnan kautta, JSONin ymmärtämisestä on iso etu.

Datan puhdistaminen. Excel on ykkösvalinta. Usein sillä näkee, mitkä osat datasta eivät kuulu joukkoon. Google Refinessä on monia hyviä työkaluja kirjoitusvirheiden löytämiseksi.

Jos puhdistaminen sisältää myös datojen yhdistelemisen, tietokantaohjelma Access on kullan arvoinen. Jotain datoja ja koordinaatistoja olen yhdistänyt GeoJSON-muotoon myös varta vasten kirjoittamillani Ruby-ohjelmilla.

Datan analysoiminen. Edelleen: Excel on tärkein. Kynä, paperi ja laskukone on toiseksi tärkein työväline. Ja vaikka Excelin pivot-taulukot ovat hyviä, niillä ei pysty tekemään ihan kaikkea (tai ainakaan minä en pysty). Silloin käytän Accessia.

Datan visualisoiminen. Visualisoiminen on näkyvin osa datajournalismia, ja siksi usein visualisointityökaluja pidetään alan ainoina välineinä.

Aloittelijoille suosittelisin Infogr.amia ja Tableau Publicia erilaisten käppyröiden tekemiseen. Karttoja voi tehdä Google Fusion Tablesilla ja kyselyitä Google Docsin formeilla.

Kehittyneemmässä vaiheessa Highcharts yhdistettynä Datawrapperiin mahdollistaa monipuolisempien käppyröiden tekemisen. Jos taas haluaa tehdä visuaalisesti näyttäviä, omalaatuisia grafiikoita, kannattaa tutustua Raphaëliin ja D3:n. Karttojen tekemiseen ykköstyökalu on Leaflet.

Kollegat, kommentoikaa: Mitä työkaluja te käytätte ja mitä olen unohtanut?

2 Comments

  1. Jussi Tuulensuu
    Feb 05, 2013 @ 07:35:48

    Hei, Esa! Hieno kirjoitus!

    Visualisoinnista puuttuu kaikkein tärkein eli E. Tuften The Visual Display of Quantitative Information. http://www.edwardtufte.com/tufte/books_vdqi

    Jussi

    Reply

  2. Pekka S
    Feb 05, 2013 @ 12:37:11

    Kyllä journalistilla pitäisi myös Quantum GIS pysyä kädessä (www.qgis.org). Sillä ehkä helpoint tehdä perus-paikkatietoanalyysit. Käyttöliittymä löytyy suomeksi.

    Leaflet on tietysti hyvä väline web-visualisointiin, OpenLayers (http://openlayers.org/) taas monipuolisempi (ja monimutkaisempi) väline.

    Informaatiomuotoilun jepeiltä voisi kysyä muita Desktop visualisointi-työkaluja. Inkscape ja Blender tulevat mieleen.

    P

    Reply

Leave a Reply

*