Datajournalistik

Qgis – kraftfullt verktyg för nya gräv

Med hjälp av fritt tillgängliga dataset och gratis programvara med öppen källkod går det att göra avancerade gräv inom geodataområdet. Scoop har tittat närmare på analysverktyget Qgis.

Daniel Wiklander

Text och foto

– Jag är väldigt skeptisk till hajpen kring öppen data i Sverige, säger Leonard Wallentin.

Den 8 november i år publicerade Hyresgästföreningens tidning Hem & Hyra ett enkelt men informativt gräv om var i Sverige det är störst risk att få sin cykel stulen. Allra störst risk löper inte helt överraskande den som parkerar sin cykel i centrala Uppsala. Mellan 2014 och 2018 anmäldes över 2 000 cykelstölder i ett område på några få kvadratkilometer mellan centralstationen och Fyrisån – över tusen fler än i Stockholms city som ligger på andra plats i granskningen.

För att sammanställa listan begärde Hem & Hyras reporter Aron Andersson ut en lista på samtliga anmälningar om cykelstölder 2014–2018 från polisen. Med hjälp av SCB:s indelning av landet i demografiska statistikområden kunde han analysera ner på kvartersnivå inom vilka geografiska områden risken för cykelstölder är störst.

För själva analysen använde Aron Andersson analysprogrammet Qgis. Namnet står för Quantum Geographic Information Software, och är ett mycket kraftfullt verktyg för analys av geografiska data. Det har dessutom öppen källkod, och är gratis att ladda hem och använda. Andra alternativ som bygger på samma principer är exempelvis ArcGIS, MapWinGis och Terraview.

Qgis har vissa likheter – dock inte grafiskt – med kalkylprogrammet Excel och dess olika varianter som exempelvis gratisprogrammet OpenOffice, men är specialinriktat på geografiska data.

– Det är viktigt att journalister använder den här typen av verktyg över huvud taget, säger Leonard Wallentin på utbildningsföretaget J++, som specialiserat sig på fortbildning inom datajournalistik, till Scoop.

– Det är viktigt att journalister kan och vågar ställa frågor till data, så att vi inte blir beroende av andra som ska göra det åt oss. Journalister ser nog också på informationen med lite andra ögon.

– Det vara de enkla frågorna, som hur många laddstolpar det finns i en kommun, och i vilka områden.

Självfallet kan Qgis användas även till mer avancerade analyser. Med programmets olika analysmodeller och tillräckligt bra rådata kommer man väldigt långt. Vidare analys kan vid behov sedan göras i vanliga kalkylprogram.

Det går enkelt att hämta in en detaljerad karta i stil med Google Maps eller Open Street Map att ha under lagren med geodata. Båda de lösningarna har den stora fördelen att de inte kostar pengar, och samtidigt ger information som ofta kan innebära en nyckel till att förstå nyhetsvärdet i de data man analyserar – vilka tätorter som ligger inom ett visst område, vilka vägar och vattendrag och så vidare.

Att skaffa rådata kan vara dyrt eller tidskrävande. Mycket finns dock gratis tillgängligt från exempelvis SCB, vilket gör det lätt att komma igång med grävandet i Qgis. I exemplet med cykelstölderna hade reportern hjälp av att SCB:s demografiska statistik-
områden, eller deso-områden, baseras på invånarantal och därför är som mest detaljerade i just storstäder. Därför gick det att komma ned på kvartersnivå och grafiskt visa var i våra största städer man helst ska låta bli att lämna cykeln obevakad.

Viss data tillhandahålls utan kostnad även av andra myndigheter än SCB. Bra, men man måste inse att det kan finnas ett syfte med urvalet, säger Leonard Wallentin.

– Jag är väldigt skeptisk till hajpen kring öppen data i Sverige. Det är lite samma som när Carl Bildt twittrar – myndigheter tar makten över dagordningen genom att göra viss data tillgänglig. Och i och med att vi är beroende av data är det lätt att vi styrs av vilken data som finns tillgänglig.

Vid sidan om öppen data som kommuner och myndigheter tillhandahåller som service finns det andra vägar, säger Leonard Wallentin.

– Myndigheter sitter på en massa geografisk data som man kan försöka begära ut. Det gäller bara att hitta en tjänsteman som förstår frågan. Det finns en enorm osäkerhet kring vad man får lämna ut. Det knäppaste jag varit med om var när Malmö kommun krävde betalt för att lämna ut koordinaterna för sina stadsdelsgränser – med hänvisning till upphovsrätten!

En enkel Qgis-övning är att analysera ett antal händelser på angivna adresser för att se om det går att hitta ett mönster, alltså som polisen gör för att försöka ringa in exempelvis en pyroman. Om vi arbetar efter hypotesen att samma gärningsperson ligger bakom ett antal brott och utgår från sitt hem varje gång, var ungefär borde hen då bo?

Med Qgis går det enkelt att köra en fil med ett antal adresser och få upp dem som punkter på en karta.

– Men se till att skaffa koordinaterna direkt när du sammanställer listan på adresser, säger Leonard Wallentin. Det finns alltid felkällor, som gator som heter samma sak i olika kommuner och så vidare.

Fakta

Qgis

Quantum Geographic Information Software utvecklades av den amerikanske geologen Gary Sherman och den första versionen släpptes 2009.
Qgis är baserat på öppen källkod, vilket innebär att det är fritt att utveckla och använda.
Programmet är gratis och fungerar till både Mac, Windows och Linux. Du laddar ner det här.

Senaste Numret

Prenumerera eller beställ lösnummer

omslag nr 4

Global Investigative Journalism Conference i Göteborg får stor plats även i detta nummer, med bland annat en matig genomgång av de bästa handfasta tipsen som lärdes ut på konferensen.

Läs även om SvD:s Spotifygräv, oligarken som äger en av Sundsvalls största fabriker och journalisterna som jagar en hundplågare i Malmö.

Ute vid lucia.

Beställ här