Dataguiden, Vetenskapsrådet, startsida
Dataguiden, Vetenskapsrådet, startsida

Identifiera och värdera datakällor

I samband med att forskningsfrågan formuleras är det bra att påbörja inventeringen av tillgängliga datakällor, för att ta reda på vilka data som finns och är relevanta för forskningsprojektet. En väl definierad frågeställning underlättar det kommande arbetet med att identifiera och värdera relevanta datakällor.

De flesta datainnehavare har information på sina webbplatser om vilka data de har och hur de kan begäras ut, inklusive eventuella krav eller formulär som behöver användas. Det kan vara bra att kontakta datainnehavaren tidigt i processen, eftersom de har detaljkunskap om datakällan och kan bidra med värdefull information för planeringen.

Bedöm datakällans tillgänglighet

Vid bedömning av en datakällas tillgänglighet är det bra att reflektera över eller kontrollera om det finns juridiska eller etiska krav eller begränsningar för den data som ska användas för den aktuella forskningen. Exempelvis:

  • Om forskningen kräver godkänd etikprövning, exempelvis vid hantering av känsliga personuppgifter eller uppgifter om lagöverträdelser.
  • Om datan omfattas av sekretess hos datainnehavaren och därmed kräver en sekretessprövning innan den kan lämnas ut för forskning.
  • Om datan omfattas av upphovsrätt, vilket innebär att användning regleras av licenser.

Det är också viktigt att ta reda på om det finns praktiska eller tekniska hinder som kan påverka tillgängligheten till vissa data. Exempelvis:

  • Om data är spridd i olika lokala verksamhetssystem inom samma datainnehavares organisation
  • Om data endast finns tillgängliga i format som är svåra att bearbeta.
  • Om det inte är möjligt att samköra data med andra datakällor eller forskargenererade data.

Har datainnehavaren reglerat utlämnande av data?

Legala krav och datainnehavares rutiner kan påverka möjligheten att få tillgång till data. Privata aktörer omfattas till exempel inte av offentlighetsprincipen och är därmed inte skyldiga att lämna ut data. Vissa datainnehavare har satt upp maxgränser gällande den arbetstid de kan avsätta för ett utlämnande, vilket innebär att de inte utför utlämnanden som överstiger den tiden.

Kan projektet få tillgång till de data som behövs utifrån tid och budget?

Vid planering av resurser, tidsåtgång och kostnader, tänk på följande:

  • Handläggningstiden för utlämnande av data varierar beroende på utlämnandets komplexitet och datahavarens tillgängliga resurser och processer.
  • Ska data från flera datainnehavare länkas eller samköras ökar normalt handläggningstiden.
  • Kostnaden för handläggning av ett ärende skiljer sig mellan olika datainnehavare och påverkas av ärendets komplexitet.
  • Etikgodkännandet upphör om forskningen inte har påbörjats inom två år efter att beslutet vunnit laga kraft.
  • Datahantering och eventuellt tillgängliggörande kan medföra kostnader.
  • Behov av att involvera stödfunktioner under projektets gång.

Bedöm datakällans relevans och användbarhet

För att bedöma datakällans relevans och användbarhet för ett visst projekt är det viktigt att datan är representativ, relevant och användbar för den aktuella frågeställningen. Vid behov är det därför bra att kontakta datainnehavaren för att få svar på följande frågor:

  • Finns tillräckligt med underlag för att möjliggöra statistiskt säkerställda slutsatser?
  • Hur har datan samlats in och med vilken kvalitet?
  • Finns det felkällor vid rapporteringen eller bortfall/saknade värden?
  • Finns det avgörande skillnader över tid, till exempel förändrade variabeldefinitioner eller förändringar i klassifikationer, som kan försvåra longitudinella analyser?

Liknande variabler kan ibland finnas i datakällor hos olika datainnehavare. För att välja den mest lämpade variabeln för att svara på projektets frågeställning kan det vara bra att ta följande i beaktande, samt vid behov fråga datainnehavaren om:

  • datakällorna använder jämförbara begrepp och klassifikationer.
  • datakällorna använder samma definition för den aktuella variabeln.

I syfte att bedöma datakällans relevans och användbarhet kan datainnehavare i vissa fall bistå forskaren med statistik.

Vårdgivare kan också inför klinisk forskning genomföra antalsberäkning, vilket innebär att bistå forskaren genom att ta fram information om hur många personer som uppfyller i förväg angivna kriterier. Resultatet lämnas sedan endast som antal eller intervall – inga personuppgifter eller listor över individer lämnas ut.

Bedöm vilken typ av data som behövs

Vilken typ av uppgifter kommer att behövas och vad det innebär för projektet? Behöver personuppgifter begäras ut, exempelvis i pseudonymiserad form, eller räcker det med anonymiserade uppgifter?

Nästa steg i forskningsdatacykeln

Lagkrav och principer att beakta

Publicerat den

Uppdaterat den