Dataguiden, Vetenskapsrådet, startsida
Dataguiden, Vetenskapsrådet, startsida

Fällor och framgångsrecept vid datauttag från flera olika källor

Det kan bli en lång och tidskrävande resa när forskningen kräver registerdata från flera olika källor. Jonas Björk, professor i epidemiologi vid Lunds universitet, vet vad som underlättar.

Porträtt på Jonas Björk. I bakgrunden en tavla med hus.

Ha tidigt en klar bild över vad du behöver. Var smart angående detaljnivån i uppgifterna och använd de stödstrukturer som finns.

Jonas Björks forskning har fokus på folkhälsofrågor, och han har också ett brinnande intresse för metodfrågor inom epidemiologisk forskning. Genom åren har han skaffat sig en gedigen erfarenhet av att hantera data från flera olika register. Många av hans studier baseras på uppgifter från olika hälsodataregister som har samkörts med uppgifter från befolkningsregister.

– Det är många steg i processen när data från flera olika datakällor ska begäras ut och länkas. Så det gäller att vara medveten om att startsträckan är lång, säger han.

I många fall krävs ett godkännande av etikprövningsmyndigheten, exempelvis om journaldata, uppgifter om hälsa eller andra känsliga personuppgifter ska hanteras.

– Etikprövningen är grunden för att kunna genomföra projektet, och fungerar sedan som input till sekretessprövningen som alla registerhållare gör. Så redan vid etikprövningen behöver du kunna beskriva nyttan av studien och precisera vilka data den kräver, säger han.

Tydlig motivering behövs

Att tidigt bestämma och kunna motivera vilka data som behövs för att besvara forskningsfrågan är avgörande för att få en så smidig process som möjligt, betonar Jonas Björk. Det gäller att tänka till ordentligt kring detaljnivån i uppgifterna som du begär ut, annars kan det bli onödiga stopp på vägen.

– Som forskare är det bra att vara pragmatisk, och fundera på när det är viktigt med detaljerade uppgifter och när det räcker med mer grovkorniga data. Om du är alltför allmän i din begäran, utan att det tydligt framgår varför detta krävs för att besvara forskningsfrågan, kommer du sannolikt att hamna i diskussioner med registerhållaren. Registerhållaren behöver ju ta hänsyn till både sekretesskrav och uppgiftsminimering, det vill säga att inte lämna ut uppgifter ”i onödan” om de inte motiveras av forskningsfrågan, säger han.

Jonas Björk tycker det är bra att ta kontakt med registerhållarna redan i planeringsstadiet av projektet. Särskilt om det finns en osäkerhet kring vilka data som finns och kan begäras ut.

– Det finns mycket hjälp att få för att kunna förstå registren. Ibland har registerhållarna särskilda kontaktpersoner som kan beskriva innehållet, och de flesta större registerhållare, som SCB eller Socialstyrelsen, har bra webbsidor med information om registren och vilka variabler de innehåller. Registerhållaren kan dessutom ofta svara på hur du ska formulera dig för att öka möjligheten för att din begäran ska accepteras och materialet ska lämnas ut, säger han.

Samarbete och stöd kan effektivisera arbetet

Jonas tipsar också om att söka efter kunskap och stöd på det egna lärosätet. Många universitet och högskolor erbjuder rådgivning och stöd åt sina forskare angående datauttag från register och hantering av forskningsdata. Det kan också vara bra att ta kontakt med registercentrum samt forskarmiljöer och forskarnätverk på lärosätena, som har erfarenhet av registeranvändning inom det aktuella forskningsområdet. Att hitta givande samarbeten kan göra arbetet smidigare och mer tidseffektivt.

– Att hantera en etikprövning och samköra data från flera olika källor är komplext, och bygger på att du som forskare har viss erfarenhet. Om du inte är så van vid att använda register kan det vara en god idé att leta efter möjliga samarbeten. Då kan forskningsprocessen bli effektivare och du kan lättare undvika misstag och fallgropar i datahanteringen, säger han.

Det här gäller framför allt om du ska hämta in uppgifter från andra register än dem du normalt använder, påpekar Jonas Björk.

– Säg exempelvis att du vill hitta lämpliga uppgifter om tidigare sjuklighet hos personer som deltar i en befolkningsundersökning, och du inte har tidigare erfarenhet av att använda register för att sammanfatta graden av sjuklighet. I en sådan situation är det lätt att begå rena nybörjarfel i registeranvändningen. Som tur är finns det ofta otroligt mycket kunskap från andra forskare som har erfarenhet av att hitta bra variabler och definitioner i registerdata för det du vill hämta in uppgifter om.

Komplex länkning kräver kunskap och resurser

Om väldigt omfattande datamängder ska samköras krävs mycket tid, men också viss datakompetens. Ibland kan det helt enkelt bli för mycket, och för svårt, för forskare att hantera länkningen själv.

– Data lämnas vanligen ut som en uppsättning separata filer, och länkningen som ska göras är komplex och kräver extrem noggrannhet. Om det handlar om större registerstudier kan den kompetensen därför behöva säkras. Vissa projekt tar in en särskild datahanterare, någon som är expert på att länka samman data till en forskningsdatabas, säger han.

En annan sak som är viktig att tänka på är hur lagringen av de stora datamängderna kan hanteras.

– När data lämnas ut elektroniskt krävs att lärosätet har bra lösningar och säkra servrar för detta. Det brukar fungera bra, men det är viktigt att följa lärosätets rutiner kring datahanteringen. Exempelvis måste man ange vilka av forskarna i projektet som ska ha tillgång till uppgifterna, säger Jonas, och fortsätter:

– En annan lösning är att all data stannar på en server hos registerhållaren, och forskaren får ett konto för att kunna logga in på just den ytan. SCB erbjuder tjänsten MONA (Microdata Online Access), som är en plattform för tillgängliggörande av mikrodata. Om ett projekt använder data från andra registerhållare kan man höra med SCB om även dessa data kan lagras och tillgängliggöras via MONA-tjänsten.

Undersök möjligheterna med kohortstudier

Jonas påpekar att det i vissa fall kan finnas möjlighet att få svar på en forskningsfråga med hjälp av insamlade data från en redan genomförd studie.

– De flesta större lärosäten har pågående kohortstudier, som över tid följer grupper av individer som frivilligt har anmält sig till studien. De kan vara en bra källa för många forskningsfrågor. Samtidigt bör man vara medveten om att de juridiska aspekterna kring datauttag från en befintlig studie inte är okomplicerade.

Återanvändning av redan insamlade data i ny forskning behöver även den ske i enlighet med gällande etikprövningslagstiftning. Det är också bra tidigt i processen kontakta ansvariga för aktuell kohortstudie för att diskutera vilken data som finns och möjlighetern att ta del av den.

Positiv utveckling för registerforskning

Även om stora registerbeställningar kan vara både tidskrävande och komplexa tycker Jonas att förutsättningarna i Sverige för att bedriva forskning med hjälp av hälso- och registerdata har förbättrats något under senare år.

– Under pandemin blev det tydligt vilka begränsningar som fanns, men nu händer en hel del både i Sverige och inom EU för att förbättra förutsättningarna för att bedriva forskning och utveckling med hjälp av register. Det är en glädjande utveckling som är bra både för oss som forskar och för samhället, säger han.

Text: Ulrika Ernström

Fler tips för effektiv registerforskning

  • Journaldata vs hälsodataregister. Journaldata är rika på detaljerade uppgifter, men utmaningen är att informationen är ostrukturerad och ofta består av anteckningar i löpande text. Journaldata kan vara bra för mindre studier där uppgifter behövs som inte finns i vanliga register, men lämpar sig mindre väl för större registerstudier. Dessutom är datauttaget särskilt känsligt och omgärdat av mer grannlaga etiska överväganden.
  • Prenumerationstjänster kan underlätta. Många registerhållare, som Socialstyrelsen, har prenumerationstjänster som ger möjlighet att löpande få nya uppföljningsdata för forskningsstudier som löper över flera år. Smidigt för att göra studier över tid, och innebär att du slipper vänta i en kö för att få ut uppdaterade data.
  • Kvalitetsregister, som används för att följa upp kvaliteten inom vård- och omsorg, kan vara en rik källa till data för specifika patientgrupper. Det finns drygt 100 nationella kvalitetsregister i Sverige som innehåller detaljerade data om patienters vård och behandlingar inom olika sjukdomsområden. Informationen kan inkludera allt från diagnoser, behandlingstyper och medicinering till resultat av behandlingarna och upplevelser av vården.
  • Stödfunktioner kan vara värdefulla i forskningsarbetet. Det finns exempelvis möjlighet att vända sig till det egna lärosätet samt regionala registercentrum för att få rådgivning och stöd med datauttag från register och hanteringen av forskningsdata. Regionala ingångar för utlämnande från journaler och övriga regionala stödfunktioner finns samlade hos Kliniska Studier Sverige. Dessa uppgifter är komplexa och tidskrävande att begära ut eftersom det inte finns nationella register utan enbart register på lokal nivå.

Källa: Jonas Björk, professor i epidemiologi vid Lunds universitet

Publicerat den

Uppdaterat den