menu

Syntetiske sundhedsdata kan sikre bedre forebyggelse og behandling

17 dec 2019

Danmark har sammen med de øvrige nordiske lande nogle af de bedste og mest komplette sundhedsdata i verden. I disse data ligger et stort potentiale til at gøre sundhedssektoren i stand til at opspore sygdomme tidligt, stille bedre diagnoser og lave individuelt skræddersyet behandling. Det er imidlertid ikke et potentiale, der uden videre kan indfries. Det skyldes, at det er meget vanskeligt at dele indsamlede sundhedsdata og dermed anvende dem til blandt andet forskning, der går på tværs af områder og landegrænser.

Der er god grund til at have restriktioner på deling af sundhedsdata, da de i udgangspunktet er personhenførbare og dermed følsomme. Den manglende mulighed for at dele data udgør dog et problem for sundhedssektoren, som ønsker at finde nye behandlingsmuligheder ved at analysere de store mængder sundhedsdata, f. eks. i samarbejde med de øvrige nordiske lande. Et nyt forskningsprojekt forankret på Københavns Universitet vil udforske en mulig løsning på dette problem ved at udvikle og forfine en metode, som kan generere syntetiske datasæt ud fra originale data. Novo Nordisk Fonden støtter projektet med 7,5 mio. kroner.

”Danske sundhedsdata kan hjælpe den enkelte patient, men indeholder også vigtig information, som kan komme andre patienter til gavn. Der er et stort behov hos sundhedssektoren for at udvikle nye løsninger på baggrund af de indsamlede data, men det kræver imidlertid ofte, at data kan deles på en mere smidig måde. Syntetiske data kan hjælpe med at opfylde dette behov, fordi de baserer sig på originale data, men er renset for alle detaljer, der kan føres tilbage til de originale data og dermed de personer, som afgav dem,” siger Henning Langberg, Professor ved Institut for Folkesundhedsvidenskab, Københavns Universitet, og modtager af bevillingen fra Novo Nordisk Fonden.

Open source-tilgang skal sikre kvaliteten
Projektet, som hedder Synthetic Health And Research Data (SHARED), er et proof of concept-projekt, der skal vise, at det er muligt at finde en metode, som faktisk kan transformere originale data til syntetiske data på en måde, så det bliver umuligt at spore dem tilbage til ophavspersonerne. De syntetiske data bliver skabt ved, at et originalt datasæt køres igennem et matematisk program, som lægger støj på datasættet på en måde, så de syntetiske data ikke kan henføres til konkrete personer og samtidig bibeholder en spredning og sammenhæng, som gør dem statistisk valide. Det giver mulighed for at dele data uden at gå på kompromis med datasikkerheden.

”En gennemarbejdet og sikker model, der kan generere syntetiske data, kan hjælpe med at udnytte det store potentiale, der ligger i udlede nye sammenhænge fra vores fælles sundhedsdata på en forsvarlig og sikker måde. Resultaterne fra projektet kan få stor betydning for både forebyggelse og behandling, ikke bare i den danske sundhedssektor, men i hele Norden,” siger Niels-Henrik von Holstein-Rathlou, Head of Biomed, Novo Nordisk Fonden.

Sammen med de finske samarbejdspartnere Turku University Hospital og Institute for Molecular Medicine Finland (FIMM) skal Henning Langberg både arbejde med at udvikle en matematisk metode, som kan omdanne de originale data til syntetiske data, og med at afprøve de udviklede metoder og modeller i et såkaldt testbatteri, hvor det er muligt at teste, hvor godt de syntetiske data ligner de oprindelige data.

”Den store udfordring for os er, at få så mange parametre som muligt med i programmet, så vi får mulighed for at bevare sammenhængen mellem data. Samtidig er det vigtigt for os at have en open source-tilgang til udviklingen af metoden, så det akademiske samfund undervejs kan stille relevante spørgsmål til metoden. Det er nødvendigt, når vi arbejder med et så følsomt og reguleret område, som sundhedsdata er,” forklarer Henning Langberg.

Mere information

Christian Mostrup Scheel, presseansvarlig, Novo Nordisk Fonden, tlf. 3067 4805, cims@novo.dk

Henning Langberg, professor, Københavns Universitet, tlf. 2612 7913, langberg@sund.ku.dk

Syntetiske data kan være et af svarene på, hvordan sundhedssektoren indfrier det store potentiale, der ligger i datadeling. Novo Nordisk Fonden støtter nyt forskningsprojekt, der arbejder hen imod en metode, som kan generere syntetiske data ud fra originale data uden at gå på kompromis med datasikkerheden.