Ansøg om midler

Kunstig intelligens skal kortlægge danskernes stamtræ og styrke forskning

Med støtte fra Novo Nordisk Fonden går Rigsarkivet i gang med at udvikle et nyt multigenerationsregister over danskernes familierelationer siden 1920. Dette sker ved hjælp af kunstig intelligens til læsning af kirkebøger. Registret skal styrke forskning i Danmark og vil kunne give større indsigt i, hvordan arvelige og familiære forhold påvirker bl.a. sundhed og den sociale livsbane.

Dansk forskning er internationalt førende og anerkendt for at kunne analysere meget lange tidsserier med historiske data fra registre, biobanker og historiske arkiver. Oplysningerne kan sammenstilles via CPR-nummeret – dog med den klare begrænsning, at undersøgelser af sundhed og social mobilitet i dag kun kan belyses gennem et par generationer, da slægtsskab i CPR-registret kun er registreret for børn født fra 1960 og frem.

Med skabelse af et nyt epokegørende multigenerationsregister vil Rigsarkivet nu gå skridtet videre og skabe mulighed for at forske på tværs af generationer i et meget længere perspektiv, så data kan bindes sammen fra tiden før CPR-registret. Multigenerationsregistret vil kunne identificere slægtskab mellem alle danskere født helt tilbage fra 1920. Dermed bliver der mulighed for at forske i arvelige og familiære forholds betydning for bl.a. sundhed og sygdom.

Kulturminister Joy Mogensen udtaler:

”Det er fantastisk, at Novo Nordisk Fonden med sin store donation gør det muligt at åbne et nyt kapitel i vores sundhedsforskning. Med det nye multigenerationsregister vil forskere kunne studere data og fænomener over flere generationer. Dermed får vi ny viden og resultater, som ikke er set før inden for sundhedsforskning, og digitaliseringen gør det samtidig lettere at bruge den nye viden og information i lang tid fremover.”

Niels-Henrik von Holstein-Rathlou, Senior Vice President i Novo Nordisk Fonden siger:

”Med støtten til etablering af multigenerationsregistret ønsker Novo Nordisk Fonden at bidrage til at øge værdien af de danske sundhedsregistre og samtidig løfte dataforskning og forskningen inden for kunstig intelligens i Danmark. Registeret vil styrke mulighederne for at bedrive sundheds- og socioøkonomisk forskning på tværs af bredere familierelationer. Derudover indeholder udviklingen af nye algoritmer inden for kunstig intelligens til læsning af de håndskrevne kirkebøger et stort potentiale for senere også at kunne anvendes til at digitalisere andre historiske datakilder i Rigsarkivet eller andre steder.”

Multigenerationsregistret bliver muliggjort af en bevilling på 38 mio. kr. fra Novo Nordisk Fonden. Det er Rigsarkivet, der skal lede projektet i samarbejde med forskere fra Aarhus, Københavns Universiteter og Det Koordinerende Organ for Registerforskning (KOR).

Etablering af familierelationer
Det nye multigenerationsregister vil binde oplysninger om familierelationer for personer fra CPR-registret sammen med de mange ældre oplysninger fra kirkebøger, så der kan etableres familierelationer mellem alle danskere siden 1920. Det skal ske i samarbejde med forskere fra Center for Registerforskning ved Aarhus Universitet, der bliver ansvarlige for at linke de rigtige individer sammen på tværs af CPR og de historiske kirkebøger.

Mange sociale og sundhedsmæssige problemer formodes at kunne forklares ud fra familiære forhold, så der er vigtig viden at hente, hvis forskerne får mulighed for at studere fænomener over 3-5 generationer. Det vil kunne give langt større indsigt i, hvordan arvelige og familiære forhold påvirker bl.a. sundhed og den sociale livsbane, og denne viden vil forskningen kunne bruge til at udvikle bedre behandlinger, herunder udvikling af personlig medicin, samt forebyggelse af sociale og helbredsmæssige vilkår.

Professor Henrik Toft Sørensen, Formand KOR, der har været med til at udarbejde ansøgningen på baggrund af et stort pilotstudie udtaler:

”Et multigenerationsregister vil uden tvivl kunne tilføre dansk forskning helt nye perspektiver og resultater til gavn for os alle. Der kan skabes ny viden til gavn for befolkningen og samtidig vil det give den danske forskning en betydelig konkurrencefordel i international sammenhæng.”

Analoge kilder digitaliseres med AI
I arbejdet med at linke CPR-registret til oplysninger fra Rigsarkivets kirkebøger, vil forskere fra Københavns Universitets Center for AI udvikle algoritmer, der kan tyde de håndskrevne kirkebøger. Det er et vanskeligt arbejde, for der er mange forskellige håndskrifter i kirkebøger fra godt 2000 sogne over en periode på knap 60 år. Algoritmerne skal trænes dels på manuelt indtastede kirkebøger og dels på et datasæt, der kombinerer oplysninger om navne og datoer fra kirkebøgerne med den digitale gengivelse i CPR-registret.

Rigsarkivar Anne-Sofie Jensen udtaler:

”Vi glæder os utroligt meget til at komme i gang – ikke mindst med arbejdet med kunstig intelligens og historiske håndskrifter, der åbner op for nye spændende muligheder for Rigsarkivet og vores brugere. Multigenerationsregistret er et godt eksempel på, hvor vigtigt det er, at Rigsarkivet bevarer data og dokumenter fra den offentlige administration, så de kan bruges i nye sammenhænge til gavn for det danske samfund. Sammen med vores unikke, danske sundhedsdata bliver multigenerationsregistret en forskningsressource uden sidestykke, og jeg tror slet ikke, vi kan forestille os, den forskel registret vil gøre for dansk forskning.”

Yderligere information
Koordinering af opfølgende interviews: Presseansvarlig i Rigsarkivet: Julie Avery, [email protected], tlf. 4171 7241.

Christian Mostrup, pressechef, Novo Nordisk Fonden, tlf.: 3067 4805, [email protected]

Oplysninger om multiregistret: Specialkonsulent i Rigsarkivet, Jeppe Klok Due, [email protected], tlf. 4171 7211.

Pressefotos: https://www.mynewsdesk.com/dk/rigsarkivet/latest_media