flowchart LR
S1["① Kom i gang<br>1 · 2 · 3"] --> S2["② Hent data<br>4 · 5 · 6 · 7 · 8"] --> S3["③ Byg studiet<br>9 · 10 · 11"] --> S4["④ Kode og variable<br>12 · 13"] --> S5["⑤ Analysér og afslut<br>14 · 16"]
S3 -.-> R15["15 · Reference<br>opslag undervejs"]
classDef stage fill:#eaf2fb,stroke:#4a78b5,stroke-width:1px,color:#173a5e;
classDef ref fill:#f6f6f6,stroke:#aaaaaa,color:#555555;
class S1,S2,S3,S4,S5 stage
class R15 ref
Registerbaseret forskning på DST
Hvem er denne guide til, og hvad vil du lære?
Denne vejledning er til alle, der arbejder med registerbaseret forskning på Danmarks Statistik (DST).
Hvor starter du?
Ny til registerforskning?
Start ved fase 1 og følg faserne i rækkefølge — lidt R-erfaring gør starten lettere.
Kender allerede R?
Spring de indledende faser over og gå direkte til serveren, filerne og udtrækkene.
Arbejder på DARTER?
Særlige setup-trin og projektspecifik vejledning.
Leder du efter noget bestemt? Brug søgefeltet øverst til højre på siden — det søger på tværs af hele guiden.
SDS og DST
Som forsker arbejder du på Danmarks Statistiks (DST) servere. DST modtager og bearbejder data fra bl.a. Sundhedsdatastyrelsen (SDS), som har de rå nationale sundhedsregistre (LPR, LMDB, cancerregister mv.), og stiller dem til rådighed for forskere via sikker fjernforbindelse.
Faserne i guiden
Guiden er bygget som 16 faser. Roadmappet viser den naturlige vej igennem fra planlægning til hjemsendelse; tabellen under giver et hurtigt overblik med links. Du behøver ikke læse alt i rækkefølge — brug Fase 15 — Reference som opslag undervejs.
| Fase | Indhold |
|---|---|
| 1 — Planlæg dit studie | Forskningsspørgsmål, nøglebegreber og datamodel |
| 2 — R: det allermest nødvendige | Det minimum af R du skal kunne for at gå i gang |
| 3 — Log ind på DST | Adgang til serveren og det første overblik |
| 4 — Filtyper og indlæsning | Parquet og SAS — formater og konvertering |
| 5 — Udtræk trin for trin | Det universelle udtræksmønster: open_dataset → filter → collect |
| 6 — Første udtræk | Dit første rigtige udtræk med syntetiske data |
| 7 — Inspicér din data | Tjek struktur, typer og fordelinger før analyse |
| 8 — Kend dine registre | Find de rigtige registre til eksponering, udfald og kovariater |
| 9 — Hospitalskontakter (LPR) | LPR2/LPR3 og ICD-koder — 9a forstå · 9b udtræk |
| 10 — Byg din studiepopulation | Kohorte, index-dato, in-/eksklusion og censurering |
| 11 — Saml dine udtræk | Joins, pivots og håndtering af manglende data |
| 12 — God kode-praksis | Struktur, navngivning og reproducerbar kode |
| 13 — Socioøkonomiske variable | Uddannelse, indkomst og beskæftigelse fra registre |
| 14 — Algoritmer og specialpakker | Færdige algoritmer — 14b OSDC · 14c NMI |
| 15 — Reference | Opslag undervejs: funktioner, faldgruber og registre |
| 16 — Eksport og hjemsendelse | Få dine resultater sikkert ud af DST |