Kapitel 1. Introduktion

Dette er 1. version af regelsættet for dannelse af fysiske skemaer ud fra grunddata domænemodeller. Reglerne er udarbejdet af en arbejdsgruppe nedsat af Grunddata Arkitekturforum. Indsatsen, der ligger for grund for udarbejdelsen af dette regelsæt, udspringer den "Strategiske rammeplan for Fremtidens Grunddata 2022-2027" og blev udmøntet som del af Handleplanen 2024-2025.

Grunddata er data om personer, ejendomme, adresser, virksomheder, geografi samt vand og klima. De er en vigtig del af den Danmarks fællesoffentlige digitale infrastruktur, som leverer datafundamentet til den offentlige forvaltning og private virksomheder.

Grunddata effektiviserer forvaltningen ved at registreringer foregår i ét register og genbruges i et andet. Det stiller krav til, at data er standardiserede og i høj kvalitet, samt at samarbejdet mellem registre og anvendere er tæt, så der også i fremtiden skabes værdi hos anvenderne.

Data udstilles samlet på én platform, Datafordeleren, og er organiseret i en fællesoffentlig governance med både registre og anvendere.

Udstillingen af grunddata er på logisk niveau dokumenteret ved de enkelte domænemodeller og grunddatamodellen, som reguleres af grunddatamodelreglerne. På fysisk niveau møder anvendere en række data, som følger strukturen defineret i et replikeringsskema. Skemaet definerer, hvordan registerejer strukturerer og overfører data på Datafordeleren. Særligt i forbindelse med etableringen af entitetsbaserede tjenester på den moderniserede Datafordeler, baseres den fysiske udstilling af data på både den logiske datamodel og det fysiske replikeringsskema. For at dette kan muliggøres og de udstillede data er gennemskuelige for anvendere, stiger kravene til sporbarhed og en forståelig sammenhæng mellem replikeringsskemaet og grunddatamodellen.

Hvis replikeringsskemaet dannes på forskellig vis af registerejere, kan det være vanskeligt for anvendere, at opnå tilstrækkelig forståelse af data. Dette regelsæt skal derfor imødekomme anvendere ved at sikre ensartethed mellem den logiske grunddatamodel og det fysiske dataskema. Reglerne stiller krav til struktureringen og dannelsen af det fysiske replikeringsskema, som bruges ved indlæsningen af data på Datafordeleren.

Regelsættet omfatter en samling af minimumskrav og anbefalinger, som deltagerne i arbejdsgruppen under Grunddata Arkitekturforum og registerejere har opnået enighed om og kan med fordel udvides og videreudvikles på et senere tidspunkt, hvis udstillingen af grunddata påkræver dette.

Reglerne blev vedtaget i Grunddata Arkitekturforum i maj 2025 og gælder for samtlige nye domænemodeller der dannes fremadrettet. Reglerne er vejledende for MAJOR og MINOR modelændringer, der fremsendes til konformanstjek og godkendelse i Grunddata Arkitekturforum, og evt. afvigelser skal forklares og motiveres.

Kapitel 2. Læsevejledning

2.1. Formatet på reglerne

Reglerne i dette dokument er i høj grad opstillet i lighed med grunddatamodelreglerne.

Hver regel i dette regelsæt har et tilhørende unikt nummer angivet før hvert regelnavn. Under den specifikke regel følger et afsnit med rationale og implikationer af den pågældende regel. Derefter ses konkrete eksempler, der illustrerer opfyldelsen af reglen. Her bruges det samme gennemgående eksempel fra grunddatamodelreglerne, som kan hjælpe registerejer med at opfylde reglerne.

2.2. Notation

Reglerne følger en standardiseret notation for at skabe en entydig forståelse af hvilke krav, der er til regelopfyldelsen.

Hver regel følger nedenstående notation:

  • skal indikerer, at noget er påkrævet

  • må ikke indikerer, at noget ikke er tilladt

  • må kun eller må kun…​hvis…​ indikerer, at noget er tilladt i tilfælde af en fremsat betingelse

  • må (godt) eller kan (godt) indikerer, at noget er tilladt men ikke påkrævet

  • behøver ikke eller behøves ikke indikerer, at noget ikke er påkrævet

  • bør indikerer, at noget er anbefalet men ikke påkrævet

2.3. Kapitelbeskrivelse

Dokumentet har følgende indhold:

Kapitel 1 - Introduktion

Her beskrives baggrunden for og formålet med regelsættet.

Kapitel 2 - Læsevejledning

Her beskrives indholdet af reglerne og hvordan de læses.

Kapitel 3 - Regler

I dette kapitel opstilles alle reglerne, som har fokus på overgangen fra modellerne til de fysiske skemaer.

Kapitel 4 - Ordliste

Oplistning og forklaring af centrale begreber brugt i regelsættet.

Kapitel 3. Regler for overgang fra model til fysisk skema

3.1. Et modelelement skal have en unik ID

Regel: De modelelementer, der skal repræsenteres i det fysiske skema, skal kunne genfindes via deres unikke element-ID.

Rationale:  Det skal være muligt at kunne forbinde elementer i grunddatamodellen med deres repræsentation i den fysiske udstilling af data. Den entydige kobling er en forudsætning for, at data kan udstilles via entitetsbaserede tjenester.

Note Der kan være modelelementer i den logiske datamodel, som ikke umiddelbart kan findes i de fysiske skemaer f.eks. abstrakte objekttyper eller nogle relationsender, der ikke er nødvendige i forhold til at danne fremmednøgler i data.

Krav

Obligatorisk

Modeleksempel: 

EAID
Figur 1. Modelelement som det ser ud i den logiske datamodel (XMI)

Skemaeksempel: 

EAIDSkema
Figur 2. Det tilsvarende modelelement som det ser ud i replikeringsskemaet (XSD)

3.2. Ikke-abstrakt DKObjekttyper skal findes i det fysiske skema

Regel: Hvis et ikke-abstrakt element af typen DKObkjekttype er beskrevet i datamodellen, skal det også fremgå i det fysiske skema som top level-element. Et abstrakt element af typen DKObkjekttype må ikke kunne genfindes i det fysiske skema.

Rationale:  Et objekt kan ikke være en del af eller indgå som en egenskab i et andet objekt.

Krav

Obligatorisk

Modeleksempel: 

DKObjekttype
Figur 3. Et objekt af stereotypen DKObjekttype som det ser ud i en logisk datamodel (UML)

Skemaeksempel: 

DKObjekttypeSkema
Figur 4. Som modeleksemplet vil se ud i et replikeringsskema (XSD)

3.3. Alt skal kunne genfindes

Regel: Et element i et replikeringsskema skal kunne ledes tilbage til den logiske datamodel. Dog følgende elementer ikke kunne ledes tilbage: objektid; feltliste; StedbestemmelsesReference.

Rationale:  Man må ikke stå som bruger af grunddata, med data som man ikke kan læse dokumentationen af i grunddatamodellen.

Note I et replikeringsskema kan der indgå xml-elementer der anvendes til at overføre informationer om forretningshændelser, eller som anvendes som en del af at holde styr på en replikering. Disse kan ikke genfindes i den logiske datamodel og omfatter:

  • objektid : id for den række der er overført eller ændret i en replikering af data til datafordeleren

  • feltliste : liste af informationer der følger med en forretningshændelse

  • StedbestemmelsesReference : angivelse af stedet for en forretningshændelse

Krav

Obligatorisk

Skemaeksempel: 

RepUndtagelse
Figur 5. De xml elementer i et replikeringsskema (XSD), der ikke kan genfindes i den logiske datamodel.

3.4. Associationer med en multiplicitet 1

Regel: Navigerbare associationer med en multiplicitet 1 eller 0..1 skal repræsenteres som en attribut/fremmednøgle

Rationale: 

I grunddatamodellen vises forbundetheden imellem 2 objektyper som en UML-association. En association kan i et fysisk skema repræsenteres på flere måder, f.eks. som en krydsreferensetabel eller som fremmednøgle. Reglen skal sikre, at den simpleste form for association ses på samme måde i de fysiske skemaer.

Krav

Obligatorisk

Modeleksempel: 

RelationerKardinalitet1
Figur 6. Objekttype som har en association til anden objekttype med en multiplicitet på 1

Skemaeksempel: 

RelationerKardinalitet1Skema
Figur 7. Association omformet til en fremmednøgle i et replikeringsskema (XSD)

3.5. Mapning af datatype

Regel: Mapning af datatyper fra ISO19103 Edition 2 skal følge den i tabel 1 anførte mapning. Mapning af datatyper for geometri fra ISO19107 skal følge den i tabel 2 anførte mapning.

Rationale: 

Anvendere skal entydigt kunne få indsigt i grunddata og de anvendte datatyper ved at orientere sig i grunddatamodellen.

Note:

Datatyper fra ISO19103 Edition 2 og ISO19107 (geometri) og deres mapninger til XML jf. https://www.w3.org/TR/xmlschema-2/ (enkelte typer mappes til GML: https://schemas.opengis.net/gml/3.2.1/) til brug i et replikeringsskema fremgår af nedenstående mapning. Enkelte xml-datatyper har en restriction tilknyttet.

Note til tabel 2: GM_* omfatter geometrityper (punkter, linjer, flader, osv.) defineret i DS/EN ISO 19107:2019, Geografisk information – Geometrimodel. DS/EN ISO 19107 specificerer en model for beskrivelsen af de geografiske dele af geodata. Som oftest anvendes typerne GM_Point (punkt), GM_Curve (linje), GM_Surface (flade).

Tabel 1:

Model datatype (ISO19103 Edition 2) Skema datatype (XML Schema Part 2: Datatypes Second Edition) og (Geography Markup Language (GML) Encoding Standard) Evt. restriction

AnnualDate

xsd:gMonthDay

AnnualMonth

xsd:gMonth

Binary

xsd:base64Binary eller xsd:hexBinary

Bit

xsd:integer

<xsd:restriction base="xsd:integer"><xsd:pattern value="0I1"/></xsd:restriction>

Boolean

xsd:boolean

Character

xsd:string

<xsd:restriction base="xsd:string"><xsd:length value="1" fixed="true"/></xsd:restriction>

CharacterString

xsd:string

Date

xsd:date

DateTime

xsd:dateTime

Decimal

xsd:decimal

Digit

xsd:string

<xsd:restriction base="xsd:string"><xsd:pattern value="[0-9]{1}"/></xsd:restriction>

Integer

xsd:integer

IRI

xsd:string

Measure

gml:MeasureType

Number

xsd:double

Real

xsd:double

Sign

gml:SignType

Time

xsd:time

UnitOfMeasure

xsd:string

URI

xsd:anyURI

UUID

xsd:string

<xsd:restriction base="xsd:string"><xsd:pattern value="[a-fA-F0-9]{8}-[a-fA-F0-9]{4}-[a-fA-F0-9]{4}-[a-fA-F0-9]{4}-[a-fA-F0-9]{12}"/></xsd:restriction>

Vector

gml:VectorType

Year

xsd:gYear

YearMonth

xsd:gYearMonth

Tabel 2:

Model datatype (ISO19107) Skema datatype (XML Schema Part 2: Datatypes Second Edition) og (Geography Markup Language (GML) Encoding Standard) Evt. restriction

GM_* (f.eks. GM_Point)

xsd:string

Krav

Obligatorisk

3.6. Nedarvede egenskaber

Regel: Et element i et fysisk skema skal indeholde alle modelelementets attributter og de attributter der nedarves.

Rationale: 

Det skal være muligt at kunne se alle attributter på et objekt, uanset om de i den logiske datamodel ligger på objekttypen eller nedarves fra en overordnet objekttype.

Krav

Obligatorisk

Modeleksempel: 

Fladtrykning
Figur 8. Et objekt i en datamodel som nedarver fra en overordnet objekttype og som samtidig anvender 2 komplekse datatyper (UML)

Model fladtrykt eksempel: 

Fladtrykt
Figur 9. Modellen i en fladtrykt (eng: flattened) version, hvor de nedarvede attributter og de 2 komplekse datatypers attributter er fladtrykt (UML)

Skemaeksempel: 

FladtryktSkema
Figur 10. Den fladtrykte model i et replikeringsskema (XSD)

3.7. Specialtegn

Anbefaling: Specialtegn bør ikke anvendes i fysiske skemaer

Rationale: 

Specialtegn understøttes utilstrækkeligt af nogle IT-systemer, hvorfor det med fordel bør undgås at anvende specialtegn i de fysiske skemaers datastrukturer.

Note Anbefalingen gælder ikke for de tekster og værdier der ingår i data, herunder kodelister og enumerationer.

Krav

Frivillig

Skemaet viser nogle få af de anbefalede mapninger til brug i fysiske skemaer.

Tegn i model Skemategn

æ

ae

ø

oe

å

aa

Kapitel 4. Ordliste

Begreb Forklaring Note Kilde

XML-skema (XSD)

Samling af formelle definitioner som specificerer hvor man markerer indholdet i et XML-dokument.

https://isotc211.geolexica.org/concepts/697/#entry-lang-swe

replikeringsskema

XML-schema designet til at definerer xml struktur for overførelse af data fra dataregistre til datafordeleren

XMI

XMI (XML Metadata Interchange) er en formatspecifikation produceret af Object Management Group (OMG). XMI-formatet tillader udveksling af objekter og modeller gennem en XMI-formateret fil. XMI-formatet bruges almindeligvis til at udveksle UML-modeller mellem andre værktøjer eller software.

fladtrykning (eng: flattening)

Processen at transformere en modelstruktur på logisk form til en struktur der egner sig bedre til en fysisk form, en mere flad struktur