Andmemudel
Andmemudel (ing k data model) on kontseptuaalne raamistik, millega kirjeldatakse andmete struktuuri, seoseid ja piiranguid infosüsteemis. Määratleb, kuidas andmeid struktuurselt kujutatakse ja millised seosed on erinevate andmeüksuste vahel. Andmemodelleerimine (ing k data modeling) on protsess, mille käigus luuakse andmemudel infosüsteemi arenduse, analüüsi või integreerimise eesmärgil.[1][2]
Mõiste ja eesmärk
[muuda | muuda lähteteksti]Andmemudel on kontseptsioonide kogum, millega kirjeldatakse andmebaasi loogilist struktuuri (nt andmetüübid, seosed, piirangud), et saavutada eraldatus (abstraktsioon) füüsilisest talletusest ja pakkuda ühtset arusaama andmetest. Mudel määrab, kuidas andmed on omavahel seotud, kuidas neid töödeldakse ja salvestatakse.[1]
Kontseptuaalse andmemudeli (ing k conceptual data model) eesmärk on ühtlustada organisatsioonis kasutatav terminoloogia, toetada semantilist kooskõla ning võimaldada ärivajaduste jälgitavust süsteemide ja protsesside vahel, mis on tehnoloogiast sõltumatu.[3]
Sõnavara
[muuda | muuda lähteteksti]- Andmemudel (ing k data model) – kontseptuaalne raamistik, millega kirjeldatakse andmete struktuuri, seoseid ja piiranguid infosüsteemis.[4]
- Kontseptuaalne andmemudel (ing k conceptual data model, CDM) – tehnoloogiast sõltumatu vaade ärikontseptsioonidele, nende seostele ja peamistele andmeelementidele.[4]
- Loogiline andmemudel (ing k logical data model, LDM) – üksuste, atribuutide, võtmete ja tervikluse reeglite formaliseeritud kirjeldus süsteemist sõltumatul tasandil,[4] määratleb andmestruktuurid ja seosed üksikasjalikumalt, kuid jääb veel rakendustehnoloogiast sõltumatuks.[5]
- Füüsiline andmemudel (ing k physical data model, PDM) – konkreetse andmebaasihalduse süsteemi (DBMS) ja andmetüüpidega seotud realiseering,[4] kirjeldab, kuidas andmed tegelikult salvestatakse konkreetse andmebaasitehnoloogia tasemel.[6]
- Relatsioonimudel (ing k relational model) – tabelitel (seostel) põhinev andmemudeli liik [4]
- Hierarhiline mudel (ing k hierarchical model) ja võrgumudel (ing k network model) – ajaloolised mudelid, milles andmete vahelised seosed väljenduvad vastavalt puu- ja võrgustruktuurina.[4]
- Euroopa andmemudel (ing k Europeana Data Model, EDM) – kultuuripärandi kirjeldamiseks loodud avatud semantilise veebi raamistik.[7]
Andmemudelil eristatakse tavaliselt kolme abstraktsioonitaset: kontseptuaalne, loogiline ja füüsiline.
Andmemudeli modelleerimise protsess
[muuda | muuda lähteteksti]Andmemudeli modelleerimine koosneb tavaliselt andmenõuete kogumisest, kontseptuaalse mudeli loomisest, loogilise mudeli koostamisest, füüsilise mudeli loomisest ja mudeli valideerimisest. Seda protsessi toetavad erinevad ülesmärked ja meetodid, näiteks ER-diagrammid (Entity-Relationship diagrams), UML klassi diagrammid (Unified Modeling Language class diagrams) ja IDEF1X. Andmemodelleerimise eesmärk on tagada andmete järjepidevus, kvaliteet ja süsteemidevaheline ühilduvus.[2][8]
Kasutusvaldkond
[muuda | muuda lähteteksti]Andmemudeleid kasutatakse infosüsteemide arendamisel, analüüsimisel ja haldamisel. Geoinfosüsteemide kontekstis määratlevad andmemudelid ruumiandmete objektid, seosed ja atribuudid. Näiteks Esri ArcGIS platvormis kasutatakse kontseptuaalseid ja loogilisi mudelitasemeid, et kirjeldada ruumianalüüsi ja ruumiandmete struktuure.[2][9]
Andmemudelid vähendavad dubleerimist, parandavad terviklust ja tõhustavad andmete konfidentsiaalsuse tagamist tsentraliseeritud talletuse kauduühtlustavad päringud ja aruandluse üle süsteemid, võimaldavad ühilduvust ja taaskasutatavust (nt standardiseeritud CDM-id eri osakondade või projektide vahel).
Andmemudel toetab nõuete analüüsi, skeemidisaini, andmete kvaliteeti ja süsteemidevahelist ühilduvust: kontseptuaalne mudel ühtlustab sõnavara; loogiline mudel formaliseerib reeglid ja seosed; füüsiline mudel optimeerib talletuse ning päringutöötluse. Mudeli sidusus ja viidatud standardid (nt UML, IDEF1X) parandavad koostalitlusvõimet ja arusaadavust nii arendajatele kui ka sidusrühmadele.[8]
Standardid ja arengusuund
[muuda | muuda lähteteksti]Andmemudelite kujundamisel tuginetakse sageli rahvusvahelistele standarditele ja metoodikatele, nagu ISO/IEC 11179, ISO 19109. Järjest enam on andmemodelleerimine muutunud tihedalt seotuks tehisintellekti ja andmehalduse automatiseerimisega, mis võimaldab luua ja hooldada mudeleid vastavalt andmete muutumisele.[10][11]
Eesti kontekst
[muuda | muuda lähteteksti]Eestis on mitmeid avalike andmestike andmemudeleid, eelkõige ruumiandmete valdkonnas, kus andmestikud on kirjeldatud INSPIRE rakendusskeemide järgi. Eesti topograafia andmekogu (ETAK) on andmemudel, mis määratleb ruumiobjektide klassid, atribuudid, seosed ja kvaliteedinõuded.[12] INSPIRE raamistik (nt teemad „Haldusüksused“, „Teed ja transpordivõrk“ jmt) määratleb valdkondlikud andmemudelid, millele Eesti ruumiandmestikud peavad vastama ja vastavad kirjeldused on koondatud Eesti geoportaali.[13][14]
Taustaks ja koordineerimiseks kasutatakse riigi tasemel registrit RIHA (riigi infosüsteemi halduskogu) ning töövahendeid nagu AKIT (klassifikaatorite ja andmeterminite haldus) – need ei ole iseseisvad andmemudelid, kuid toetavad modelleerimise ühtlust ja metaandmete kvaliteeti.[15][16]
Vaata ka
[muuda | muuda lähteteksti]Viited
[muuda | muuda lähteteksti]- 1 2 Codd, E. F. (1. juuni 1970). "A relational model of data for large shared data banks". Communications of the ACM (inglise). 13 (6): 377–387. DOI:10.1145/362384.362685. ISSN 0001-0782.
- 1 2 3 "What Is Data Modeling? | IBM". www.ibm.com (inglise). 29. september 2021. Vaadatud 8. novembril 2025.
- ↑ Brodie, Michael L.; Schmidt, Joachim W., toim-d (1. juuli 1982). "Final report of the ANSI/X3/SPARC DBS-SG relational database task group". ACM SIGMOD Record. 12 (4): 1–62. DOI:10.1145/984555.1108830. ISSN 0163-5808.
- 1 2 3 4 5 6 Leveraging DB2 10 for High Performance of Your Data Warehouse. 30. september 2016.
- ↑ "New data warehouse features in oracle Database l0g", Oracle Data Warehouse Tuning for 10g, Elsevier, lk 423, 2006, ISBN 978-1-55558-335-4, vaadatud 8. novembril 2025
- ↑ "Oracle Instance Design", Physical Database Design Using Oracle, CRC Press, lk 89–126, 27. juuli 2004, ISBN 978-0-429-21123-2, vaadatud 8. novembril 2025
- ↑ Gradmann, Stefan (9. veebruar 2011). "Stefan Gradmann: Das Europeana Data Model (EDM)". SciVee. Vaadatud 8. novembril 2025.
- 1 2 "(PDF) OMG Unified Modeling Language (Version 2.5)". ResearchGate (inglise). Originaali arhiivikoopia seisuga 16. juuni 2022. Vaadatud 8. novembril 2025.
- ↑ Shaharudin, Ashraf; van Loenen, Bastiaan; Janssen, Marijn (16. jaanuar 2025). "Developing an Open Data Intermediation Business Model: Insights From the Case of Esri". Transactions in GIS. 29 (1). DOI:10.1111/tgis.13304. ISSN 1361-1682.
- ↑ Winston, Donny (28. oktoober 2020). "Relating the ISO 11179 Metadata Registry (MDR) Standard to Semantic Web Standards". doi.org. Vaadatud 8. novembril 2025.
- ↑ "Gartner names top 10 data and analytics technology trends". News Group. 15. juuli 2020. Vaadatud 8. novembril 2025.
- ↑ "Eesti topograafia andmekogu (ETAK) – andmemudel". Maa- ja Ruumiamet. Vaadatud 29. novembril 2025.
- ↑ "INSPIRE – ülevaade". Eesti geoportaal. Vaadatud 29. novembril 2025.
- ↑ "Ruumiandmed". Maa- ja Ruumiameti geoportaal. Vaadatud 29. novembril 2025.
- ↑ "RIHA ja RIHAKE". Riigi Infosüsteemi Amet. Vaadatud 29. novembril 2025.
- ↑ "AKIT". Cybernetica. Vaadatud 29. novembril 2025.