Eesti rahvastikuregistrile sarnase sünteetilise andmestiku reeglipõhine genereerimine
| dc.contributor.advisor | Laur, Sven, juhendaja | |
| dc.contributor.advisor | Kamm, Liina, juhendaja | |
| dc.contributor.author | Eichhorn, Rain | |
| dc.contributor.other | Tartu Ülikool. Loodus- ja täppisteaduste valdkond | et |
| dc.contributor.other | Tartu Ülikool. Arvutiteaduse instituut | et |
| dc.date.accessioned | 2025-10-23T07:43:27Z | |
| dc.date.available | 2025-10-23T07:43:27Z | |
| dc.date.issued | 2025 | |
| dc.description.abstract | The development and testing of information systems require realistic test data, especially in cases where privacy restrictions prohibit the use of real personal data. Rule-based synthetic data generation provides a way to create datasets that mimic the structure and logic of real data without processing personal information. In this thesis, I present the creation of a rule-based synthetic data generator for the Estonian Population Registry, relying solely on public input data and system business logic. The developed Python-based tool automatically generates use cases, enabling efficient and secure system testing. The results offer a practical foundation for future research and a privacy-preserving alternative to real data. | |
| dc.description.abstract | Infosüsteemide arendamine ja testimine nõuab realistlikke testandmeid, eriti olukordades, kus pärisandmete kasutamine on privaatsuspiirangute tõttu keelatud. Reeglipõhine sünteetiliste andmete genereerimine võimaldab luua testandmeid, mis jäljendavad pärisandmete struktuuri ja loogikat ilma isikuandmeid töötlemata. Selles töös näitan, kuidas luua Eesti rahvastikuregistrile sobivat reeglipõhist sünteetiliste andmete generaatorit, kasutades ainult avalikke lähteandmeid ja registri äriloogikat. Loodud Pythonil põhinev tööriist võimaldab automaatselt genereerida kasutuslugusid, toetades tõhusat ja turvalist süsteemide testimist. Tulemused pakuvad praktilist alust edasisteks uuringuteks ja turvalist alternatiivi pärisandmete kasutamisele. | |
| dc.identifier.uri | https://hdl.handle.net/10062/117013 | |
| dc.language.iso | et | |
| dc.publisher | Tartu Ülikool | et |
| dc.rights | Attribution-NonCommercial-NoDerivatives 4.0 International | |
| dc.rights.uri | https://creativecommons.org/licenses/by-nc-nd/4.0/ | |
| dc.subject | sünteetilised andmed | |
| dc.subject | reeglipõhine andmete genereerimine | |
| dc.subject | testandmed | |
| dc.subject | rahvastikuregister | |
| dc.subject | andmekaitse | |
| dc.subject | infosüsteemide testimine | |
| dc.subject | GDPR vastavus | |
| dc.subject.other | magistritööd | et |
| dc.subject.other | informaatika | et |
| dc.subject.other | infotehnoloogia | et |
| dc.subject.other | informatics | en |
| dc.subject.other | infotechnology | en |
| dc.title | Eesti rahvastikuregistrile sarnase sünteetilise andmestiku reeglipõhine genereerimine | |
| dc.title.alternative | Rule-Based Generation of Synthetic Data Similar to the Estonian Population Registry | |
| dc.type | Thesis | en |
Failid
Originaal pakett
1 - 1 1
Laen...
- Nimi:
- Eichhorn_Andmeteadus_2025.pdf
- Suurus:
- 916.2 KB
- Formaat:
- Adobe Portable Document Format