Epikriisi tekstide genereerimine GPT-2 mudeliga
dc.contributor.advisor | Kolde, Raivo, juhendaja | |
dc.contributor.author | Lepson, Mihkel | |
dc.contributor.other | Tartu Ülikool. Loodus- ja täppisteaduste valdkond | et |
dc.contributor.other | Tartu Ülikool. Matemaatika ja statistika instituut | et |
dc.date.accessioned | 2023-06-27T11:28:46Z | |
dc.date.available | 2023-06-27T11:28:46Z | |
dc.date.issued | 2023 | |
dc.description.abstract | Vabatekstiliste terviseandmete analüüsimisel ja kasutamisel on palju piiranguid, sest täielikult anonümiseerida on neid võimatu. Õpetamiseks ja andmetöötlusmetoodikate väljatöötamiseks ei pea aga kasutama ilmtingimata päris andmeid, piisaks ka genereeritud sünteetilistest andmetest. Magistritöö eesmärk on treenida generatiivne tekstimudel, mis võimaldab genereerida epikriisi tekste vastavalt etteantud dokumendi osale, patsiendi demograafilistele andmetele ja diagnoosile. Töös treenitakse GPT-2 small mudel Tartu Ülikooli Eesti geenivaramuga liitunud patsientide epikriisi tekstidel. Saadud mudelil leitakse parim genereerimise algoritm, näidatakse, et genereeritud tekste on võimalik kasutada klassifitseerimismudeli treenimisel ning näidatakse, et on võimalik hinnata genereeritud tekstide originaalsust. | et |
dc.identifier.uri | https://hdl.handle.net/10062/91066 | |
dc.language.iso | est | et |
dc.rights | openAccess | * |
dc.rights | Attribution-NonCommercial-NoDerivatives 4.0 International | * |
dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/4.0/ | * |
dc.subject.other | loomuliku keele töötlus | et |
dc.subject.other | tehisõpe | et |
dc.subject.other | tehisnärvivõrgud | et |
dc.subject.other | infoteooria | et |
dc.subject.other | natural language processing | en |
dc.subject.other | machine learning | en |
dc.subject.other | neural networks | en |
dc.subject.other | information theory | en |
dc.title | Epikriisi tekstide genereerimine GPT-2 mudeliga | et |
dc.type | info:eu-repo/semantics/masterThesis | et |