Browsing by Author "Laur, Sven"
Now showing 1 - 20 of 35
- Results Per Page
- Sort Options
Item AS Regio geokodeerija kvaliteedi hindamine(Tartu Ülikool, 2012) Rõõmusaare, Joosep; Laur, Sven; Tartu Ülikool. Matemaatika-informaatikateaduskond; Tartu Ülikool. Arvutiteaduse instituutSelle töö eesmärgiks oli uurida Regio geokodeerijat ning leida meetodeid, kuidas parandada selle kvaliteeti. Kuna kasutusel oleva rakenduse koodi on töökas muuta, siis keskendutakse siin võimalustele muuta geokodeerijat paremaks nii, et koodi sisseviidud muutused oleksid väiksed, või mis nõuaks kõigest rakenduse seadistuse muutmist. Siin uuritakse interkatiivset ja automaatset geokodeerijat ning mõlemale leiti võimalusi, kuidas nende töötamise kvaliteeti muuta. Lisaks nendele võrreldi Regio geokodeerijat teiste võimalike konkurentside geokodeerijatega, ning toodi välja, nende miinused ja plussid. Seda tööd saab kasutada Regio geokodeerija parendamiseks. Lisaks saab kasutada edaspidisteks geokodeerimise uurimiste aluseks või analüüsida Regio geokodeerijat sügavamini.Item Brauseri laienduste turvaanalüüs(Tartu Ülikool, 2010) Krips, Kristjan; Laur, Sven; Tartu Ülikool. Matemaatika-informaatikateaduskond; Tartu Ülikool. Arvutiteaduse instituutPaljud tänapäevased brauserid võimaldavad funktsionaalsuse lisamist või muutmist laienduste kaudu. Rohkete võimaluste tõttu on laiendused muutunud kasutajate hulgas populaarseks ja see on toonud kaasa uued ründevektorid, mis ohustavad kasutajate turvalisust. Töös analüüsime populaarsemate veebibrauserite laienduste turvaarhitektuuri. Vaatleme Firefox 3.6, Google Chrome 5.0.360 ja Internet Explorer 8 laienduste ehitust ja nende turvalisust. Töö annab ülevaate vastavate brauserite laienduste arhitektuurilisest turvalisusest ja kirjeldab võimalikke ründevektoreid. Selgitame, kuidas on vastavate veebibrauserite koodiruum ja mälu kaitstud ja teeme kindlaks missuguseid õiguseid brauserite laiendused omavad. Uurime, kuidas on praegust laienduste arhitektuuri kasutades võimalik brausereid kompromiteerida ja kirjeldame sellega kaasnevaid riske. Selleks demonstreerime laiendusi, mis kompromiteerivad brauseri, näitamaks olemasoleva arhitektuuri puudujääke. Näitame erinevaid ründevektoreid ja kirjeldame nendele vastavaid ründestsenaariumeid. Töö tulemusena selguvad brauserite laienduste turvaarhitektuuri nõrkused. Nende leevendamiseks pakume välja lahendusi, mis parandavad turvaarhitektuuri. Töö tulemusena on võimalik brauserite kasutajaid informeerida olemasolevatest ohtudest ja teadvustada turvalisuse olulisusest.Item Design of a framework to detect temporal clinical event trajectories from health data standardized to the OMOP CDM(2021-09-15) Künnapuu, Kadri; Ioannou, Solomon; Ligi, Kadri; Kolde, Raivo; Laur, Sven; Vilo, Jaak; Rijnbeek, Peter; Reisberg, SulevItem Eclipse põhine integreeritud arenduskeskkond programmeerimiskeelele Agda(Tartu Ülikool, 2012) Vedel, Kristjan; Annamaa, Aivar; Laur, Sven; Tartu Ülikool. Matemaatika-informaatikateaduskond; Tartu Ülikool. Arvutiteaduse instituutAntud töö eesmärk oli kavandada ja implementeerida Eclipse põhine integreeritud arenduskeskkond (IDE) sõltuvate tüüpidega funktsionaalsele programmeerimiskeelele Agda. Töös vaadati lähemalt Agdat, Eclipse Platformi ja Eclipse põhiste arenduskeskkondade loomise raamistikke ning selle põhjal implementeeriti viis DLTK (Dynamic Languages Toolkit) raamistikule tuginevat Eclipse pistikprogrammi ning Haskelli teek, mis vahendab suhtlust Eclipse pistikprogrammide ja Agda vahel. Implementeeritud IDE toetab Agda projektide ja failide loomist Eclipses, sisaldab Agda-spetsiifilist perspektiivi (perspective), süntaksi esiletõstmist, toetab erinevaid päringuid eesmärgi (goal) kontekstis, navigeerimist deklaratsioonide juurde, otsingut, sisu assisteerimist (content assist) ja probleemide markeerimist.Item Emissioonijoontega tähtede tuvastamine Gaia kosmoseteleskoobi andmetest(Tartu Ülikool, 2009) Jänes, Jürgen; Laur, Sven; Kolka, Indrek; Tartu Ülikool. Matemaatika-informaatikateaduskond; Tartu Ülikool. Arvutiteaduse instituutAastal 2011 stardib Euroopa Kosmoseagentuuri (ESA) kosmoseteleskoop Gaia. Teleskoop vaatleb viie aasta jooksul hinnanguliselt miljard objekti, kogudes seeläbi kokku ühe petabaidi jagu andmeid. Käesoleva bakalaureusetöö eesmärgiks oli uurida, kuidas saab kasutada masinõppe algoritme Gaia kosmoseteleskoobi madalalahutusega BP/RP fotomeetri andmete töötlemisel. Kuna reaalseid andmeid veel ei eksisteeri, siis kasutati töös olemasolevatest kõrge lahutusega spektritest koostatud Gaia vaatluste simulatsioone. Bakalaureusetöö tulemused saab jagada kaheks osaks. Kõigepealt uurisime tugivektormasinate kasutamist kahe erineva klassifikatsiooniülesande lahendamisel. Esimese ülesandena proovisime eraldada H-alfa emissiooni sisaldavaid spektreid H-alfa emissioonita spektritest. Saadud tulemused olid hoolimata piiratud andmetest head. Teise klassifitseerimisülesandena katsusime eraldada Be tähti Wolf-Rayet’ tähtedest. Teise ülesandena üritasime me hinnata tugivektorregressiooni algoritmiga H-alfa spektrijoone ekvivalentlaiust. Selleks sobiva andmestiku saamiseks kirjutasime me lihtsa emissioonijoontega tähespektri mudeli, mis ignoreerib tegelikkuses spektrit tekitavaid füüsikalisi protsesse. Mudel kasutab peakomponentide analüüsi, et genereerida vaatlustega sarnaseid tähe kontiinuume. Spektrijooned lähendasime Gaussi funktsioonidega. Esialgset tulemused tugivektorregressiooni kasutamisel olid positiivsed. Tulevikus on plaanis katsetada erinevaid meetodeid klassifitseerimisalgoritmide effektiivsuse parandamiseks, lisada emissioonijoontega tähespektri mudelile astrofüüsikalistest kaalutlustest tuletatud spektrijooni ning uurida tugivektorregressiooni kasutamist teiste spektrijoonte effektiivlaiuse tuvastamisel.Item Finding Non-Trivially Similar Documents from a Large Document Corpus(Tartu Ülikool, 2011) Gross, Oskar; Laur, Sven; Toivonen, Hannu; Tartu Ülikool. Matemaatika-informaatikateaduskond; Tartu Ülikool. Arvutiteaduse instituutKäesoleva magistritöö eesmärgiks on uurida, kuidas leida mittetriviaalselt sarnaseid dokumente suurest dokumentide hulgast. Antud töös kirjeldatakse nii traditsioonilisi meetodeid dokumentide sarnasuse uurimiseks kui ka tutvustatakse uusi. Lisaks viiakse läbi eksperimendid, et uurida väljapakutud mõõtude käitumist andmetel. Traditsioonilised dokumentide sarnasusmeetodid mõõdavad sarnaste sõnade esinemist kahes dokumendis. Antud töös käsitleme, mis probleemid kaasnevad kui me kasutame dokumentide sarnasusmõõdu arvutamisel vaid viimastes leiduvaid sõnu, tutvustame olemasolevaid kui ka pakume välja uusi mõõte nende probleemide ületamiseks. Dokumendid on mittetriviaalselt sarnased, kui nad sisaldavad vähe ühiseid sõnu, kuid on kontekstuaalselt sarnased. Selleks, et tuvastada dokumentide konteksti pakume töös välja taustgraafi kontseptsiooni. Taustgraafi eesmärk on modelleerida sõnade ehk kontseptsioonidevahelist seost, andes rohkem kaalu nendele sõnadele, mis esinevad tihti koos. Saadud taustgraafi kasutame erinevate dokumentidevaheliste sarnasusmõõtude arvutamiseks. Käesolevas töös käsitletakse ka kasutaja käitumise ja sarnasusmõõtude vahelist seost. Töös antakse lühiülevaade järjestuste kaevandamise põhimõistetest ning kasutakse neid, et uurida, kuidas erinevad sarnasusmõõdud modelleerivad kasutaja käitumist. Töös viiakse läbi erinevaid eksperimente uudisportaali Postimees.ee andmetel. Taustgraafi uurimisel näeme, et loodud graaf kirjeldab kontekstisiseseid kontseptsioonide vahelisi seoseid väga hästi. Uurides sarnasusmõõte näeme, et üleüldisel uudiste soovitamisel töötab meie väljapakutud meetoditest paremini traditsiooniline meetod. Mõõdud, mis kasutavad taustgraafi informatsiooni, annavad paremaid tulemusi traditsioonilistest meetoditest, juhul kui me kasutame väheseid, kuid kvaliteetseid andmeid dokumendi kohta. Käesolev magistritöö pakub välja uue metoodi dokumentide sarnasuse leidmiseks ning näeme, et antud meetodid töötavad kindlatel juhtudel paremini kui varem kasutusel olnud mõõdud.Item Geoandmebaasid ja indeksid(Tartu Ülikool, 2013) Ziugand, Ragnar; Laur, Sven; Tartu Ülikool. Matemaatika-informaatikateaduskond; Tartu Ülikool. Arvutiteaduse instituutKäesoleva bakalaureusetöö eesmärgiks oli uurida andmebaasi indeksite ja geoindeksite andmestruktuure ja need esitleda emakeeles. Ühelt poolt tegin seda leiduvate materjalide vähesuse tõttu ja teiselt poolt, et tutvustada inimestele, kuidas indeksid andmebaasihaldussüsteemides töötavad. Kolmandaks põhjuseks tooksin enda huvi ja neljandaks soovi luua õppematerjal antud teemast huvituvale inimesele. Antud töö esimeses osas vaadeldi andmebaase ja indekseid. Pikemalt keskenduti iga indeksitüübi andmestruktuurile. Eraldi peatuti ka tööpõhimõtetel ja toodi juhiseid indeksite kasutamiseks. Teises osas vaadeldi lähemalt geoandmebaase ja geoindekseid. Antud peatükis kirjeldati põhjalikult ka iga indeksitüübi andmestruktuure ja viimaste paremaks mõistmiseks lisati ilmekad illustratsioonid. Bakalaureusetöö kolmandas peatükis võrreldi kolme andmebaasihaldussüsteemi opereerimist kattuvuspäringute sooritamisel ja indeksite mõju tulemustele. Võrreldi ka ajalist erinevust indeksiga ja indeksita päringute vahel, tehti põhjalik analüüs ning võeti tulemused kokku. Püstitatud eesmärgid said bakalaureusetöö lõpuks täidetud. Sain isiklikult palju uusi teadmisi juurde ning mõistan andmebaaside käitumist paremini. Enda jaoks huvitavaid tulemusi sain just jõudluskatsetest indekseeritud ja indekseerimata andmete vahel. Rahule jäin ka sisuga, sest tööd saab kasutada õppematerjalina ka täiesti teemavõõras inimene, sest usun, et see on piisava detailsusega, ent arusaadav. Antud bakalaureusetöö edasiarendamiseks on võimalik uurida PostgreSQL, PostGIS ja GEOS paketi lähtekoodi ning leida põhjus tulemustes kajastunud kiirusele. Eesmärgiks lähitulevikus on parandada metsaeraldiste vead Oracle andmebaasis ning leida töös kajastamata jäänud tulemused.Item Geograafiliste Andmete Mudelipõhine Rühmitamine(Tartu Ülikool, 2012) Tekhov, Roman; Laur, Sven; Tartu Ülikool. Matemaatika-informaatikateaduskond; Tartu Ülikool. Arvutiteaduse instituutTöö eesmärk oli disainida ja realiseerida algoritme teatud tüübiga andmete analüüsimiseks. Tegu on geograafiliste koordinaatidega annoteeritud sündmustega (pikkus ja laius). Algoritmide põhiülesanne on ennustada geograafilisi piirkondi, kus sama tüübiga sündmused toimuvad suure tõenäosusega ka tulevikus. Me vaatlesime kahte tüüpi andmeid. Esimene tüüp on kahemõõtmelise normaaljaotusega sündmused, mis paiknevad ümber keskset punktallikat. Teine tüüp on sündmused, mis on jaotatud mööda keskset joonelõiku. Näiteks liiklusõnnetuste toimumiskohad paiknevad mööda maanteesid, mida saab modelleerida sirgete lõikude kogumina. Esimene andmetüüp on laialt esitatud kirjanduses, ning antud töös kirjeldatakse hästi tuntud sellekohased algoritmid. Teise andmetüübi analüüsimiseks sobivate algoritmide arendus ja esitamine oli aga selle töö peamine panus.Item Hüperboloidpeegliga roboti kaamera pildi kalibreerimine(Tartu Ülikool, 2012) Jõgeva, Janno; Laur, Sven; Tartu Ülikool. Matemaatika-informaatikateaduskond; Tartu Ülikool. Arvutiteaduse instituutKäesolev töö käsitles ühte tehisnägemise arendamisega seotud probleemidest - kuidas luua seos robotile läbi kaamera laekuva pildi ja reaalse maailma vahel. Seose loomiseks on vajalik kaamera kalibreerimine testpildi põhjal. Uuriti võimalust sellise programmi kirjutamiseks, mis on võimeline genereeritud piltide põhjal esitama teisenduse pildi ja mingi kindla reaalse maailma tasandi vahel. Ülesande lahendamiseks on mitmeid üldisi võimalusi, mis põhinevad enamasti kaamera parameetrite hindamisel. Töös käsitletud lähenemine eeldab, et soovitakse kalibreerida mingi kindla tasandi suhtes ruumis. Lahenduse üldidee seisnes ühe valge ruudu kasutamises kaamera kalibreerimiseks. Kõigepealt tuli kalibratsiooniruut tuvastada. Seejärel rakendati teadmist, et füüsilises ruumis oli kalibratsioonimuster ruut. Observeeritava ruumi ja füüsilise ruumi vahelise teisenduse leidmisel kasutati bilineaarset seost. Võrrandite rohkuse tõttu rakendati kiireima laskumise meetodit, et minimiseerida kõigi küljepikkuste vigasid. Lahenduskäiku rakendava programmi kirjutamiseni ei jõutud. Töös kirjeldati mitmeid varemloodud või praegu arenduses olevaid kaamera kalibratsiooni tööriistu. Kirjeldustes toodi välja tööriistade vahelisi seoseid ja eripärasid. Õpiti kasutama POVRay tarkvarapaketti katseandmete simuleerimiseks, lisaks sellele süvendati programmeerimiskeele Python kohta käivaid teadmisi. Implementeeriti proof of consept tüüpi programm, mis kasutab modifitseeritud versiooni W. Sun [41] poolt kirjeldatud kihilisest nurgatuvastusmeetodist. Esitati viis pildi kalibreerimiseks vajalikust bilineaarsest teisendusest koos näidislahendusega üksikute kaadrite juhul. Töö edasiarendamiseks tuleks kirjeldatud kalibratsioonimeetod implementeerida ja seejärel seda vastavalt reaalse maailma katsetulemustele optimeerida.Item Interneti teel hääletamise individuaalne kontrollitavus(Tartu Ülikool, 2012) Pikma, Tiit; Heiberg, Sven; Laur, Sven; Tartu Ülikool. Matemaatika-informaatikateaduskond; Tartu Ülikool. Arvutiteaduse instituutEestis on alates 2005. aastal toimunud kohaliku omavalitsuse volikogu valimistest olnud võimalus lisaks paberile ka interneti teel hääletada. Töö loob hääletamise mudelist lihtsustatud variandi ning lisab sellesse võimaluse valijatel oma häält üle kontrollida, eesmärgiga avastada hääli muutnud ründeid. Lõpuks analüüsitakse individuaalse kontrollitavuse lisamise võimalust Eestis kasutatavasse hääletamise mudelisse ning milliseid nüansse sellega seoses kaaluma peab.Item JavaScripti staatilise koodianalüsaatori loomine teenusena(Tartu Ülikool, 2013) Jaggo, Jaanus; Karus, Siim; Laur, Sven; Tartu Ülikool. Matemaatika-informaatikateaduskond; Tartu Ülikool. Arvutiteaduse instituutStaatiline koodianalüüs on tarkvaratööstuses laialt kasutatud analüüsimeetod koodiülevaatuste toetamiseks ning koodi kvaliteedi hindamiseks juba tarkvaraprojekti varajases staadiumis. Käesolevas töös tutvustatakse teenusepõhist lähenemist koodianalüsaatori loomisel, seejuures tuginedes privaatse lähtekoodi printsiibile. Selle meetodi mõistlikkuse ja teostatavuse hindamiseks lõime staatilise koodianalüsaatori prototüüp JavaScriptile. JavaScripti analüsaator on realiseeritud pistikud-teenusena lahenduse XMLStyleHelper laiendusena. Loodud JavaScripti analüsaator sobib hästi lähtekoodi struktuuri keerukuse hindamiseks ning annab tervikpildi koodis olevatest funktsioonidest. Teenusepõhine lähenemine annab mitmeid eeliseid eraldiseisva rakenduse ees ning tuginedes privaatse lähtekoodi printsiibile on see kasutajatele vastuvõetavam.Item Julgeolekuriskide juhtimisel kasutatavate modelleerimiskeelte võrdlus(2014) Proskurin, Andrei; Matulevičius, Raimundas; Laur, SvenTänapaeval kõik firmad, mis omavad väärtuslikke varasid, püüavad oma aktiva ja pasiva kaitsta. Kahjuks ei ole võimalik reageerida kõikidele varade turvalisust puudutavaid ähvardustele. Selliste võimalike ohtude leevendamiseks olid laiendatud modelleerimiskeeled turvariskide halduse kasutamiseks. Sobiva keele valik võib aga olla keeruline otsus, kuna see on iseenesest ränk küsimus, kuidas need keeled omavahel võrrelda ning otsustada kumb lahendus on rentaabel. Iga turvateenusel on oma hind, kuigi firmad on oma eelarvega piiratud. Konkreetne valitud keel turvariski haldamiseks peab vastama firma vajadustele, kuna see on tähtis positiivse “ROI” (investeeringu risk) suhtes. Samas turvariski haldus asub infosüsteemi arendamise varajasel staadiumil ja keele valik, mis ei vasta firma vajadustele, võib viita aja kaotusele või isegi süsteemi turvaaukudele. Selle probleemi lahenduseks on meie tehniline panus võrrelda modelleerimiskeel: “BPMN”, “Secure Tropos”, “Misuse case” ja “Mal-activity” diagramm. On tähtis määratlema, kuidas need keeled toimivad infosüsteemi turvariskide haldamine (ingl. ISSRM) domeeni mudeliga. Juhtumisel ja empiitilisel analüüsil põhinev võrdlus oli tehtud selleks, et selgust saada turvalisuse probleeme puudutavatest keeltest ja nende semiootilisest selgusest. Empiiriline analüüs juhtumi analüüsiga võimaldab välja selgitada, mismoodi üks keel toimib paremini kui teine “ISSRM” suhtes. Valitud modeleerimiskeeled turvariskide halduseks on mingil määral piiratud semiootilise selguse suhtes, kuna need pole olnud esialgu mõeldud tegelema turvariskide haldusega, pigem “ISSRM” kasutamiseks ning selleks, et aidata ohud leevendada infosüsteemi arendamise varajasel staadiumil.Item Kahe osapoolega turvaline ühisarvutus: efektiivne Beaveri kolmikute genereerimine(Tartu Ülikool, 2013) Pullonen, Pille; Laur, Sven; Aura, Tuomas; Bogdanov, Dan; Tartu Ülikool. Matemaatika-informaatikateaduskond; Tartu Ülikool. Arvutiteaduse instituutTöö kombineerib erinevaid ideid, et saavutada aktiivses mudelis turvalist kahe osapoolega ühisarvutust. Töö käigus defineerime Sharemindi raamistikku kaks uut turvaala. Kasutame aditiivset ühissalastust, sõnumiautentimisskeeme, aditiivselt homomorfset krüptosüsteemi ning nullteadmustõestusi. Protokollistikud jagame kahte osasse, vastavalt ettearvutamise ja töö faas. Ettearvutamise ajal valmistatakse ette juhuslikke väärtusi, mis võimaldavad töö faasis arvutusi kiirendada. Eelkõige keskendume korrutamise jaoks vajalike Beaveri kolmikute genereerimisele.Item Linear Ensembles of Word Embedding Models(Gothenburg, Sweden, Association for Computational Linguistics, pp. 96--104, 2017) Muromägi, Avo; Sirts, Kairit; Laur, Sven; Tiedemann, Jörg; Tahmasebi, NinaItem Motiivide leidmine lühikestest peptiididest(Tartu Ülikool, 2013) Kruup, Mari-Liis; Kull, Meelis; Rajashekar, Balaji; Laur, Sven; Tartu Ülikool. Matemaatika-informaatikateaduskond; Tartu Ülikool. Arvutiteaduse instituutKäesoleva töö eesmärgiks on arendada töövoog, mis leiaks etteantud lühikestest peptiididest sarnaste peptiidide grupid ning esitaks need grupid motiividena. Sellist töövoogu oleks hiljem võimalik kasutada motiivide avastamiseks erinevate indiviidide peptiididest, et leida sarnasusi sama diagnoosiga haigete vahel. Peptiididest motiivide leidmise töövoo koostamiseks kombineeritakse erinevaid üldtuntud meetodeid, bioinformaatika tööriistu ning lisaskripte. Koostatud töövoog põhineb hierarhilisel klasterdamisel, mille abil jagatakse etteantud peptiidid sarnasuse alusel gruppidesse. Leitud gruppe modifitseeritakse, et koostada just sellised grupid, millest igaüks sisaldaks ühte unikaalset motiivi. Lõplikest gruppidest leitakse motiivid, mis visualiseeritakse logodena ning esitatakse ka regulaaravaldise kujul. Leitud motiividele lisatakse skoorid, mis annaksid infot selle kohta, kui hästi iga motiiv just oma peptiidigruppi kirjeldab. Valminud töövoog koostati ning rakendati ühe testindiviidi peal. Töövoo rakendamine oli edukas ning etteantud 277 166 peptiidist suudeti 71.19% jagada 46 motiivigruppi, millest 43 said ka väga head skoorid. Selle töövoo abil on võimalik edaspidi analüüsida erinevaid indiviide, et leida sama diagnoosiga haigetel ühiseid motiive.Item Motiivide otsimine DNA regulatiivsetest aladest(Tartu Ülikool, 2010) Petmanson, Timo; Laur, Sven; Tartu Ülikool. Matemaatika-informaatikateaduskond; Tartu Ülikool. Arvutiteaduse instituutKäesolev töö uurib algoritme, mille abil on võimalik uurida organismide geeniregulatsiooni probleeme eksperimentaalsete andmete põhjal. Keskendutakse DNA regulatiivsetest aladest oluliste motiivide ning fragmentide otsimisele, millel võib olla kriitiline roll organismi elutalitluse reguleerimisel ja kordineerimisel. Töö teoreetilises osas kirja pandud matemaatilise formalisatsiooni abil uuritakse ja tõestatakse mitmeid omadusi, mis panevad aluse võimalikele otsingualgoritmidele ja nende analüüsimisele. Töö praktiline osa käsitleb väljatöötatud algoritmide ajalist efektiivsust ning võimekust töötada bioloogiliste andmetega.Item Multilineaarsetel kujutustel baseeruvast atribuudipõhisest krüpteerimisest loogikaskeemide jaoks(Tartu Ülikool, 2013) Kangro, Kairi; Lipmaa, Helger; Laur, Sven; Tartu Ülikool. Matemaatika-informaatikateaduskond; Tartu Ülikool. Arvutiteaduse instituutTöös antakse ülevaade atribuudipõhisest krüpteerimisest. Tutvustatakse Garg et al artiklis "Attribute-Based Encryption for Circuits from Multilinear Maps" esitatud konstruktsiooni. Tehakse ka mõned ettepanekud antud konstruktsiooni parandamiseks, ja tõestatakse saadud konstruktsiooni turvalisus.Item Mustripõhine faktituletus eestikeelsetest tekstidest(Tartu Ülikool, 2012) Petmanson, Timo; Laur, Sven; Tartu Ülikool. Matemaatika-informaatikateaduskond; Tartu Ülikool. Arvutiteaduse instituutVabatekstide töötlus on üks keerulisemaid probleeme arvutiteaduses. Tekstide täpne analüüs on tihti mitmestimõistetavuse tõttu arvutite jaoks keeruline või võimatu. Sellegipoolest on võimalik teatud fakte eraldada. Käesolevas töös uurime mustripõhiseid meetodeid faktide tuletamiseks eesti keelsetest tekstidest. Rakendame oma metoodikat reaalsetel tekstidel ning analüüsime tulemusi. Kirjeldame lühidalt aktiivõppe metoodikat, mis võimaldab suuri korpuseid kiiremini märgendada. Lisaks oleme implementeerinud prototüüplahenduse korpuste märgendamiseks ning mustripõhise faktituletuse läbiviimiseks.Item Paralleelsed Wilcoxoni Astaku testid(2014) Jerkku, Stenver; Laur, SvenStatistilisi teste kasutatakse tuvastamaks kuidas erinevad eksperimentaalsed stiimulid mõjutavad uuritavaid suurusi. Antud töös uuritav Wilcoxoni test on üks vähestest statilistest testidest, mida saab kasutada juhul kui grupi sees olev loomulik varieeruvus pole normaaljaotusega. Selliste testide kasutamine on tavapärane bioloogiliste andmete uurimisel. Sellest tulenevalt kasutatakse seda testi bioinformaatika, algoritmika ja andmekaeve grupi poolt geenide uurimiseks, analüüsimiseks ja andmekaeveks, bioloogiliseks andmekaeveks ja muudeks ülesanneteks. Praegused implementatsioonid Wilcoxoni astaku testist on optimeerimata ja aeglased. See projekt vaatab Wilcoxoni testi põhiomadusi ning uurib kuidas selle implementatsioone optimeerida. Selleks, et implementatsiooni teha täpsemaks, uuritakse Wilcoxoni statistiku ja Gaussi jaotuse seost. Selleks, et implementatsioone kiiremaks teha, kasutatakse dünaamilise programmeerimise meetodeid, et säästa arvutusaega. Optimeerimisega tehti teste nii kiiremaks kui ka täpsemaks. Antud töös loodi täpne ja kiire Wilcoxoni testi implementatsioon C++ jagatud teek. Selle projekti skoobis on ka nimetatud teegi integreerimine käsureaga ja GNU-R projektiga. Tänu enda jagatud teegi olemusele, on seda lihtne kasutada ja implementeerida ka teistes tööriistades.Item Piiratud võimsusega regulaaravaldistele sobituvate sõnade loendamine(Tartu Ülikool, 2013) Alman, Anti; Kull, Meelis; Laur, Sven; Tartu Ülikool. Matemaatika-informaatikateaduskond; Tartu Ülikool. Arvutiteaduse instituutKäesolev bakalaureusetöö keskendub ühe algoritmi arendamisele ja implementeerimisele. See algoritm moodustab ühe osa suuremast biomarkerite otsimise töövoost. Töövoogu arendatakse Tartu Ülikooli BIIT grupis ühe koostööprojekti raames. Algoritmi sisendiks on suur kogus andmeid erinevate bioloogiliste proovide kohta. Andmed nende proovide kohta on esitatud kasutades lühikesi sõnu ja vastavaid esinemise sagedusi, mille kaudu on võimalik tuvastada olulisi erinevuseid proovide vahel. Lisaks on teada, et mõningatel juhtudel võib piiratud võimsusega regulaaravaldis anda palju paremat infot proovide erinevuste kohta. Samas regulaaravaldistele vastavad sagedused ei ole ette teada vaid tuleb arvutada sisendiks proove iseloomustavate sõnade ja vastavate sageduste põhjal. Selle probleemi saab jagada kaheks osaks. Esiteks tuleb leida kõik sõnad mis vastavad ette antud regulaaravaldisele. Selle saavutamiseks kasutame suuri bitivektoreid, mida hoitakse pidevalt mälus. Teiseks tuleb arvutada regulaaravaldise sagedused regulaaravaldisele vastavate sõnade sageduste põhjal. Kiirus on siinkohal saavutatud hõreda maatrikis pidevalt mälus hoidmisega. Maatriksile vastava andmestruktuuri formaat on valitud selliselt, et maatriksi ridu saaks võimalikult kiirelt proovide veergude kaupa kokku liita. Bakalaureusetöö tulemuseks olev algoritm on implementeeritud programeerimiskeeltes Python ja C++. Töös on toodud mõlema implementatsiooni detailid ning lõpuks on võrreldud nende kiirust sama ülesande lahendamiseks arendatud naiivse lahendusega.