Sirvi Autor "Raun, Kristo, juhendaja" järgi
Nüüd näidatakse 1 - 6 6
- Tulemused lehekülje kohta
- Sorteerimisvalikud
listelement.badge.dso-type Kirje , A Functional Prototype and General Architecture of An-alytic Data Management for a Railway Company(Tartu Ülikool, 2024) Metelitsa, Mait; Raun, Kristo, juhendaja; Awad, Ahmed, juhendaja; Tartu Ülikool. Loodus- ja täppisteaduste valdkond; Tartu Ülikool. Arvutiteaduse instituutMagistritöö käsitleb andmetehnika ja ärianalüütika temaatikat raudtee-ettevõttes. Töö ees-märk on lahendada EVR-i analüütilise andmehaldusplatvormi moderniseerimisega seotud väljakutseid. Lõputöö üks peamisi uudseid külgi on detailne analüüsipõhine kirjeldust sellest, kuidas EVR-il oleks kõige otstarbekam nii rahaliselt kui ka arhitektuuriliselt oma analüütilist and-mehaldusplatvormi moderniseerida. Töös on avatud hetkeolukord, kirjeldatud lähteandmete nomenklatuuri ning läbi otsustusdimensioonide ja tehnoloogiliste alternatiivide üksikasja-liku analüüsi on jõutud tulevase arhitektuuri teekaardini. Väljapakutud tulevikuarhitektuur toetab paindlikku hübriidset lähenemisviisi, mis ühendab infrastruktuuri kui teenust (IaaS) ja tarkvara kui teenust (SaaS) käitumise mudeleid. Rõhu-tamist väärib, et tasakaal IaaS ja SaaS tarkvara käitamismudelite vahel on kohandatud vas-tavalt andmeallikate tüübile ja keerukusele. Praktilise panusena realiseeritakse töös tulevikuarhitektuuri komponentidele tuginedes kaks kaasust. Esmalt, ostuarvete XML-ide ridade ning teiseks, ülesõitude logiandmete automa-tiseeritud analüüsi- ja andmetöötlusvood. Praktiliste kaasuste jaoks arendatud lahendused baseeruvad mh tehnoloogiatel nagu Dagster andmetöötlusvoogude orkestreerimiseks, Post-gres andmete säilitamiseks ja Streamlit andmete visualiseerimiseks. Sellega annab lõputöö praktilise panuse EVRi andmetöötlusvõimekuse edasisse parandamisse ja valmistab ette tehnilist võimekust ja asutusesisest kompetentsi SaaS andmejärve platvormi kasutuselevõ-tuks. Eeldatavalt saab selleks platvormiks olema Microsoft Fabric. Lõputöö annab üldisema panuse andmehalduse ja andmetehnika valdkonda, pakkudes struk-tureeritud raamistikku analüütiliste lahenduste arhitektuuridisaini loomiseks. Võttes arvesse andmetehnika ja ärianalüüsi suhteliselt mõõdukat varasemat vaagimist raudteesektoris, toetab käesolev lõputöö märkimisväärselt selle teadmislünga ületamist.listelement.badge.dso-type Kirje , Andmelao disain ja arendus Aktsiaselts Kihnu Veeteed näitel(Tartu Ülikool, 2024) Kurg, Silver; Raun, Kristo, juhendaja; Tartu Ülikool. Loodus- ja täppisteaduste valdkond; Tartu Ülikool. Arvutiteaduse instituutThe aim of this master's thesis is to provide the reader with a comprehensive overview of data warehousing architecture and modelling. The practical part of the study focuses on organizing the initial data of AS Kihnu Veeteed and designing and developing a data ware-house based on it. As a result, the data will be consolidated into a unified data warehouse, and the desired reports will be created for the client, utilizing the capabilities of the data warehouse.listelement.badge.dso-type Kirje , Avaandmeait(Tartu Ülikool, 2025) Lõhmus, Kristjan; Raun, Kristo, juhendaja; Kongo, Priit, juhendaja; Tartu Ülikool. Loodus- ja täppisteaduste valdkond; Tartu Ülikool. Arvutiteaduse instituutEstonia has numerous open datasets published by different public sector agencies, but their impact is limited by fragmentation, inconsistent quality, and a lack of machine-readability. This thesis addresses these issues by designing and implementing a centralized open data analytics platform called Avaandmeait. The platform is built on a modern data lakehouse architecture, combining the flexibility of data lakes with the structured querying capabilities of data warehouses. It leverages technologies such as Apache Iceberg for a unified table storage format, Trino for distributed querying, Apache Airflow for workflow orchestration, and dbt for managing data transformations. By standardizing formats and consolidating previously siloed datasets into a single repository, the system enhances data quality, comparability, and accessibility, allowing analysts to focus on insights rather than data cleaning. The thesis demonstrates the platform’s practical benefits through use cases, including combining traffic information from Transport Administration with geospatial data from the Land Board and meteorological data from the Environmental Agency, and linking procurement data from Public Procurement Register with economic data from the Business Register. These scenarios illustrate how Avaandmeait enables complex cross-domain analyses that were previously cumbersome to performlistelement.badge.dso-type Kirje , Exploring SQL-based near real-time conformance checking using Stream Processing Engines(Tartu Ülikool, 2024) Annilo, Agnes; Raun, Kristo, juhendaja; Tartu Ülikool. Loodus- ja täppisteaduste valdkond; Tartu Ülikool. Arvutiteaduse instituutVastavuskontrolli kasutatakse äriprotsesside korrektse toimimise valideerimiseks. Sündmuste logide vastavuse kontrollimist kasutatakse tihti terviklikkuse ja regulatsioonidele vastavuse tagamisel. Andmevoogude töötlemisele keskenduvate platformide arenguga, mis pakuvad peaaegu reaalajas andmetöötlust, saab mittevastavust kiiresti ja täpselt tuvastada. Andmevoogude töötlemise platformid nagu Kafka või Spark on kujundatud andmete töötlemiseks peaaegu reaalajas ja on optimeeritud SQL-i jaoks. Magistritöös uuritakse vastavuse kontrolli võimalikku rakendamist, kasutades SQL-i koos Kafka ja ksqlDB või Spark Structured Streaming platformiga reaalajas andmevoogude vastavuse kontrollimisel. Magistritöös vormistatakse nende platformide asutamise võimalused ning puudused.listelement.badge.dso-type Kirje , Machine Learning Based Risk Scoring for Money Mule Detection(Tartu Ülikool, 2025) Hiiu, Annabel; Karumaa, Anti; Raun, Kristo, juhendaja; Martignano, Anna, juhendaja; Jöhnemark, Alexander, juhendaja; Tartu Ülikool. Loodus- ja täppisteaduste valdkond; Tartu Ülikool. Arvutiteaduse instituutMoney laundering is a serious problem for the financial systems, as it helps criminals hide illegal funds and damages trust in banks. Money mules are individuals who transfer money on behalf of others, often unknowingly, and play a central role in these activities. Detecting money mules is a major challenge for financial institutions. Traditional detection methods rely on fixed rules that are not flexible enough to keep up with changing criminal tactics. This thesis explores the application of machine learning models for detecting money mules by assigning client-level risk scores based on transaction habits, product usage, and personal information. Multiple models were evaluated, with XGBoost demonstrating the highest area under the precision–recall curve (AUPRC) of 0.1314, indicating strong performance in this highly imbalanced setting. The model shows potential to detect over half of known money mules while maintaining a manageable false positive rate. These findings suggest that integrating machine learning into anti-money laundering systems can improve anti-money laundering efforts, helping banks prevent criminal activity, protect their customers and maintain their reputation.listelement.badge.dso-type Kirje , PCB komponentide tuvastamine(Tartu Ülikool, 2025) Tiitson, Joonas; Raun, Kristo, juhendaja; Tartu Ülikool. Loodus- ja täppisteaduste valdkond; Tartu Ülikool. Arvutiteaduse instituutThe mission of this paper is to create machine learning based models for detecting the orientation of printed circuit board (PCB) components. To achieve the desired goal, during the course of this work it was necessary to create a photo-bank of different kinds of annotated PCB-s, two models, one based on Faster-RCNN with a ResNeXt backbone and the other based on YOLO. A few validation and testing programs were created to compare the upsides and downsides of each model. During the development process, it was a general rule to try use open-source solutions, so that the created programs and models would be free to use for anyone who is interested. The completed project allows anyone to connect their annotated project to model training files, to use them for directional object detection.