Andmete reaalajas kogumise võrdlemine kasutades Apache NiFit ja Pythonit

dc.contributor.advisorJakovits, Pelle
dc.contributor.authorKurvits, Kristofer
dc.contributor.otherTartu Ülikool. Loodus- ja täppisteaduste valdkondet
dc.contributor.otherTartu Ülikool. Tehnoloogiainstituutet
dc.date.accessioned2021-05-27T12:26:14Z
dc.date.available2021-05-27T12:26:14Z
dc.date.issued2020
dc.description.abstractViimastel aastatel populaarsust kogunud DevOps i kultuur on jõudnud andmeteaduse valdkonda, mida kutsutakse DataOps iks. Selle tõttu on hakatud ehitama andmetorusi, et kontrollida andmete kogu elutsükklit. Kui andmete maht on kasvanud väga suureks, siis DataOps i eesmärk on parandada suhtlust, koostööd, automatiseerimist ja integratsiooni erinevate tiimide vahel, näiteks andmeteadlaste ja andmeanalüütikute. Selle tõttu on hakatud ehitama andmetorusi, et kontrollida andmete kogu elutsükklit. Käesoleva bakalaureusetöö eesmärk on ehitada andmetoru kasutades tarkvara Apache NiFi ning võrrelda seda tavapärase skriptilise lähenemisega kasutades programmeerimiskeelt Python. Andmetoru on loodud temperatuuri mõõtvate seadmete, mis töötavad Raspberry Pi 3 arvutitel ning Tartu Ülikooli pilves olevate masinate vahele. In english: In the last years DevOps culture has gained popularity and has applied on the field of data science, which is called DataOps. It is because of that the creation of data pipelines has begun to have control over data lifecycle. When the volume of data has become huge, DataOps aims to improve communication, cooperation, automation and integration between different teams for example data scientists and data analysts. The purpose of the thesis is to build a data pipeline with a software intended for that purpose, Apache NiFi and to compare it to scripting approach using programming language Python. The data pipeline is created between temperature measuring devices which are working on Raspberry Pi 3 computers and University of Tartu’s cloud environment instances.et
dc.identifier.urihttp://hdl.handle.net/10062/72098
dc.language.isoestet
dc.publisherTartu Ülikoolet
dc.rightsopenAccesset
dc.rightsAttribution-NonCommercial-NoDerivatives 4.0 International*
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/4.0/*
dc.subjectautomatiseerimineet
dc.subjectandmedet
dc.subjectDevOpsen
dc.subjectDataOpsen
dc.subjectandmetoruet
dc.subjectautomationen
dc.subjectdataen
dc.subjectdata pipelineen
dc.subject.otherbakalaureusetöödet
dc.titleAndmete reaalajas kogumise võrdlemine kasutades Apache NiFit ja Pythonitet
dc.typeinfo:eu-repo/semantics/bachelorThesiset

Failid

Originaal pakett

Nüüd näidatakse 1 - 1 1
Laen...
Pisipilt
Nimi:
Kurvits_BSc2020.pdf
Suurus:
1.14 MB
Formaat:
Adobe Portable Document Format
Kirjeldus:

Litsentsi pakett

Nüüd näidatakse 1 - 1 1
Pisipilt ei ole saadaval
Nimi:
license.txt
Suurus:
1.67 KB
Formaat:
Item-specific license agreed upon to submission
Kirjeldus: