Mining social well-being using mobile data

dc.contributor.advisorSharma, Rajesh, juhendaja
dc.contributor.authorGoel, Rahul
dc.contributor.otherTartu Ülikool. Loodus- ja täppisteaduste valdkondet
dc.date.accessioned2023-06-08T10:15:43Z
dc.date.available2023-06-08T10:15:43Z
dc.date.issued2023-06-08
dc.description.abstractMobiilsed andmed, nagu kõneandmete kirjed (CDR) ja digitaalsed andmed, loovad suure hulga andmeid, mis sisaldavad väärtuslikku teavet inimeste käitumise kohta. Käesolevas lõputöös keskendume ühiskonna heaolu kolmele tahule. Esiteks pakume välja kaks mobiilsusepõhise SIR-mudeli versiooni, (i) täielikult segatud ja (ii) keeruliste võrkude jaoks, mis võtavad arvesse CDR-i tegelikke interaktsioone. See töö on inspireeritud eeldusest, et mõne epideemia pandeemiaks muutumise peamine põhjus on globaalne seotus, mis muudab lihtsamaks suurema geograafilise piirkonna, sageli globaalse, mõjutamise. Lisaks ei ole rahvastiku jaotus, inimeste liikuvus ja sotsiaalne sidusus kogu maailmas ühtlane, mis mängib kriitilist rolli. Kasutasime oma mudelit COVID-19 juhtumite prognoosimiseks Eestis ja Prantsusmaal Rhône-Alpes. Teiseks uurime CDR-andmete abil ühiskondlikku segregatsiooni Eestis. Meie tulemused viitavad sellele, et (i) Eestis esineb sooline segregatsioon ja selle jäljed on nähtavad nii inimeste helistamisaegades, vanuserühmade ühenduvuses, eelistatud suhtluskeeles kui ka maakonnas; (ii) Peamised töötavad isikud (st (25–54) vanuserühm) ja vanurid (s.o (64–100) vanuserühm) on rohkem segregeeritud; (iii) Eesti- ja venekeelsed isikud on keelepõhiselt eraldatud. Kolmandaks uurime sotsiaal-majanduslike tingimuste (SEC) ennustamiseks mobiilirakenduste (nt Twitter ja Facebook) digitaalseid jälgi. Need tingimused hõlmavad haridust, sugu, vaesust, tööhõivet ja muid tegureid. Seetõttu on usaldusväärne ja täpne teave sotsiaaluuringute ja valitsuse politseitöö jaoks ülioluline. Rakenduste kasutusmustreid kasutades suudab meie parim mudel hinnata majanduslikke, hariduslikke ja demograafilisi näitajaid (saavutades R-ruudu skoori kuni 0,66). Lisaks anname aru nende mudelite seletatavuse kohta, et teha kindlaks prognoosimise olulised tunnused. Avastame, et mobiilirakenduste kasutusmustrid võivad paljastada sotsiaalmajanduslikke erinevusi.et
dc.description.abstractMobile data such as call data records (CDR), and digital data generate a large volume of data that carries valuable information about people’s behavior. In this thesis, we focus on three facets of societal well-being. First, we propose two versions of the mobility-based SIR model, (i) fully-mixed and (ii) for complex networks, which take into account real-life interactions from CDR. This work is inspired by the assumption that the fundamental cause for some epidemics becoming pandemics is global connectedness, which makes it easier to affect a larger geographical area, often globally. Furthermore, population distribution, people’s mobility, and social coherence are not uniform across the globe which plays a critical role. We also used our model to forecast the COVID-19 cases for Estonia and Rhône-Alpes region in France. Second, we study societal segregation in Estonia using CDR data. Our findings suggest that (i) gender segregation exists in Estonia and its traces are visible in individuals calling hours, connectivity among age-groups, preferred language of communication, and in the county; (ii) The prime working individuals (i.e., (25-54) age-group) and elderly (i.e., (64-100) age-group) are more segregated; (iii) Estonian-speaking and Russian-speaking individuals are segregated based on language. Third, we investigate digital traces from mobile apps (like Twitter and Facebook) to predict socio-economic conditions (SEC). These SEC include education, gender, poverty, employment, and other factors. Therefore, reliable and accurate information is critical for social research and government policing. Using the app's usage patterns, our best model is able to estimate economic, educational, and demographic indicators (attaining an R-squared score up to 0.66). Furthermore, we report on the explainability of these models in order to identify the important features for prediction. We discover that mobile app usage patterns can reveal socio-economic disparities.en
dc.description.urihttps://www.ester.ee/record=b5563050et
dc.identifier.isbn978-9916-27-247-3
dc.identifier.isbn978-9916-27-248-0 (pdf)
dc.identifier.issn2613-5906
dc.identifier.issn2806-2345i(pdf)
dc.identifier.urihttps://hdl.handle.net/10062/90290
dc.language.isoenget
dc.relation.ispartofseriesDissertationes informaticae Universitatis Tartuensis;42
dc.rightsopenAccesset
dc.rightsAttribution-NonCommercial-NoDerivatives 4.0 International*
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/4.0/*
dc.subjectsegregationen
dc.subjectsocial conditionsen
dc.subjecteconomic conditionsen
dc.subjectsocial welfareen
dc.subjectdata miningen
dc.subjectmobile applicationsen
dc.subjectmobile communicationen
dc.subject.otherdissertatsioonidet
dc.subject.otherETDet
dc.subject.otherdissertationset
dc.subject.otherväitekirjadet
dc.subject.othermobiilsideet
dc.subject.othermobiilirakendusedet
dc.subject.otherandmekaeveet
dc.subject.othersotsiaalne heaoluet
dc.subject.othersotsiaalsed tingimusedet
dc.subject.othermajandustingimusedet
dc.titleMining social well-being using mobile dataet
dc.title.alternativeSotsiaalse heaolu kaevandamine kasutades mobiilseid andmeidet
dc.typeThesiset

Files

Original bundle
Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
goel_rahul.pdf
Size:
5.71 MB
Format:
Adobe Portable Document Format
Description:
License bundle
Now showing 1 - 1 of 1
No Thumbnail Available
Name:
license.txt
Size:
1 B
Format:
Item-specific license agreed upon to submission
Description: