Empowering machine learning pipelines with automated feature engineering

dc.contributor.advisorEl Shawi, Radwa Mohamed El Emam, juhendaja
dc.contributor.authorEldeeb, Hassan Abdulgaleel Hassan Salim
dc.contributor.otherTatu Ülikool. Loodus- ja täppisteaduste valdkond
dc.date.accessioned2024-09-19T06:58:56Z
dc.date.available2024-09-19T06:58:56Z
dc.date.issued2024-09-19
dc.description.abstractSuurandmete ajastul on esile kerkinud automaatne masinõpe (AutoML), mis üritab tasakaalustada ühelt poolt kasvavaid andmemahte ja teiselt poolt piiratud andmeteaduse oskusteavet. Tehnoloogia aluseks on raamistikud, mis automatiseerivad keerulise ja iteratiivse masinõppemudelite loomise protsessi, laiendades seeläbi andmeanalüüsi kättesaadavust ja tõhusust. Üheks keskpunktiks on innovatsioon automaatses omaduste väljatöötamises (Feature Engineering, FE). See on oluline, kuid traditsiooniliselt töömahukas samm, mis suurendab mudeli täpsust andmeatribuutide intelligentse valimise ja muundamise kaudu. Siin peitub BigFeat'i olulisus. See on uuenduslik raamistik, mis on hoolikalt konstrueeritud FE protsessi automatiseerimiseks ja uuendamiseks. BigFeat eristub sellega, et ühendab sujuvalt skaleeritavuse seletatavusega, tagades, et omaduste automaatne genereerimine ei varjutaks mudeli ennustuste taga olevat põhjendust. Põhjalikul võrdlemisel olemasolevate raamistikega on BigFeat järjepidevalt näidanud paremat tulemust, pakkudes märkimisväärseid täpsuse parandusi mitmekesistel andmekogumitel. Raamistiku disain, mis keskendub dünaamilisele omaduste genereerimisele ja valikule mitte ainult ei tõsta mudeli sooritust, vaid säilitab ka kasutaja usalduse ja mõistmise jaoks hädavajaliku tõlgendatavuse. BigFeat'i juurutamine tähistab olulist verstaposti AutoML maastikul, pakkudes tugevat lahendust, mis demokratiseerib keeruka andmeanalüüsi. FE-s ulatusliku domeeniteadmiste vajaduse leevendamisega annab BigFeat laiemale kasutajate hulgale võimaluse kasutada masinõpet, edendades innovatsiooni üle mitmete valdkondade.
dc.description.abstract In the era of Big Data, Automated Machine Learning (AutoML) has emerged as a transformative force, bridging the gap between burgeoning data volumes and the limited supply of data science expertise. This technological leap is epitomized by frameworks that automate the complex and iterative process of crafting machine learning models, thereby broadening the accessibility and efficiency of data analysis. Central to this evolution is the innovation in Automated Feature Engineering (FE) — a pivotal yet traditionally labor-intensive step that enhances model accuracy through the intelligent selection and transformation of data attributes. Herein lies the significance of BigFeat, a pioneering framework meticulously engineered to automate and revolutionize the FE process. BigFeat distinguishes itself by seamlessly blending scalability with interpretability, ensuring the automated generation of features does not obscure the rationale behind model predictions. Through exhaustive benchmarking against existing frameworks, BigFeat has consistently demonstrated superior performance, delivering significant accuracy improvements across diverse datasets. Its design, focused on dynamic feature generation and selection, not only boosts model performance but also preserves the interpretability essential for user trust and understanding. BigFeat's introduction marks a significant milestone in the AutoML landscape, offering a robust solution that democratizes advanced data analysis. By mitigating the need for extensive domain knowledge in FE, BigFeat empowers a wider spectrum of users to leverage machine learning, fostering innovation and insight across various fields.
dc.description.urihttps://www.ester.ee/record=b5701415
dc.identifier.isbn978-9916-27-653-2
dc.identifier.isbn978-9916-27-654-9 (pdf)
dc.identifier.issn2613-5906
dc.identifier.issn2806-2345 (pdf)
dc.identifier.urihttps://hdl.handle.net/10062/104787
dc.language.isoen
dc.relation.ispartofseriesDissertationes informaticae Universitatis Tartuensis; 56
dc.rightsAttribution-NonCommercial-NoDerivs 3.0 Estoniaen
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/ee/
dc.subject.othertehisõpe
dc.subject.othertehisintellekt
dc.subject.othersuurandmed
dc.subject.otherautomatic learning
dc.subject.otherartificial intelligence
dc.subject.otherbig data
dc.titleEmpowering machine learning pipelines with automated feature engineering
dc.title.alternativeVõimestades masinõppekonveiereid automatiseeritult tunnuste loomisega
dc.typeThesisen

Files

Original bundle

Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
Eldeeb_hassan.pdf
Size:
3.56 MB
Format:
Adobe Portable Document Format