Alignment and Safety Challenges in a Superintelligent AI Landscape

Jõemaa, Evelin

Alignment and Safety Challenges in a Superintelligent AI Landscape

Failid

Joemaa_ITmitteinformaatikutele_2025.pdf (632.2 KB)

Kuupäev

2025

Autorid

Jõemaa, Evelin

Kirjastaja

Tartu Ülikool

Abstrakt

Artificial intelligence (AI) technologies are developing at a rapid pace, and with that, the discussions on AI safety have gained importance. This thesis aims to explore the concerns that members of online AI alignment communities have in regards to AI safety and alignment and compare them to the opinions of the key figures in the AI safety and alignment field. Five interviews were conducted via online conferencing platforms with participants recruited from online AI alignment communities. The interviews were on the topics of AI safety, AI alignment, and ethical concerns of AI development. Additionally, five interviews with key figures in the AI safety and alignment field were analysed from interviews available on YouTube for comparison with participant interviews. Interviews were transcribed, and thematic analysis was conducted to identify key themes. The findings show a significant concern that the participants have regarding current safety measures. The concerns were often related to the rapid speed of the advancements in AI technology and the shortcomings they saw with the current safety measures in being able to handle the developments. Participants saw the unintended consequences of AI development being a bigger risk in the future, but also highlighted the already present risks of current AI models, such as the ability for people to create deep-fakes, etc. The community forum participants highlighted the need for more collaboration between private companies and governments to have better measures put in place internationally for developing safe AI models.
Tehisaru (TA) süsteemid arenevad suure kiirusega ning sellega koos on tõusnud arutelude olulisus TA ohutuse teemal. Magistritöö eesmärk on uurida veebipõhiste TA joondumise ja ohutuse kogukondade vaateid TA joondumise ja ohutuse kohta ning võrrelda neid sama valdkonna võtmeisikute arvamustega. Magistritöö raames viidi videokonverentsi platvormide kaudu läbi viis intervjuud osalejatega, keda värvati veebipõhistest TA joondumise ning ohutuse kogukondadest. Intervjuud käsitlesid TA ohutust ja joondumist ning eetilisi murekohti TA arendamisel. Lisaks analüüsiti viite intervjuud TA joondumise ja ohutuse valdkonna võtmeisikutega, mis olid kättesaadavad YouTube kaudu, et neid võrrelda magistritöö raames korraldatud intervjuudega. Intervjuud transkribeeriti ning olulisemate teemade väljaselgitamiseks kasutati temaatilist analüüsi. Tulemused näitavad, et intervjuus osalejad tundsid palju muret praeguste TA ohutusmeetmete pärast. Mured olid tihti seotud TA kiire arenguga ning praeguste ohutusmeetmete piiratusega, et kiire arenguga kaasas käia. Osalejad leidsid, et ootamatud tagajärjed TA arendamisel on tulevikus suurem oht, kuid rõhutasid ka juba praeguseid riske, mida TA süsteemid endast kujutavad, näiteks võimalus luua süvavõltsinguid. Osalejad rõhutasid vajadust suurema koostöö järele eraettevõtete ja valitsuste vahel, et kehtestada rahvusvahelisel tasandil paremaid meetmeid ohutute TA süsteemide arendamiseks.

Märksõnad

Artificial intelligence, AI alignment, AI safety, tehisaru turvalisus, tehisaru

URI

https://hdl.handle.net/10062/117149

Kollektsioonid

LTAT magistritööd – Master's theses

Kirje täielik lehekülg

Alignment and Safety Challenges in a Superintelligent AI Landscape

Failid

Kuupäev

Autorid

Ajakirja pealkiri

Ajakirja ISSN

Köite pealkiri

Kirjastaja

Abstrakt

Kirjeldus

Märksõnad

Viide

URI

Kollektsioonid