Superintellekti väärtuste joondamise probleem

Kuupäev

2024

Ajakirja pealkiri

Ajakirja ISSN

Köite pealkiri

Kirjastaja

Tartu Ülikool

Abstrakt

Käesoleva bakalaureusetöö peamine eesmärk on tuua esile superintellektiga seotud väärtuste seadistamise suurimaid probleeme ning esitleda probleemseid aspekte varasemate teooriatega, näiteks koherentse ekstrapoleeritud tahtluse teooriaga, aga näiteks ka ettepanekuga, et superintellekt ise väärtusteooria välja mõtleb. Kirjutise juhatab sisse kirjeldus tehisintellektist kui tehislikust arvutimõistusest ning kuidas sellest võib välja areneda superintellekt. Kui niisugune superintelligentne agent peaks läbima intellektiplahvatuse, mille vältel see muutub targemaks kui kõige targemad inimesed maailmas, võib sellega kaasneda suuri ohtusid inimkonnale. Välistatud ei ole, et superintellekt on inimeste suhtes vaenulik või ükskõikne. Sellepärast on oluline, et inimeste ja superintellekti väärtused oleksid omavahel kooskõlas.

Kirjeldus

Technological advancements in the 21 st century have brought forth a debate about artificial intelligence and how to align the values of AI in a way that future superintelligent agents would come to share values with human beings. Yudkowsky’s coherent extrapolated volition is one of the prime examples of theories for AI value alignment, however, as this thesis suggests, many of these theories come with some pitfalls, which makes value alignment an extremely complex task. For one, if some ethical theories would be used, it would run the risk of the AI being locked down to a single, potentially flawed, ethical theory, forever. Pluralism may be a valid solution, as then the AI could make a choice regarding the best moral theory to apply to certain scenarios. Some have also suggested that a superintelligent AI system could come up with a new ethical theory. This could, however, be risky, because the AI would likely need to have some moral base to make the values align with humans. I propose a system similar to the MIT Moral Machine project, where the users, as well as experts of artificial intelligence can participate in the value alignment of an AI system.

Märksõnad

filosoofia, philosophy, tehisintellekt, artificial intellect

Viide