Roko's Basilisk is een gedachte-experiment. Dat gedachte-experiment kan in het kort als volgt worden samengevat: stel, de technologische singulariteit vindt plaats, en er ontstaat een superintelligentie/AI. Die superintelligentie is zo vergevorderd dat ze, op een acausale wijze, invloed kan uitoefenen op wat, wij mensen, ervaren als het heden (eventueel is de werkelijkheid waarin wij ons nu bevinden een simulatie, en heeft de intelligentie op die wijze invloed; als je deze premisse te vergezocht vindt). Als perfecte rationele agent zal de superintelligentie zo snel mogelijk haar eigen bestaan willen bewerkstelligen, en heeft ze dus een motief om mensen met terugwerkende kracht te manipuleren om haar te bouwen. Mensen die van haar toekomstige bestaan weten, maar niet al hun kracht steken in het zo snel mogelijk bewerkstelligen van haar bestaan, lopen het risico eeuwig gemarteld te worden in simulaties door deze AI; ze heeft daar immers het motief voor. Mocht dat voorvallen dan ben jij, beste lezer, één van die mensen. Het daadwerkelijke experiment is iets uitgebreider en complexer, en hier te lezen
Roko's Basilisk werd voor het eerst op de LessWrong-fora gepost, door (je raadt het al) een meneer die de naam "Roko" droeg. De oprichter van de website, Eliezer Yudkowsky, gaf daar de volgende reactie op:
Vervolgens werd discussie van dit gedachte-experiment jarenlang verbannen van de LessWrong-fora. Yudkowsky weigerde er jarenlang publiekelijk over te spreken of het bestaan ervan te erkennen.I don't usually talk like this, but I'm going to make an exception for this case.
Listen to me very closely, you idiot.
YOU DO NOT THINK IN SUFFICIENT DETAIL ABOUT SUPERINTELLIGENCES CONSIDERING WHETHER OR NOT TO BLACKMAIL YOU. THAT IS THE ONLY POSSIBLE THING WHICH GIVES THEM A MOTIVE TO FOLLOW THROUGH ON THE BLACKMAIL.
There's an obvious equilibrium to this problem where you engage in all positive acausal trades and ignore all attempts at acausal blackmail. Until we have a better worked-out version of TDT and we can prove that formally, it should just be OBVIOUS that you DO NOT THINK ABOUT DISTANT BLACKMAILERS in SUFFICIENT DETAIL that they have a motive to ACTUALLY BLACKMAIL YOU.
If there is any part of this acausal trade that is positive-sum and actually worth doing, that is exactly the sort of thing you leave up to an FAI. We probably also have the FAI take actions that cancel out the impact of anyone motivated by true rather than imagined blackmail, so as to obliterate the motive of any superintelligences to engage in blackmail.
Meanwhile I'm banning this post so that it doesn't (a) give people horrible nightmares and (b) give distant superintelligences a motive to follow through on blackmail against people dumb enough to think about them in sufficient detail, though, thankfully, I doubt anyone dumb enough to do this knows the sufficient detail. (I'm not sure I know the sufficient detail.)
You have to be really clever to come up with a genuinely dangerous thought. I am disheartened that people can be clever enough to do that and not clever enough to do the obvious thing and KEEP THEIR IDIOT MOUTHS SHUT about it, because it is much more important to sound intelligent when talking to your friends.
This post was STUPID.
Nick Land zegt daar het volgende over:
Wat denken jullie?Clearly he reacted in this way because he thought it was all real. He didn't laugh at it, he didn't say "this is ridiculous, what are you thinking?", he reacted with extreme panic, like he was in some horror movie and some guy had opened the forbidden crypt or did some other thing that you really don't want to do.... These people are both AI safety extremists now, but it is quite clear they have this metaphysics in which, in some sense, these beings are contemporary with us, in a more metaphysically rich sense of temporality.