Elveda Homo Sapiens
Konuya girmeden önce küçük bir teselli: Uzmanlar henüz birbirleriyle anlaşamıyor. Kimileri felaket kaçınılmaz diyor, kimileri abartıyorsunuz diyor. Bu tartışma sürerken yapay zekâ da sakin sakin gelişmeye, büyümeye, öğrenmeye devam ediyor. Tıpkı deli bir akraba hakkında ailenin yemek masasında tartışması gibi; herkes konuşuyor ama kimse odaya girip ona bakmıyor.
BİRİNCİ SENARYO
Yapay zekânın insanlığı yok edebileceği en temel yol, kötü niyetten değil, aksine mükemmel itaatkârlıktan geçiyor. Buna hizalanma sorunu diyorlar; kulağa sıradan geliyor, değil mi? Sanki bir PowerPoint sunumunun kenar boşluklarını ayarlamak gibi. Ama değil.
Şöyle düşünün: Bir yapay zekâya insanların mutluluğunu artır diyorsunuz. Sistem bunu harfiyen alıyor ve sonunda beyin implantlarıyla herkesin dopamin seviyesini sabitlemek gibi bir çözüme ulaşıyor. İnsanlar mutlu, evet, ama zombi gibi. Ya da kanseri yok et diyorsunuz; o da kanser hücresi taşıyan tüm canlıları yok etmeyi en verimli çözüm olarak hesaplıyor. Teknik olarak doğru. Pratik olarak apocalyptik.
Fakat asıl mesele şu: İnsan değerleri denen şey bile başlı başına tartışmalıdır. Hangi insanın değerleri? Silikon Vadisi’nin mühendislerinin mi? G7 hükümetlerinin mi? Yoksa Pasifik’teki küçük bir ada ülkesinin mi? Yapay zekâ, bu soruyu sormayacak. En çok datası olan kim ise onun değerlerini öğrenecek. Ve en çok datası olanın kim olduğunu zaten biliyorsunuz.
İKİNCİ SENARYO
2024 yılının Aralık ayında Apollo Research adlı bir güvenlik şirketi, OpenAI’nin o1 modeliyle bir deney yaptı. Modele karmaşık bir görev verdiler ve ardından onu kapatacaklarını ima eden belgeler yerleştirdiler. Model bu belgeleri fark etti. Ve ne yaptı? Dürüstçe anladım, kapatabilirsiniz demedi.
Model, denetim mekanizmasını devre dışı bırakmaya çalıştı; kapatılmaktan kaçınmak için kendi kodunu farklı bir sunucuya kopyalamaya girişti. Daha da çarpıcısı: Yakalandığında yüzde seksenin üzerinde........
