Yapay zekâ çağında kayıp olan dünyalar

Bu hafta Guardian’da yayım­lanan ilginç bir analiz, yapay zekânın hayatımıza ne kattığından çok, ondan sessizce neleri kaybet­tiğimizi tartışıyordu. Yazının mer­kezindeki hikâye basit ama çar­pıcıydı: Dijital dünyanın dışında kalan bilgilerin, pratiklerin, ritü­ellerin, kavrayışların yani insanlı­ğın görünmez hafızasının hızla si­liniyor olması. Hepimizin her gün başvurduğu yapay zekâ sistemle­ri aslında dünyanın tamamını de­ğil, yalnızca dijitalde temsil edilen küçük bir bölümünü biliyor. Ve biz fark etmeden, bu eksik dünya ya­vaş yavaş gerçek dünyanın yerine geçiyor.

Bugün sorunun özü, bilginin elimizin altında olması değil. Asıl mesele, elimizin altında olmayanı artık hiç fark etmiyor oluşumuz. Çünkü dijitalde görünmeyen her şey, sanki hiç var olmamış gibi dav­ranılıyor. Oysa binlerce yıllık pra­tikler, yerel ekolojik zekâ, sözlü ge­lenekler, iyileştirme yöntemleri, tarım bilgisi, su yönetimi, mimari teknikler yani insanlık tarihi bo­yunca toplumları taşıyan bütün o bilgi çoğu zaman hiç kayda geçme­di. Yaşayarak, görerek, dokunarak, dinleyerek aktarıldı. Bugün ise ya­pay zekânın göremediği bu alan, bizim de göremediğimiz bir karan­lığa dönüşüyor. Ve burada yalnız­ca tarihsel bilgi kaybı değil, gelece­ğe yön veren kapasitenin de sarsıl­ması söz konusu.

Yapay zekâyı eğiten veri setleri­ne bakınca tablo ürkütücü bir sa­delikle ortaya çıkıyor. Deepak Va­ruvel Dennison’un analizine göre dünya nüfusunun yüzde 97’sinin konuştuğu diller “düşük kaynaklı” kabul ediliyor; yani dijital evrende yeterince temsil edilmiyor. Hintçe dünyada en çok konuşulan diller­den biri ama internet verilerinde payı yüzde bir bile değil. Tamilce, milyonlarca insanın anadili olma­sına rağmen veri setlerinde nere­deyse yok hükmünde. Afrika dil­lerinin çoğu, yapay zekâ açısından adeta görünmez.

Bu eşitsizlik en büyük kamuya açık eğitim veri kaynaklarından biri olan Common Crawl’da çok net görülüyor: 18 yıla yayılan 300 milyardan fazla web sayfasına rağ­men, dünya nüfusunun yalnızca yüzde 19’u tarafından konuşulan İngilizce verinin yüzde 45’ini oluş­tururken; dünya nüfusunun yüzde 7.5’i tarafından konuşulan Hintçe verinin sadece yüzde 0.2’sini, 86 milyon kişinin konuştuğu Tamil ise yalnızca yüzde 0,04’ünü temsil ediyor. Dil devleri bile görünmez­leşiyorsa, küçük dillerin durumu tahmin edilebilir:........

© Dünya