Yapay zekâ çağında kayıp olan dünyalar
Bu hafta Guardian’da yayımlanan ilginç bir analiz, yapay zekânın hayatımıza ne kattığından çok, ondan sessizce neleri kaybettiğimizi tartışıyordu. Yazının merkezindeki hikâye basit ama çarpıcıydı: Dijital dünyanın dışında kalan bilgilerin, pratiklerin, ritüellerin, kavrayışların yani insanlığın görünmez hafızasının hızla siliniyor olması. Hepimizin her gün başvurduğu yapay zekâ sistemleri aslında dünyanın tamamını değil, yalnızca dijitalde temsil edilen küçük bir bölümünü biliyor. Ve biz fark etmeden, bu eksik dünya yavaş yavaş gerçek dünyanın yerine geçiyor.
Bugün sorunun özü, bilginin elimizin altında olması değil. Asıl mesele, elimizin altında olmayanı artık hiç fark etmiyor oluşumuz. Çünkü dijitalde görünmeyen her şey, sanki hiç var olmamış gibi davranılıyor. Oysa binlerce yıllık pratikler, yerel ekolojik zekâ, sözlü gelenekler, iyileştirme yöntemleri, tarım bilgisi, su yönetimi, mimari teknikler yani insanlık tarihi boyunca toplumları taşıyan bütün o bilgi çoğu zaman hiç kayda geçmedi. Yaşayarak, görerek, dokunarak, dinleyerek aktarıldı. Bugün ise yapay zekânın göremediği bu alan, bizim de göremediğimiz bir karanlığa dönüşüyor. Ve burada yalnızca tarihsel bilgi kaybı değil, geleceğe yön veren kapasitenin de sarsılması söz konusu.
Yapay zekâyı eğiten veri setlerine bakınca tablo ürkütücü bir sadelikle ortaya çıkıyor. Deepak Varuvel Dennison’un analizine göre dünya nüfusunun yüzde 97’sinin konuştuğu diller “düşük kaynaklı” kabul ediliyor; yani dijital evrende yeterince temsil edilmiyor. Hintçe dünyada en çok konuşulan dillerden biri ama internet verilerinde payı yüzde bir bile değil. Tamilce, milyonlarca insanın anadili olmasına rağmen veri setlerinde neredeyse yok hükmünde. Afrika dillerinin çoğu, yapay zekâ açısından adeta görünmez.
Bu eşitsizlik en büyük kamuya açık eğitim veri kaynaklarından biri olan Common Crawl’da çok net görülüyor: 18 yıla yayılan 300 milyardan fazla web sayfasına rağmen, dünya nüfusunun yalnızca yüzde 19’u tarafından konuşulan İngilizce verinin yüzde 45’ini oluştururken; dünya nüfusunun yüzde 7.5’i tarafından konuşulan Hintçe verinin sadece yüzde 0.2’sini, 86 milyon kişinin konuştuğu Tamil ise yalnızca yüzde 0,04’ünü temsil ediyor. Dil devleri bile görünmezleşiyorsa, küçük dillerin durumu tahmin edilebilir:........





















Toi Staff
Sabine Sterk
Penny S. Tee
Gideon Levy
Waka Ikeda
Grant Arthur Gochin