Geniş dil modellerine dair
Geçtiğimiz haftaki yazımda, insanlık olarak bilincimiz ve lisanımız arasındaki karmaşık ilişkiyi çözme yolunda attığımız önemli adımlardan ve o adımların önemli ürünlerinden biri olan Geniş Dil Modellerinden (GDM) bahsetmiştim.
Bu hafta ise, GDM’lerin işleyişine dair daha teknik detaylara ve bu teknolojinin getirdiği bazı etik ve güvenlik meselelerine değinmek istiyorum.
Tabi, “bu son derece teknik bir konu, bize ne GDM dünyasının teknik terimlerinden” diye düşünen okurlarım olabilir.
Çoğu insanın adını ilk defa otuz sene önce işittiği internet, modem, çevirmeli ağ, ADSL, fiber, VPN gibi “son derece teknik” kavramlar bugün günlük hayatımızın bir parçası olmuş durumda. Yapay zeka devrimi, internet devriminden kat kat büyük bir hızla hayatımıza nüfuz ediyor. Olan biteni anlamakta zorlanmamak için GDM’lerle çalışırken sıkça karşımıza çıkan birkaç önemli teknik terimi şimdiden öğrenmekte herkes için fayda olduğunu düşünüyorum.
Bahsedeceğim ilk kavram “token sayısı”.
GDM’ler kendilerine verilen metinleri, “token” adı verilen küçük parçalara ayırır. Bu parçalar genellikle kelimeler veya kelime parçalarıdır. Token sayısı, bir GDM’nin işleyebileceği ve üretebileceği anlam birimlerinin sayısını ifade eder. Yani bu sayı GDM’nin işlem kapasitesi ile doğrudan ilişkilidir. Daha fazla token kapasitesine sahip........
© Karar
visit website