menu_open
Columnists Actual . Favourites . Archive
We use cookies to provide some features and experiences in QOSHE

More information  .  Close
Aa Aa Aa
- A +

Çileğin Peşinde: ChatGPT o1 yavaş ama daha akıllı

8 5
13.09.2024

OpenAI firması merakla beklenen yeni modelini 12 Eylül günü Türkiye saatiyle 20.00 sularında duyurdu. o1 kod adıyla yayınlanan modelin o1-mini ve o1-preview versiyonları ChatGPT Pro, ChatGPT Enterprise ve OpenAI API Tier 5 kullanıcılarının kullanımına aynı gün açıldı. Nitekim (12 Eylül’ün devrisi günü böyle bir kelime kullanmak istemezdim.) Twitter’da akşam saatlerinde yaşanan yoğun tweet floodları OpenAI’ın sadık kullanıcılarının beklemeye pek tahammülleri olmadığını gösterdi. Yeni model ile 10 saniyenin altında hazırlanan yılan oyunları, 2 boyutlu Super Mario benzeri oyunlar, hava durumu mobil uygulamaları arzı endam etmeye başladı.

29 Ağustos’da Serbestiyet sitesinde yayımlanan yazımızda yeni dil modelinin ilk işaretlerinin şirket CEO’su Sam Altman’ın bahçesinden paylaştığı bir çilek ağacı fotoğrafı ile verildiğini yazmıştık. Herkes bunun yeni dil modelinin bir işaret fişeği olduğunu tahmin etmiş, GPT5’in ayak sesleri olarak algılamıştı ama pek çoklarının zihninde çilek (Strawberry) bir anlam ifade etmemişti.

o1’in aynı gün yayınlanan tanıtım videolarından anlaşılıyor ki Strawberry kelimesi hiç de öyle boşuna seçilmiş bir kelime değil. Strawberry, dil modellerinin konteksti anlama kapasitelerin ölçmek için yapılan basit bir teste dayanıyor. Ticari dil modellerinin en güçlüsü GPT4o’nun dahi çuvalladığı test gayet basit. Dil modellerine Strawberry kelimesinde kaç adet “r” harfi var, diye sorduğunuzda maalesef doğru cevap veremiyordu. 2 olarak hızlıca verdiği cevap, çuvallamanın en büyük işaretiydi. Sorunun kaynağı dil modellerinin token (hece) düzeyinde işlem yapması ve hızlı cevap vermeye konsantre olmasıydı. Strawberry kod adı aslında o1 modelinin hızdan ziyade, düşünme, problemli küçük parçalara bölme (chain-of-thought), adım adım sonuca yaklaşma kabiliyetine işaret ediyor. Ve evet, yeni model Strawberry sorusuna doğru cevap verebiliyor.

Yeni dil modellerinde hızdan daha çok, cevap öncesi problemi........

© Serbestiyet


Get it on Google Play