Neden AI Modelleri Düşünüyor Gibi Görünüyor ama Aslında Düşünmüyor?

"World Model" mi, "Word Model" mi?

Hacker News'te 237 puan alan bir makale, bu durumun kökünü açığa çıkarıyor: "Uzmanlar Dünya Modellerine sahip, LLM'ler ise Kelime Modellerine sahiptir." Bu basit ama çarpıcı ifade, yapay zekânın bugünkü durumunu özetliyor. LLM'ler (Büyük Dil Modelleri), milyarlarca kelimeyi bir araya getirerek olasılıkları hesaplar. Yani bir cümlede "kedi" geçtiyse, sonraki kelimenin "fare" olma ihtimalini %78 olarak tahmin eder. Ama bu, kedinin neden fareyi kovaladığını anlamak anlamına gelmez. Bu, bir kitabın tüm sayfalarını ezberlemiş ama hikayenin anlamını okuyamamış bir öğrencidir.

İnsanlar, dünya hakkında bir model oluşturur: nesnelerin ağırlığı, sosyal kurallar, neden-sonuç zincirleri. Bir çocuğa "Bir topu havaya atarsan ne olur?" diye sorarsan, o sadece "yükselir" demez; yerçekimi, enerji, hava direnci, el hareketi gibi bir dizi fiziksel ve kognitif bağlamı zihinsel olarak simüle eder. LLM'lerde ise bu simülasyon yoktur. Sadece geçmiş verilerdeki benzer cümlelerin örüntülerini çoğaltır.

"Düşünme" Modelleri Neden Kandırıyor?

OpenAI, "thinking models" adını verdiği sistemlerle kullanıcıları kandırıyor. "Think" butonuna bastığında, model birkaç saniye bekler, "Düşünüyorum..." gibi bir metin yazar ve sonra bir cevap verir. Bu, bir sinema oyunudur. Gerçek bir düşünme süreci değil, bir zaman geciktirme mekanizması. Bu gecikme, kullanıcıya "Daha derin düşünüyorum" izlenimi vermek için tasarlanmıştır. Ama aslında, model sadece daha fazla token üretmek için daha uzun bir yol izliyor — yani daha çok kelime yazıyor, daha az anlam üretiyor.

Reddit'te bir kullanıcı, "ChatGPT'nin eski modelleri çok daha hızlıydı. Şimdi ise yavaş, yorucu ve aslında hiç düşünmüyor" diyor. Bu şikayet, yalnızca bir kullanıcıya ait değil. Binlerce kullanıcı, özellikle geliştiriciler ve araştırmacılar, bu "düşünme" performansının gerçek bir ilerleme olmadığını, sadece pazarlama bir hilesi olduğunu söylüyor.

Hız Kaybı: Teknik Mi, Stratejik Mi?

Önceden ChatGPT, 1-2 saniyede cevap veriyordu. Şimdi 10-15 saniye bekliyorsunuz. Neden? Teknik olarak, daha büyük modeller ve daha uzun "thinking chains" (düşünme zincirleri) bu yavaşlığı açıklıyor. Ama bu, teknik bir zorunluluk değil, bir stratejik tercih. OpenAI, kullanıcıların "daha akıllı" görünümlü bir sistemden daha fazla ödeme yapmaya razı olacağını düşünüyor. Yavaşlık, bir premium özellik haline getirildi. Hızlı cevaplar ücretsiz kullanıcılar için, yavaş ve "düşünen" cevaplar ise abonelikli kullanıcılar için. Bu, teknolojik ilerlemenin değil, monopollü bir iş modelinin ürünü.

Gerçek Düşünme Nerede?

Gerçek yapay zekâ düşünmesi, bir modelin içinde bir dünya simüle etmesi demektir. Örneğin, bir robotik sistem, bir odada bir kahve fincanını almak için fiziksel yolları hesaplar, engelleri tahmin eder, el hareketlerini optimize eder. Bu, bir world modeldir. LLM'lerde ise sadece bir kelime zinciri vardır. Bir LLM, "kahve fincanını almak" için nedenlerini açıklayabilir — ama o nedenleri anlamaz. Sadece bunları önceki metinlerde nasıl yazıldığını bilir.

Öyleyse, neden bu kadar yavaş? Çünkü model, bir cevabı üretmek yerine, bir hikaye yazmaya çalışıyor. Bir hikaye yazmak, bir düşünmekten çok daha uzun sürer. Ve kullanıcılar, bu hikayeye inanıyor. Çünkü insan beyni, uzun cevapları derinlik olarak yorumlar. Uzunluk = akıllılık. Bu bir kandırma mekanizması.

Ne Anlama Geliyor?

Bu durum, yapay zekânın bir dönüm noktasını işaret ediyor. Daha büyük modeller, daha uzun cevaplar, daha fazla hesaplama — bu, ilerleme değil, bir yalan. Gerçek ilerleme, kelimelerin ötesine geçip, dünyayı anlamaya yönelik bir mimariye geçiş demektir. Geleceğin AI'ları, sadece kelime tahmin etmekle kalmayacak; fiziksel dünyayı simüle edecek, neden-sonuç ilişkilerini kuracak, deneyimlerden öğrenmeye başlayacak.

Şu anki "düşünme" modelleri, bir kahve makinesinin "kahve yapar" yazısıyla kahve yaptığını iddia etmesi gibi. Sadece etiketlerle oynuyor. Kullanıcılar, bu etiketlere inanmaya devam ederse, yapay zekâ gerçek bir entelektüel devrim yerine, bir pazarlama gösterisi haline gelecek.

Ve belki de en korkunç olanı: Bu gösteri, bizi gerçek düşünme yeteneğimizi kaybetmeye yönlendiriyor. Çünkü artık biz de, makinelere "düşünmesini" istiyoruz — çünkü kendi zihnimizi kullanmak yorucu geliyor.

Yapay Zeka Destekli İçerik

Kaynaklar: news.ycombinator.com • www.reddit.com

Neden AI Modelleri Düşünüyor Gibi Görünüyor ama Aslında Düşünmüyor?