7B Parametreli Model, GPT-5'i Yendi mi? AdaResoner ile Görsel Akıl Yürütme Devrimi

7B Parametreli Model, GPT-5'i Yendi mi? AdaResoner ile Görsel Akıl Yürütme Devrimi
ICLR 2026 konferansında, bilim dünyasını sarsan bir haber geldi: 7 milyar parametrelik bir yapay zeka modeli, GPT-5 gibi çok daha büyük modelleri görsel akıl yürütme testlerinde mağlup etti. Bu modelin adı AdaResoner. İsmi sadece bir kod değil, bir felsefe: ‘Ada’ (uyumlu, esnek) ve ‘Resoner’ (akıl yürüten). Yani bu, sadece daha küçük bir model değil, daha akıllı bir model.
Neden Bu Kadar Önemli?
Geleneksel olarak, yapay zeka dünyasında ‘daha büyük = daha iyi’ kuralı hâkimdi. GPT-4’ün 1.8 trilyon parametresi, Gemini Ultra’nın 2 trilyonu, Claude 3 Opus’un 1.5 trilyonu… Bu rakamlar, sadece teknik bir gösteriş değil, milyarlarca dolarlık hesaplamaların ve enerji tüketiminin sonucuydu. Ancak AdaResoner, bu denklemin tamamını yıktı. 7B parametre — yani GPT-5’in yaklaşık %0.3’ü — ile, görsel soruları çözmek için aktif, adımlı, araç kullanan bir düşünce süreci geliştirdi.‘Aktif Görsel Araç Düşünme’ Nedir?
AdaResoner’in sırrı, yalnızca bir görseli analiz etmek değil, görseli nasıl anladığını göstermesiydi. Örneğin, bir fotoğrafta ‘bir çiçekten bir kelebek uçuyor, ama gölgede bir kedi varsa, kelebek tehlikede mi?’ gibi karmaşık sorulara cevap verirken, model sadece ‘gördüklerini’ değil, ne yapacağını planlıyordu.Bu süreç şöyle işliyor:
- İzleme: Görüntüdeki nesneleri tanımlar ve bir ‘zihinsel harita’ çizer.
- Planlama: ‘Bu soruyu çözmek için hangi araçlar gerekli?’ diye sorar. Örneğin: ‘Ölçüm aracı’, ‘gölge analizi’, ‘hareket tahmini’.
- Uygulama: Bu araçları kendi içinde simüle eder — kendi içinde bir ‘görsel laboratuvar’ kurar.
- Kontrol: Her adımda sonuçları doğrular, hataları düzeltir, varsayımları sorgular.
Bu, bir insanın bir resme baktığında ‘Bak, kedi var!’ demek yerine, ‘Kedi nerede duruyor? Kelebeğin uçuş yolu ne? Gölge ne kadar uzun? Kedinin hareketi ne zaman başlar?’ diye düşünmesiyle aynı. AdaResoner, bu düşünce zincirini otomatik olarak oluşturuyor. Buna Agentic Vision — yani ‘aktif görsel ajanlık’ — deniyor. Model, bir pasif algılayıcı değil, bir aktif araştırıcı.
Neden GPT-5’i Yendi?
GPT-5 gibi modeller, görsel verileri metinle ilişkilendirmek için ‘patch-based’ yöntemler kullanır: resmi küçük parçalara böler, her birini ayrı ayrı analiz eder. Bu, çok verimli ama anlamsal bütünlüğü zayıf bir yöntem. AdaResoner ise, görsel bilgiyi prosedürel olarak işler. Yani, resmi ‘anlamak’ yerine, ‘çözmek’ için bir strateji geliştirir.Testlerde, AdaResoner, Visual Question Answering (VQA) ve Complex Reasoning in Images (CRI) veri setlerinde %14.7 daha yüksek doğruluk elde etti. Özellikle ‘çok adımlı neden-sonuç’ sorularında fark çarpıcıydı: ‘Bu köprü neden çöktü?’ gibi sorulara GPT-5 sadece ‘yük çoktu’ diyordu; AdaResoner ise ‘yapısal çatlaklar, yağmur suyu nedeniyle çelik paslanma, ve arka planda bir kamyonun geçişi’ gibi üçlü bir analiz verdi.
Gelecek İçin Ne Anlama Geliyor?
Bu, sadece bir modelin daha iyi performans göstermesi değil, yapay zekanın ‘akıl yürütme’ modelinin yeniden inşası. Küçük modeller, daha az enerji, daha az maliyet ve daha az veriyle, büyük modelleri geçebilir — ancak sadece eğer düşünme stratejilerini değiştirebilirlerse.Pratikte, bu, telefonlarda, robotlarda, hatta sağlık teşhis cihazlarında daha akıllı, daha hızlı, daha güvenli AI’lar anlamına geliyor. Bir doktor, bir fotoğrafı yükleyip ‘Bu tomografi’deki lezyon neden bu şekildedir?’ diye sorabilir. AdaResoner tarzı bir sistem, sadece ‘kanser’ demek yerine, ‘bu lezyonun kenarları düzensiz, çevresindeki doku ödemi var, ve önceki görüntüde 3 ay önce küçük bir nokta vardı — bu nedenle malignite olasılığı %82’ diyebilir.
İnsan zekası, büyük veriyle değil, akıllı sorularla ilerler. AdaResoner, AI’ya bu insani yeteneği kazandırıyor. Büyük modeller hâlâ güçlü, ama artık tek yol değiller. Gelecek, akıllı küçüklerin dünyası olabilir.
İşte Gerçek Sırrı: Daha Az Parametre, Daha Çok Düşünme
AdaResoner’in temel katkısı, parametre sayısını artırmak yerine, hesaplama stratejisini yeniden tasarlamak. Model, kendi içinde bir ‘zihinsel araç kutusu’ oluşturdu: ölçüm, karşılaştırma, simülasyon, geri bildirim döngüsü. Bu, sadece görsel değil, tüm multimodal zekanın geleceğine dair bir rehber.Bu, Google, OpenAI ve Meta’nın 10 milyar dolarlık ‘büyütme yarışı’na karşı bir direniş. Küçük, akıllı, verimli. İnsan zihninin çalışma prensibini taklit ediyor — çünkü zihin, 1.250 milyar sinapsisine rağmen, her zaman daha az enerjiyle daha çok şey yapıyor.
AdaResoner, sadece bir model değil, bir ilke: ‘Daha fazla veri değil, daha iyi düşünce, daha iyi sonuçlar getirir.’


