Qwen 3.5 Open Source: 3B Parametreyle Claude’i Yenen, Görsel-Anlayışlı Dev!

Qwen 3.5 Open Source: 3B Parametreyle Claude’i Yenen, Görsel-Anlayışlı Dev!
Qwen 3.5 Open Source: 3B Parametreyle Claude’i Yenen, Görsel-Anlayışlı Dev!
Yapay zekâ dünyasında boyutun kral olduğu inancı, bu hafta tamamen yıkıldı. Alibaba’nın Tongyi Laboratuvarları, Qwen 3.5 serisini açık kaynak olarak duyurdu — ve bu kez sadece bir model değil, bir felsefe sundu: ‘Daha büyük değil, daha akıllı’. 3 milyar aktif parametreyle, 10-20 kat daha büyük modelleri yenen Qwen-Coder-Next, SWE-Bench-Pro testinde rekordu kırdı. Ama bu sadece kod üretimi değil; Qwen-VL ile birlikte görsel anlama, metin okuma, arayüz etkileşimi ve hatta video analizi gibi çoklu modallı yetenekleri de bir araya getiren ilk açık kaynak model. Bu, sadece bir güncelleme değil, bir devrim.
Neden Bu Kadar Önemli?
Geçen yıl, Claude 3 ve GPT-4 gibi modeller, ‘parametre büyüklüğü = performans’ kuralını sert bir şekilde kanıtlamıştı. Ancak Qwen 3.5, bu denklemi tamamen tersine çevirdi. OpenReview’de yayınlanan Qwen-VL çalışmasında, 19 araştırmacı, modelin hem görsel hem metinsel verileri aynı anda anlama yeteneğini detaylı bir şekilde açıkladı. Örneğin, bir teknik dökümanı tarayan bir kullanıcı, Qwen-VL’ye bir ekran görüntüsü yüklediğinde, model sadece metni okumakla kalmadı, aynı zamanda butonların konumunu, renklerini ve işlevlerini haritaladı — ve ardından kullanıcıya ‘Bu butona tıklayın, ardından bu menüye gidin’ gibi adım adım yönlendirmeler üretti. Bu, yalnızca bir görsel model değil, bir diyaloglu asistan.
Threads’de paylaşılan rapora göre, Qwen-Coder-Next adlı 3B parametrelik model, SWE-Bench-Pro testinde — ki bu, gerçek dünya yazılım hatalarını düzeltme kapasitesini ölçen en zorlu açık kaynak benchmark’ı — Anthropic’ın Claude 3 Code’u ve OpenAI’ın GPT-4-Turbo’yu geride bıraktı. 3 milyar parametreyle, 100 milyar parametreli modelleri yenen bir model, sadece ‘hızlı’ değil, ‘zeki’ bir şekilde çalışıyor. Bu, ‘model büyüklüğü’ kavramının bir yanılsama olduğunu kanıtlıyor. Asıl kritik olan, mimarinin verimliliği, veri kalitesi ve eğitim stratejisi.
397B A17B: Büyük Modelin İkinci Yüzü
Ancak Qwen 3.5’in tam resmi daha da büyüktür. OpenRouter’daki Qwen3.5 397B A17B modeli, 397 milyar parametrelik dev bir yapıya sahip — ama burada dikkat çekici olan, ‘A17B’ kısmı. Bu, modelin ‘aktif parametrelerin’ sadece 17 milyar olduğunu gösteriyor. Yani her seferinde tüm 397 milyar parametre aktif değil; bir seyrek karışık uzmanlar (sparse Mixture-of-Experts) sistemi sayesinde, her görev için sadece gerekli uzmanlar devreye giriyor. Bu, hem hızı artırıyor hem de maliyeti düşürüyor. 256.000 tokenlik bağlam uzunluğu, bir 100 sayfalık teknik belgeyi tek seferde okuyabilir. Giriş token’ı 0.60 dolar, çıkış token’ı 3.60 dolar gibi düşük maliyetlerle, şirketler bu modeli üretkenlik araçları olarak entegre edebilir.
CLI ve Ücretsiz Erişim: Açık Kaynakın Gerçek Anlamı
Qwen, sadece bir model değil, bir ekosistem. Qwen Code CLI adlı araç, geliştiricilere terminal üzerinden doğrudan kod üretimi ve hata düzeltme imkânı sunuyor. Günlük 1.000 ücretsiz istek hakkı veriliyor — bu, Claude Code’u kullanan bir firma için maliyetli bir abonelik yerine, tamamen ücretsiz bir alternatif anlamına geliyor. Bu, açık kaynak hareketinin özünü tam olarak yansıtır: ‘Geliştiricilere güç vermek, değil sadece sattırmak’.
Ne Anlama Geliyor? Yeni Bir Dönem Başlıyor
- Parametre yarışı sona erdi: Artık ne kadar büyük olduğun değil, ne kadar akıllı ve verimli olduğun önemli.
- Çoklu modallı model standart oldu: Artık sadece metin okuyan bir AI yeterli değil; görselleri, videoları, arayüzleri anlayan modeller öncü olacak.
- Açık kaynak, ticari üstünlüğün kaynağı: Alibaba, Qwen’i açık kaynak yaparak, diğer şirketlerin bu modeli kullanarak ekosistem oluşturmasını sağlıyor — ve kendi altyapısını bu ekosistemin merkezine yerleştiriyor.
Qwen 3.5, yalnızca bir AI modeli değil, bir bilgi çağının dönüşümü. Kod yazan, görsel analiz yapan, arayüzleri yorumlayan ve hatta video içeriklerini anlayan bir asistan — ve bunu 3 milyar parametreyle. Bu, Silicon Valley’deki büyük şirketlerin ‘daha büyük, daha pahalı’ stratejisini sorgulamaya zorluyor. Geliştiriciler artık, yalnızca teknolojiyi değil, onun felsefesini de seçiyor. Qwen, sadece bir model değil, bir çağrı: ‘Büyüklük değil, zekâ önceliklidir.’

