DIVE: Çeşitlilik Ölçekleyerek Yapay Zekada Araç Kullanımını %37 Genelleştir (2026)

2026 yılında ortaya çıkan DIVE (Diverse Instruction-driven Vision and Execution) yöntemi, yapay zekanın araçları nasıl öğrendiğini ve kullanacağını tamamen yeniden tanımlıyor. Bu yöntem, sadece daha fazla veriyle değil, daha fazla çeşitlilik ölçekleme ile genelleme sağlıyor. Hugging Face ve arXiv’te yayımlanan iki kaynaktan elde edilen veriler, DIVE’nin yalnızca bir teknik değil, bir felsefi dönüşüm olduğunu gösteriyor: İşlemi tersine çevir.

DIVE: Neden Çeşitlilik, Miktarın Yerini Aldı?

Önceki modeller, binlerce benzer görevi sırayla üretip eğitiyordu. Ama bu görevlerin çoğu aynı araçları, aynı sırayla kullanıyordu. Sonuç? Yeni bir araç kombinasyonu gördüğünde çökerdi. DIVE bu hatayı kökten ele alıyor. ArXiv’e göre (arXiv:2603.11076), DIVE önce gerçek dünyadaki araç kullanım izlerini topluyor — örneğin, bir robotun bir kapıyı açıp, ardından bir kahve makinesini çalıştırdığı senaryoyu kaydediyor. Sonra, bu izlerden ne tür bir görevin yapıldığını geriye doğru çıkarıyor. Bu, görevlerin yapay olarak üretilmesi değil, gerçek davranışlardan türetilmesi demek.

Agentic Task Synthesis: Gerçek Davranışlardan Görev Üretimi

DIVE, agentic task synthesis adı verilen bir süreçle, gerçek dünya verisinden otomatik olarak görevler üretiyor. Her iz, bir görevin niyetini ve adım sırasını kodluyor. Bu sayede, model sadece komutları ezberlemiyor, niyeti anlıyor.

Qwen3-8B ile Gerçek Dünya Verisi: 48.000 Eğitim Görevi

DIVE, 373 farklı araç ve 5 alanda (ev, laboratuvar, endüstri, sağlık, günlük yaşam) 48.000 eğitim görevi ve 3.200 pekiştirme öğrenmesi üretti. Bu verilerle eğitilen Qwen3-8B modeli, 9 farklı dış görev setinde ortalama +22 puanlık artış kaydetti. Daha çarpıcı olanı: DIVE, 4 kat daha az veriyle bile, en iyi 8B boyutlu modeli +68 puanla geçti.

İki Kontrol Ekseninde Çeşitlilik: Ne Değişti?

DIVE’nin sırrı, iki temel eksen üzerindeki kontroldür: araç havuzunun kapsamı ve her görevdeki araç sayısı.

Eksen 1: Araç Zincir Uzunluğu — 1-2’den 5-7’ye

Önceki sistemler, bir görevde genellikle 1-2 araç kullanırdı. DIVE ise 5-7 araçtan oluşan karmaşık zincirler oluşturuyor. Örneğin: bir robot, önce bir rafı açar (araç 1), ardından bir kutuyu alır (araç 2), bir kahve makinesini açar (araç 3), su doldurur (araç 4), ve son olarak bir bardağa döker (araç 5). Bu tür zincirler, önceki sistemlerde neredeyse hiç görülmezdi.

Eksen 2: Araç Çeşitliliği — Fiziksel, Yazılım, İnsan

DIVE, sadece “kullanılabilir” araçları değil, çok farklı türdeki araçları kapsıyor: fiziksel robotik araçlar, yazılım API’leri, web arayüzleri, hatta insanlarla etkileşim gerektiren görevler. Bu, modelin sadece bir uygulamada değil, gerçek dünyada her türlü araçla çalışabilecek şekilde genelleşmesini sağlıyor.

Uni-Skill ve Beceri Depoları: Bilgiyi Değil, Becerileri Biriktir

Hugging Face’teki Uni-Skill çalışması da bu yönde bir ipucu veriyor: “Bilgiyi değil, becerileri biriktir” prensibiyle, modellerin kendilerini geliştiren bir beceri deposu oluşturması hedefleniyor. DIVE, bu fikri pratikte uyguluyor — her iz, bir beceriye dönüşüyor ve bu beceriler birikerek, yeni görevler için esnek bir araç kutusu oluşturuyor.

Epistemolojik Değişim: Nasıl Düşünüyor, Ne Bildiğinden Daha Önemli

Bu yaklaşım, yalnızca teknik bir ilerleme değil, bir epistemolojik değişim. Yani: “Modelin ne bildiğini” değil, “nasıl düşündüğünü” değiştiriyor. Artık model, bir görevi “ezberleyerek” değil, “gerçek olaylardan türetip anlayarak” çözüyor. Bu, yapay zekanın genellenebilirlik sınırlarını tamamen yeniden çiziyor.

2026 ve Sonrası: DIVE Standart Hale Geliyor

2026 itibarıyla, bu yöntem sadece dil modelleri için değil, robotik, otomasyon, hatta eğitim ve tıbbi destek sistemleri için bir standart haline gelebilir. Çünkü DIVE, yapay zekanın “sadece veriye dayalı” olmaktan çıkıp, “gerçek dünyaya dayalı” bir zeka haline gelmesini sağlıyor. Önümüzdeki aylarda, DIVE’nin açık kaynak olarak yayınlanması bekleniyor. Bu, küçük araştırma gruplarının bile büyük ölçekli genelleme deneyimlerine ulaşmasını sağlayabilir.

Artık, “daha fazla veri” demek yerine, “daha akıllı veri” demek gerekiyor. DIVE, bu geçişi gerçekleştiren ilk büyük adım.

Yapay Zeka Destekli İçerik

Kaynaklar: huggingface.co • arxiv.org

DIVE: Çeşitlilik Ölçekleyerek Yapay Zekada Araç Kullanımını %37 Genelleştir (2026)