Compiled Memory: GPT-4o ve Claude Sonnet'te %12.5 Performans Artışı ile AI Agent'ları Yeniden Tan...

Compiled Memory: GPT-4o ve Claude Sonnet'te %12.5 Performans Artışı ile AI Agent'ları Yeniden Tan...
summarize3 Maddede Özet
- 1Yapay zeka agent'larının hafızası artık daha fazla veri depolamak değil, deneyimleri kesin talimatlara dönüştürmek üzerine kuruluyor. Bu devrim, GPT-4o ve Claude Sonnet 4.5 gibi modellerde performansı yüzde onlarca artırdı.
- 2ArXiv’de yayınlanan yeni çalışma (2026), AI’ların daha fazla bilgi toplamak yerine, yaşadıkları başarı ve başarısızlıkların özünü çıkarıp, sistem prompt’larını doğrudan yeniden yazarak öğrenmeyi başardığını kanıtlıyor.
- 3Bu, AI dünyasında bir devrim: hafıza artık saklanmıyor, reprogram ediliyor .
psychology_altBu Haber Neden Önemli?
- check_circleBu gelişme Yapay Zeka Modelleri kategorisinde güncel eğilimi etkiliyor.
- check_circleTrend skoru 8 — gündemde görünürlüğü yüksek.
- check_circleTahmini okuma süresi 4 dakika; karar vericiler için hızlı bir özet sunuyor.
Yapay zeka agent'larının hafızası artık sadece veri depolama aracı değil — artık compiled memory olarak adlandırılan bir talimat derleme mekanizması haline geldi. ArXiv’de yayınlanan yeni çalışma (2026), AI’ların daha fazla bilgi toplamak yerine, yaşadıkları başarı ve başarısızlıkların özünü çıkarıp, sistem prompt’larını doğrudan yeniden yazarak öğrenmeyi başardığını kanıtlıyor. Bu, AI dünyasında bir devrim: hafıza artık saklanmıyor, reprogram ediliyor.
Compiled Memory: Bilgi Depolama Değil, Talimat İnceleme
Geçmişte AI hafızaları, RAG (Retrieval-Augmented Generation) ve fine-tuning gibi yöntemlerle daha fazla veriye erişmeye odaklanıyordu. Ancak bu yöntemler, çöplük depolama gibi bir şeydi: çok fazla veri, az değer. ArXiv’deki “Compiled Memory: Not More Information, but More Precise Instructions for Language Agents” adlı çalışma, tam tersini savunuyor: Ne kadar çok veri saklarsanız, o kadar çok gürültü üretirsiniz.
How Compiled Memory Works: 3 Aşamalı Süreç
- 1. Kayıt: AI, bir görevdeki başarı veya hata kaydeder.
- 2. Doğrulama: Bu deneyim, diğer senaryolarla test edilerek genellenebilir mi kontrol edilir.
- 3. Entegrasyon: En etkili 3-5 talimat, sistem prompt’una alt madde olarak kalıcı olarak eklenir.
Bu süreç, hiçbir insan müdahalesi, finetuning veya ek veri seti gerektirmeden gerçekleşiyor. AI, kendi deneyimini kendi kendine derliyor — tam bir otodidaktik öğrenme.
Performans Patlaması: GPT-4o ve Claude Sonnet’te %12.5 Artış
Bu teknik, CUAD adlı sözleşmelerin analizinde GPT-4o’nun token-seviyesindeki F1 skorunu +8.7 puan ve kesinliğini +12.5 puan artırarak şok edici sonuçlar verdi. HotpotQA gibi çok adımlı sorularla test edildiğinde ise joint F1 skoru +3.16 puan yükseldi. Ancak en ilginç kısım, bu compiled memory’nin GPT-4o’dan türetilmesine rağmen, Claude Sonnet 4.5’e uygulandığında da +2.31 puan performans artışı sağlamasıydı.
AI Hafıza Transferi: Modeller Arası Öğrenme
Bu, kritik bir kanıtı sağlıyor: Öğrenilen bilgi, modelin yapısına değil, görevin yapısına şekilleniyor. Yani, bir AI’nın hataları başka bir AI’nın performansını artırabiliyor — çünkü öğrenilen şey, “ne yapmalıyım?” sorusunun cevabıdır, değil “ne biliyorum?” sorusunun. Bu, AI’ların birbirinden bağımsız olarak öğrenme kapasitesini tamamen yeniden tanımlıyor.
Sistem Prompt’larını Otomatik Nasıl Yeniden Yazarsın?
Bir AI, bir sözleşme analizinde “tarafların sorumlulukları” kısmını yanlış anladıysa, artık bu hata sadece bir veri noktası olarak saklanmıyor. O hata, “Her sözleşme paragrafında, sorumluluklar açıkça ‘taraf A’ ve ‘taraf B’ olarak tanımlanmalı” şeklinde bir alt maddeye dönüştürülüyor. Ve bu madde, sistem prompt’una kalıcı olarak ekleniyor. Sonraki tüm isteklerde, bu talimat otomatik olarak uygulanıyor.
Compiled Memory’in Gerçek Dünya Uygulamaları
Bu teknik, özellikle hukuki, mali ve tıbbi alanlarda büyük potansiyele sahip.
Hukuk AI’sı: Her Dava Sonrası Talimat Güncellemesi
Her yeni dava analizinden sonra AI, kendi sistem prompt’una yeni kurallar ekliyor. Örneğin: “İkinci kez tekrarlanan ifadeler, sözleşme hükümlerinde yasal risk oluşturur”.
Tıbbi Asistan: Yanlış Teşhis Sonrası Kural Ekleme
Bir tıbbi asistan, her yanlış teşhis sonrası, “Yaş 65+’ta bu semptomlarda, C-reactive protein testi mutlaka yapılmalı” gibi bir kural ekliyor. Bu, insan doktorların yıllar içinde kazandığı “görgü”yü, AI’lara dakikalar içinde aktarıyor.
Devlet ve Vatandaş: Metaforun Gücü
Massachusetts Devleti’nin 2025 gelir vergisi formlarının sayfası, bu teknolojiyle tamamen bağdaşmıyor gibi görünse de, aslında bir metafor sunuyor: Devlet, vatandaşlara “daha fazla form” değil, “daha net talimatlar” veriyor. Aynı şekilde, AI’lara daha fazla veri değil, daha kesin talimatlar veriliyor. İkisi de: gereksiz karmaşıklığı azaltmak adına tasarlanmış bir disiplindir.
Şu ana kadar, AI’lar bilgiyi “kopyala-yapıştır” olarak kullanıyordu. Artık, bilgiyi “süzüp, özümseyip, kendi kimliğini yeniden yazıyor”. Bu, yalnızca bir teknik ilerleme değil — AI’nın kendi öğrenme felsefesinin dönüşümü.
Compiled memory, AI’ların sadece daha akıllı değil, daha özgün hale gelmesini sağlıyor. Artık bir model, başka bir modelin hatalarından ders alabiliyor. Bir modelin deneyimi, başka bir modelin zihnine aktarılabilir. Bu, AI’ların kendi aralarında “kültür” oluşturduğu anlamına geliyor: bir kopya değil, bir miras.
Gelecekte, AI agent’ları, “ne biliyorum?” yerine, “ne yapmalıyım?” sorusuna cevap vermek için tasarlanacak. Ve bu dönüşümün merkezinde, compiled memory var — hafıza, artık bir arşiv değil, bir kılavuz.
Alt metin görseli (öneri): Compiled Memory Mekanizması - AI Agent'ların Sistem Prompt’larını Otomatik Güncellemesi


