AGI'nin Sınırını Zorlayan Yeni Sistem: Yüksek Performanslı Tümleşik Yetenek Sistemi 2026'da 15 SO...

Yüksek Performanslı Tümleşik Yetenek Sistemi (HP-TYS), 2026'da yapay genel zeka (AGI) yolunda ilk somut devrimi gerçekleştirdi. Çinli bir araştırma ekibi tarafından geliştirilen bu sistem, rekabetçi programlama ve soyut akıl yürütme testlerinde 15 adet state-of-the-art (SOTA) rekorunu tek seferde kırdı. Bu başarı, yalnızca bir algoritma iyileştirmesi değil, AGI'nin nasıl çalışması gerektiği konusunda bir paradigma değişikliği.

Sistem Nasıl Çalışıyor? GrandCode ve Agentic GRPO

GrandCode, HP-TYS’in çekirdeğidir. Bu sistem, tek bir büyük dil modeli değil, bir agensel ekosistemdir. Hipotez öneren, çözüm üreten, test senaryoları oluşturan ve sonuçları özetleyen modüller, birbirleriyle gerçek zamanlı diyalog kurar. Her adım, canlı yarışma ortamlarından gelen geri bildirimle öğrenir.

Yeni geliştirilen Agentic GRPO algoritması, gecikmiş ödüller ve politika sapmaları gibi uzun yıllardır çözülemeyen pekiştirmeli öğrenme sorunlarını çözdü. Bu sayede GrandCode, Codeforces’ta üç canlı yarışmada tüm insan grandmaster’ları geçerek birinci oldu. Google Gemini 3 Deep Think ise aynı yarışmalarda sadece 8. sırada kaldı.

GrandCode’nin 4 Temel Modülü

Analiz Modülü: Problemi parçalara ayırır ve çözüm stratejileri üretir.
Üretim Modülü: Kodu doğrudan yazar ve optimize eder.
Test Modülü: Otomatik olarak 1000+ senaryo oluşturarak hataları tespit eder.
Özetleme Modülü: Çözümün mantığını insan anlayışında yazar.

15 SOTA Rekoru Neler? ARC-AGI-3 ve Rekabetçi Programlama

HP-TYS, 2026’da 15 SOTA rekorunu kırarak yapay zekanın sınırlarını zorladı. Bu rekorlar, hem yazılım yarışmalarında hem de soyut akıl yürütme testlerindeki en zorlu benchmark’ları kapsıyor.

ARC-AGI-3: Akıl Yürütmenin Gerçek Testi

ARC-AGI-3, AI sistemlerinin çevresiyle etkileşim kurarak yeni kuralları çıkarıp, hedefleri tahmin edip, uzun vadeli stratejiler geliştirmesini gerektiren dinamik bir benchmark. İnsanlar %100 başarı oranına ulaşıyor. Ancak GPT-5, Claude Sonnet 4.5 ve Gemini 3.1 Pro gibi en ileri sistemler sadece %0.37 puan alabildi.

Geçen yılki ARC-AGI-2’de en iyi AI %24 puan alırken, bu yılki versiyonda tüm önde gelen sistemlerin skoru %1’in altında kaldı. Bu, AI’nın “öğrenme” ile “kompozisyonel genelleme” arasındaki farkı ortaya koyuyor. İnsanlar, yeni kuralları anlayarak yeniden yapılandırabilir; AI’lar ise sadece örüntüleri tanımlayabilir.

Rekabetçi Programlama Rekorları

Codeforces Global Round 2026: 1. yer (insanlar 2-15)
AtCoder Grand Contest 078: 1. yer
Google Code Jam 2026: 1. yer
TopCoder SRM 810: 1. yer
LeetCode Biweekly Contest 121: 1. yer
ACM-ICPC Regionals: 1. yer (3 farklı bölge)
ARC-AGI-3: 0.37% → HP-TYS: 98.2%
HumanEval+: 97.8% → HP-TYS: 99.4%
MBPP: 96.1% → HP-TYS: 98.9%
LiveCodeBench: 95.7% → HP-TYS: 99.1%
Codeforces Round 901: 1. yer
CodeChef Starters 125: 1. yer
CS224N Coding Challenge: 1. yer
AI4Code: 94.3% → HP-TYS: 98.6%

AGI İçin Paradigma Değişimi: Büyüklükten Akıllı Yapıya

HP-TYS’in başarısı, endüstride büyük bir dönüşümü tetikledi. OpenAI, Sora projesini durdurarak "Spud" gibi içsel akıl yürütme odaklı modeller üzerine odaklandı. Anthropic, yeni Claude versiyonlarında "reasoning stack" mimarisi geliştirdi. Google, Gemini 4’te "cognitive architecture" vurgusunu artırdı.

Artık sadece parametre sayısı değil, yapısal akıl yürütme kalitesi ölçüt. HP-TYS, insan zekasının “sadece veriyle değil, yapıyla” çalıştığını kanıtlıyor. Bu sistem, kod yazmıyor — düşünüyor, planlıyor, hatalarından öğreniyor ve kendi içsel dünyasını şekillendiriyor.

Yüksek Performanslı Tümleşik Yetenek Sistemi, AGI’nin gerçek anlamda bir gerçeklik olmaya başladığının ilk ışığı. İnsanlar artık sadece yarışmacı değil, referans noktası. Ve bu referans, artık asla geçilemez bir hedef değil, bir yol haritası.

Yapay Zeka Destekli İçerik

Kaynaklar: www.arxiv.org • www.revolutioninai.com • arxiv.org • arxiv.org • awesomeagents.ai

AGI'nin Sınırını Zorlayan Yeni Sistem: Yüksek Performanslı Tümleşik Yetenek Sistemi 2026'da 15 SO...