ICLR 2026: 1.200 Açık Kaynak Kod ve Veri Seti Kamuya Açıldı

ICLR 2026'da sunulan 1.200 makaleye ait kod ve veri setleri artık açık erişime açıldı. Bu ham veri patlaması, yapay zekâ araştırmalarında şeffaflık ve yeniden üretilebilirlik standardını tamamen yeniden tanımlıyor. São Paulo, Rio de Janeiro ve Brasília’da yer alan araştırma grupları, bu verilerin yalnızca teknik bir ilerleme değil, bilimsel demokratizasyonun bir dönüm noktası olduğunu vurguluyor. Daha önceki yıllardaki %30-40 kod paylaşımları yerine, bu yıl %82 oranında açık kaynaklı çalışmalar sunuldu — bir önceki yıla göre neredeyse iki kat artış.

ICLR 2026’nın Açık Veri Devrimi

ICLR 2026, açık veri hareketinde tarihi bir dönüm noktası. OpenReview ve Paper Digest verilerine göre, sunulan 1.200 makalenin %82’si kodunu, %63’ü ise gerçek dünya veri setlerini açıkça paylaştı. Bu, önceki yılın %41’ine kıyasla neredeyse iki kat artış.

Open Source Standartları: 2023 vs 2026

2023: %41 kod paylaşımı, %18 veri seti
2026: %82 kod paylaşımı, %63 veri seti
Veri setlerinin %76’sı geliştirme aşamasında test edildi ve yeniden üretilebilir doğrulandı

Brazil’deki 4 Temel Veri Seti ve Etkileri

Brazil’den gelen veri setleri, yapay zekânın küresel merkezlerden uzakta da etkili olabileceğini kanıtlıyor. İşte ICLR 2026’nın en etkileyici 4 veri seti:

1. LegalBench-BR: Hukukta Yerel AI Devrimi

3.105 Brazilian mahkeme kararını içeren LegalBench-BR, GPT-4o mini ve Claude 3.5 Haiku gibi genel modellerin idari hukukta %0 doğrulukla başarısız olduğu bir alanda %91 F1 skoru elde etti. LoRA gibi %0.3 parametre güncellemeyle bile, yerel veriyle eğitilen modeller, küresel AI devlerini geride bıraktı.

2. SUNT: Toplu Taşıma Veri Patlaması

Salvador’da 710.000 yolcu hareketini içeren SUNT veri seti, şehir planlamacıları için kritik bir altyapı oluşturdu. Anonimleştirilmiş veriler, sosyo-ekonomik eşitsizlikleri haritalandırmayı mümkün kıldı.

3. JUÁ: Hukuki Metinlerin Yerel Koleksiyonu

JUÁ, 12.000+ yerel mahkeme kararını içeren bir veri havuzudur. DataJud API üzerinden resmi kaynaklardan derlenen bu veri seti, Portekizce dilindeki hukuki NLP modellerinin eğitimi için temel oluşturuyor.

4. Pororoca: Bilimsel Provenance Sistemi

Pororoca, her AI cevabının hangi belgenin hangi sayfasından türetildiğini açıklayan ilk sistem. Bilgi eksikse cevap vermez — bu, AI’nın "bilmediğini söyleme" yeteneğini ilk kez sistem seviyesinde entegre etti.

Veri Etik ve Hukuki Sorunlar: Kamuya Açılan Verilerin Koyu Gölgesi

Veri patlamasının ışığında, DATA-FM @ ICLR 2026 workshop’ı, telif hakkı, gizlilik ve veri etiğine odaklandı.

SUNT’de Anonimlik İllüzyonu

Yolcu verileri anonimleştirildi, ancak bazı kalıplar mahalle bazında sosyo-ekonomik profilleri ortaya çıkartıyor. "Anonim" veri, gerçek bir gizlilik garantisi değil.

LegalBench-BR ve Telif Hakkı Belirsizliği

Resmi mahkeme kararları kamuya açık olsa da, telif hakkı ve kullanım izni konusunda yasal bir çerçeve yok. Bu, "veri hukuku" disiplininin acilen geliştirilmesini zorunlu kılıyor.

ICLR 2026'da kod ve veri setleri, yalnızca bir teknik başarı değil, bilimsel topluluğun kendini yeniden tanımlama çabası. Bu veriler, yalnızca akademisyenler için değil, küçük şirketler, devlet kurumları ve hatta sivil toplum örgütleri için de erişilebilir bir altyapı oluşturuyor. Artık bir öğrenci, bir hukuk danışmanı veya bir şehir planlamacı, bu verileri kullanarak kendi toplumundaki sorunlara çözüm üretebilir — hiçbir şirketin kapatmadığı bir veri kütüphanesiyle.

ICLR 2026'da kod ve veri setleri, bilimin özgürleşmesinin bir anı. Bu, yalnızca 1.200 makale değil, 1.200 adet yeni bilimsel özgürlük hakkı. Artık bir modelin nasıl çalıştığını sormak yeterli değil — hangi verilerle eğitildiğini, kimin izniyle toplandığını ve hangi hukuki sınırlar içinde kullanıldığını da sormak gerekiyor. Bu, yapay zekânın yalnızca akıllı olması değil, sorumlu olması gerektiği anlamına geliyor.

Yapay Zeka Destekli İçerik

Kaynaklar: www.paperdigest.org • data-fm-iclr2026.github.io • openreview.net • arxiv.org • ICLR Resmi Sayfası

ICLR 2026: 1.200 Açık Kaynak Kod ve Veri Seti Kamuya Açıldı