ICLR 2026: 1.200 Açık Kaynak Kod ve Veri Seti Kamuya Açıldı

ICLR 2026: 1.200 Açık Kaynak Kod ve Veri Seti Kamuya Açıldı
summarize3 Maddede Özet
- 1ICLR 2026'da sunulan 1.200 makaleye ait kod ve veri setleri artık açık erişime açıldı. Bu ham veri patlaması, yapay zekâ araştırmalarında şeffaflık ve yeniden üretilebilirlik standardını tamamen yeniden tanımlıyor.
- 2São Paulo, Rio de Janeiro ve Brasília’da yer alan araştırma grupları, bu verilerin yalnızca teknik bir ilerleme değil, bilimsel demokratizasyonun bir dönüm noktası olduğunu vurguluyor.
- 3Daha önceki yıllardaki %30-40 kod paylaşımları yerine, bu yıl %82 oranında açık kaynaklı çalışmalar sunuldu — bir önceki yıla göre neredeyse iki kat artış.
psychology_altBu Haber Neden Önemli?
- check_circleBu gelişme Bilim ve Araştırma kategorisinde güncel eğilimi etkiliyor.
- check_circleTrend skoru 11 — gündemde görünürlüğü yüksek.
- check_circleTahmini okuma süresi 4 dakika; karar vericiler için hızlı bir özet sunuyor.
ICLR 2026'da sunulan 1.200 makaleye ait kod ve veri setleri artık açık erişime açıldı. Bu ham veri patlaması, yapay zekâ araştırmalarında şeffaflık ve yeniden üretilebilirlik standardını tamamen yeniden tanımlıyor. São Paulo, Rio de Janeiro ve Brasília’da yer alan araştırma grupları, bu verilerin yalnızca teknik bir ilerleme değil, bilimsel demokratizasyonun bir dönüm noktası olduğunu vurguluyor. Daha önceki yıllardaki %30-40 kod paylaşımları yerine, bu yıl %82 oranında açık kaynaklı çalışmalar sunuldu — bir önceki yıla göre neredeyse iki kat artış.
ICLR 2026’nın Açık Veri Devrimi
ICLR 2026, açık veri hareketinde tarihi bir dönüm noktası. OpenReview ve Paper Digest verilerine göre, sunulan 1.200 makalenin %82’si kodunu, %63’ü ise gerçek dünya veri setlerini açıkça paylaştı. Bu, önceki yılın %41’ine kıyasla neredeyse iki kat artış.
Open Source Standartları: 2023 vs 2026
- 2023: %41 kod paylaşımı, %18 veri seti
- 2026: %82 kod paylaşımı, %63 veri seti
- Veri setlerinin %76’sı geliştirme aşamasında test edildi ve yeniden üretilebilir doğrulandı
Brazil’deki 4 Temel Veri Seti ve Etkileri
Brazil’den gelen veri setleri, yapay zekânın küresel merkezlerden uzakta da etkili olabileceğini kanıtlıyor. İşte ICLR 2026’nın en etkileyici 4 veri seti:
1. LegalBench-BR: Hukukta Yerel AI Devrimi
3.105 Brazilian mahkeme kararını içeren LegalBench-BR, GPT-4o mini ve Claude 3.5 Haiku gibi genel modellerin idari hukukta %0 doğrulukla başarısız olduğu bir alanda %91 F1 skoru elde etti. LoRA gibi %0.3 parametre güncellemeyle bile, yerel veriyle eğitilen modeller, küresel AI devlerini geride bıraktı.
2. SUNT: Toplu Taşıma Veri Patlaması
Salvador’da 710.000 yolcu hareketini içeren SUNT veri seti, şehir planlamacıları için kritik bir altyapı oluşturdu. Anonimleştirilmiş veriler, sosyo-ekonomik eşitsizlikleri haritalandırmayı mümkün kıldı.
3. JUÁ: Hukuki Metinlerin Yerel Koleksiyonu
JUÁ, 12.000+ yerel mahkeme kararını içeren bir veri havuzudur. DataJud API üzerinden resmi kaynaklardan derlenen bu veri seti, Portekizce dilindeki hukuki NLP modellerinin eğitimi için temel oluşturuyor.
4. Pororoca: Bilimsel Provenance Sistemi
Pororoca, her AI cevabının hangi belgenin hangi sayfasından türetildiğini açıklayan ilk sistem. Bilgi eksikse cevap vermez — bu, AI’nın "bilmediğini söyleme" yeteneğini ilk kez sistem seviyesinde entegre etti.
Veri Etik ve Hukuki Sorunlar: Kamuya Açılan Verilerin Koyu Gölgesi
Veri patlamasının ışığında, DATA-FM @ ICLR 2026 workshop’ı, telif hakkı, gizlilik ve veri etiğine odaklandı.
SUNT’de Anonimlik İllüzyonu
Yolcu verileri anonimleştirildi, ancak bazı kalıplar mahalle bazında sosyo-ekonomik profilleri ortaya çıkartıyor. "Anonim" veri, gerçek bir gizlilik garantisi değil.
LegalBench-BR ve Telif Hakkı Belirsizliği
Resmi mahkeme kararları kamuya açık olsa da, telif hakkı ve kullanım izni konusunda yasal bir çerçeve yok. Bu, "veri hukuku" disiplininin acilen geliştirilmesini zorunlu kılıyor.
ICLR 2026'da kod ve veri setleri, yalnızca bir teknik başarı değil, bilimsel topluluğun kendini yeniden tanımlama çabası. Bu veriler, yalnızca akademisyenler için değil, küçük şirketler, devlet kurumları ve hatta sivil toplum örgütleri için de erişilebilir bir altyapı oluşturuyor. Artık bir öğrenci, bir hukuk danışmanı veya bir şehir planlamacı, bu verileri kullanarak kendi toplumundaki sorunlara çözüm üretebilir — hiçbir şirketin kapatmadığı bir veri kütüphanesiyle.
ICLR 2026'da kod ve veri setleri, bilimin özgürleşmesinin bir anı. Bu, yalnızca 1.200 makale değil, 1.200 adet yeni bilimsel özgürlük hakkı. Artık bir modelin nasıl çalıştığını sormak yeterli değil — hangi verilerle eğitildiğini, kimin izniyle toplandığını ve hangi hukuki sınırlar içinde kullanıldığını da sormak gerekiyor. Bu, yapay zekânın yalnızca akıllı olması değil, sorumlu olması gerektiği anlamına geliyor.


