EN

14B Parametreli AI, GPT-4o'yu NYT Connections'ta Yendi

calendar_today
schedule4 dk okuma
visibility14 okunma
trending_up8
14B Parametreli AI, GPT-4o'yu NYT Connections'ta Yendi
Paylaş:
YAPAY ZEKA SPİKERİ

14B Parametreli AI, GPT-4o'yu NYT Connections'ta Yendi

0:000:00

summarize3 Maddede Özet

  • 1Bir araştırmacı, sadece 10 dolarlık bir maliyetle Qwen 14B modelini fine-tune ederek GPT-4o'nun %22.7'lik başarı oranını %30'a çıkardı. Bu başarının sırrı, yapay zekanın 'düşünmesini' öğretmekti.
  • 214B Parametreli Bir AI, GPT-4o'yu NYT Connections'ta Yendi: Nasıl Başardı?
  • 3Yapay zekanın sadece cevap vermekle kalmayıp, nasıl düşündüğünü de anlatması, son dönemde AI dünyasında en çarpıcı dönüşümün adı oldu.

psychology_altBu Haber Neden Önemli?

  • check_circleBu gelişme Yapay Zeka Modelleri kategorisinde güncel eğilimi etkiliyor.
  • check_circleTrend skoru 8 — gündemde görünürlüğü yüksek.
  • check_circleTahmini okuma süresi 4 dakika; karar vericiler için hızlı bir özet sunuyor.

14B Parametreli Bir AI, GPT-4o'yu NYT Connections'ta Yendi: Nasıl Başardı?

Yapay zekanın sadece cevap vermekle kalmayıp, nasıl düşündüğünü de anlatması, son dönemde AI dünyasında en çarpıcı dönüşümün adı oldu. Reddit kullanıcısı ve bağımsız bir AI araştırmacısı, bir hafta sonu boyunca Qwen 14B adlı açık kaynaklı bir dil modelini fine-tune ederek, New York Times’ın popüler kelime oyunu NYT Connections’da GPT-4o’yu geçti. Sonuç? %30 başarı oranı — GPT-4o’nun %22.7’sinden daha yüksek. Bu sadece bir teknik başarı değil; yapay zekanın ‘mantık yürütmeyi’ öğrenebileceğinin kanıtı.

Ne oldu? Sadece cevap vermekten, düşünmeye geçiş

Qwen 14B, başlangıçta sadece %9.3 oranında Connections’ı çözebiliyordu. GPT-4o-mini %10, GPT-4o ise %22.7 ile öne çıkıyordu. Ancak bu araştırmacı, modeli sadece doğru cevaplarla değil, doğru düşünme süreçleriyle eğitti. Bunun için, Claude Sonnet 3 — ki bu modelin Connections çözüm oranı %87.3’tü — yaklaşık 350 bulmacayı adım adım çözdürdü. Her adım: neden bu kelime grubu bir araya gelir? Hangi anlamsal bağlantılar gözden kaçırılıyor? Hangi alternatifler reddedildi?

Elde edilen bu ‘düşünce izleri’ (reasoning traces), Qwen modeline eğitim verildi. Model artık ‘cevabı’ değil, ‘yolunu’ öğrendi. Bu, AI dünyasında uzun süredir tartışılan bir kavram: çalışan bir model, sadece kalıpları ezberlemiyor, stratejileri içselleştiriyor.

Neden oldu? Distillasyonun gücü

Araştırmacı, önceki denemelerde sadece cevapları vermekle kalmıştı. Sonuç? Model, Connections formatını ezberledi ama anlamadı. Örneğin, ‘sarı, mavi, kırmızı, yeşil’ gibi renkleri bir araya getirmeyi öğrendi ama ‘kayısı, portakal, limon, muz’ gibi soyut kategorilerde (‘sarı meyveler’) çözemiyor, çünkü ‘sarı’ bir renk değil, bir renk tonu olarak algılanıyordu.

Sentetik bulmaca üretimi de başarısız oldu: Claude, yapay bulmacalar oluştururken çok basit, gerçekçi olmayan kategoriler üretiyordu — ‘hayvanlar, bitkiler, mineral, kozmik nesneler’ gibi. Bu, modeli yanılttı. Benzerlik tabanlı skorlama (embedding similarity) da başarısız oldu; çünkü ‘kedi’ ile ‘köpek’ arasındaki ilişki, ‘kedi’ ile ‘kedi kumu’ arasındaki ilişkiyle aynı değil. Anlam, bağlama bağlıdır — ve bu bağlamı sadece dil modelleri değil, mantıksal yürütmeyi anlayan modeller anlayabilir.

Nasıl yapıldı? 10 dolarlık bir harcama, 30 dakikalık bir eğitim

Teknik detaylar şaşırtıcı kadar basit: QLoRA ile Unsloth kütüphanesi kullanılarak, modelin yalnızca %1’i güncellendi. LoRA rankı 32, eğitim dönemi 2.5, toplam eğitim süresi 20 dakika. A100 GPU üzerindeki toplam maliyet 10 dolar. Bu, büyük şirketlerin milyonlarca dolar harcayarak eğittiği modellerle rekabet edebilir bir modelin, bir bireyin garajında nasıl doğabileceğinin mükemmel örneği.

İşte burada, AI dünyasının en büyük dönüşümü başlıyor: Model büyüklüğü değil, eğitim kalitesi kazanıyor. Qwen 14B, GPT-4o’dan küçük, daha az veriyle eğitilmiş, daha az maliyetli — ama daha akıllı. Çünkü ona ‘nasıl düşünmek gerektiğini’ öğretildi.

Ne anlama geliyor? AI’nın ‘mantık’ çağına giriyor

Bu başarı, sadece bir bulmaca oyununda değil, daha geniş bir alanda etkili olacak. Eğitimde, tıp teşhisinde, hukuki analizde — her yerde, modelin sadece cevap vermesi değil, niye bu cevabı verdiğini açıklayabilmesi kritik. GPT-4o, yüksek performanslı bir ‘cevap makinesi’. Ancak bu fine-tune edilmiş Qwen, bir ‘muhakeme makinesi’.

Bu, açık kaynaklı AI’ya bir dönüm noktası. Daha önce, büyük modellerin üstünlüğü, veri ve hesaplama gücüne dayanıyordu. Şimdi, kaliteli eğitim verisi ve doğru öğrenme stratejisi öne çıkıyor. Claude Sonnet 3 gibi pahalı bir modelin ‘düşünme tarzı’ bir 14B modeline aktarılabilir. Bu, AI demokratizasyonunun yeni bir çağının başlangıcı.

Gelecekte, bir öğrenci, bir küçük şirket, bir köy doktoru — tümü, pahalı API’ler yerine, kendi bilgi kaynaklarından öğrendikleri ‘mantık’ ile, büyük şirketlerin modellerini geçebilecek. Bu, yalnızca bir teknik başarı değil: Bilginin erişilebilirliği üzerindeki bir devrim.

Yeni bir AI nesli doğuyor: Küçük, akıllı, ve düşününen.

Yapay Zeka Destekli İçerik
Kaynaklar: www.reddit.com

starBu haberi nasıl buldunuz?

İlk oylayan siz olun!