EN

LiquidAI’nin 24M Parametreli Modeli: Telefonlarda Çalışan

calendar_today
schedule4 dk okuma
visibility24 okunma
trending_up7
LiquidAI’nin 24M Parametreli Modeli: Telefonlarda Çalışan
Paylaş:
YAPAY ZEKA SPİKERİ

LiquidAI’nin 24M Parametreli Modeli: Telefonlarda Çalışan

0:000:00

summarize3 Maddede Özet

  • 1Hugging Face’te ortaya çıkan LFM2-24B-A2B, 24 milyar parametreyle bilimsel bir çığır açıyor — ama sadece 2 milyarını aynı anda kullanıyor. Bu, yapay zekanın geleceğini değiştirebilir.
  • 2LiquidAI’nin 24 Milyar Parametreli Modeli: Akıllı Telefonlarda Çalışan Bir Yapay Zeka Devi Yapay Zekanın Yeni Sırrı: 24 Milyar Parametre, Sadece 2 Milyar Aktif Bir yapay zeka modeli, 24 milyar parametreyle dünyayı sarsarken, aynı anda sadece 2 milyarını kullanıyor.
  • 3Bu, teknoloji tarihinin en çarpıcı ikilemlerinden biri.

psychology_altBu Haber Neden Önemli?

  • check_circleBu gelişme Yapay Zeka Modelleri kategorisinde güncel eğilimi etkiliyor.
  • check_circleTrend skoru 7 — gündemde görünürlüğü yüksek.
  • check_circleTahmini okuma süresi 4 dakika; karar vericiler için hızlı bir özet sunuyor.

LiquidAI’nin 24 Milyar Parametreli Modeli: Akıllı Telefonlarda Çalışan Bir Yapay Zeka Devi

Yapay Zekanın Yeni Sırrı: 24 Milyar Parametre, Sadece 2 Milyar Aktif

Bir yapay zeka modeli, 24 milyar parametreyle dünyayı sarsarken, aynı anda sadece 2 milyarını kullanıyor. Bu, teknoloji tarihinin en çarpıcı ikilemlerinden biri. Hugging Face’te yer alan LiquidAI/LFM2-24B-A2B-GGUF, bu paradoksu gerçekleştiren ilk model. Neden bu kadar önemli? Çünkü bu model, bir H100 GPU’ya ihtiyaç duymadan, normal bir laptopta bile akıllıca konuşabiliyor. Yani artık yapay zeka, sadece Amazon veya Google veri merkezlerinde değil, sizin masanızda da oturuyor.

Nasıl Çalışıyor? MoE Mimarisi ve İnanılmaz Verimlilik

LFM2-24B-A2B, MoE (Mixture of Experts) adı verilen bir mimariye dayanıyor. Bu mimari, bir modelin tüm parametrelerini her seferinde çalıştırmak yerine, her girdi için yalnızca en uygun "uzman" alt gruplarını seçerek işlem yapar. İşte bu yüzden 24 milyar parametre varken, her token için sadece 2 milyar aktif kalıyor. Bu, hem bellek kullanımını %90’a varan oranda azaltıyor, hem de hızı katlıyor. Reddit’deki bir kullanıcı, AMD CPU’da 112 token/saniye hızı elde ettiğini yazıyor — bu, bir zamanlar sadece en üst düzey bulut sunucularında mümkün olan bir performans.

Önceden, 20 milyar parametrelik bir model için 48 GB RAM gerekirdi. Şimdi, bu model 32 GB RAM’de çalışıyor. Bu, teknolojinin sadece daha güçlü değil, aynı zamanda daha akıllıca kullanıldığı anlamına geliyor. Bilim insanları, bu tür mimarilerin yapay zekanın "yakınsama" (convergence) sürecini hızlandırdığını ve daha az veriyle daha iyi sonuçlar elde edildiğini kanıtlıyor. LFM2 ailesi, 350 milyondan 24 milyara kadar olan ölçeklemelerde kaliteyi logaritmik olarak artırıyor — yani parametre sayısı iki katına çıktığında, performans sabit bir oranda yükseliyor. Bu, modelin stabil ve öngörülebilir olduğunu gösteriyor. Birçok şirket, bu tür modelleri geliştirmeye çalışırken, kalite düşüyor ya da hız patlıyor. LFM2 ise bu ikilemi çözüyor.

Neden Bu Model, Sadece Bir Teknoloji Haberi Değil?

İnsanlık tarihi boyunca, teknoloji her zaman merkeziyetçi oldu: büyük firmalar, büyük veri merkezleri, büyük maliyetler. Ama LFM2-24B-A2B, bu dengeleri değiştiriyor. Bir öğrenci, bir küçük startup, bir köydeki öğretmen — hepsi bu modeli indirip, kendi cihazlarında çalıştırabiliyor. Bu, yapay zekanın demokratikleşmesi demek. Artık bir şirketin AI hizmeti almak için Amazon Web Services’e abone olmasına gerek yok. Sadece bir .gguf dosyasını indirip, llama.cpp ile çalıştırıyor. Bu, bir yazılım devrimi. Kullanıcılar artık sadece tüketici değil, aynı zamanda üretici oluyor.

Özellikle Türkiye gibi, bulut altyapısı sınırlı ve veri yasaları sıkı olan ülkelerde bu model, bir kurtuluş kaynağı olabilir. Verilerin yurtdışına taşınmadan, yerel sunucularda veya kişisel cihazlarda işlem yapmak, gizlilik ve veri egemenliği açısından büyük bir avantaj. Bu model, hem teknik hem de siyasi açıdan özgürleştirici.

Ne Zaman Kullanılabilir? Neler Yapabilir?

LFM2-24B-A2B, bir "instruct model" — yani doğrudan kullanıcı talimatlarına cevap vermek için optimize edilmiş. Yani bir chatbot, bir akademik araştırmacı, bir yazılımcı veya bir ders hazırlayan öğretmen için mükemmel. Reasoning trace (mantıksal adım adım çıkarım) desteği yok, bu yüzden karmaşık matematiksel ispatlar için değil, günlük görevler için ideal. Örneğin: bir rapor yazmak, bir e-posta düzeltmek, bir kod parçasını açıklamak, bir metni özetlemek — bunların hepsi, bir laptopta birkaç saniyede yapılabiliyor.

Model, llama.cpp, vLLM ve SGLang gibi popüler açık kaynak araçlarla doğrudan entegre edilebiliyor. Bu, geliştiricilerin biraz kod yazarak, kendi uygulamalarına entegre edebilmesi demek. Bir Android uygulaması içindeki yerel bir chatbot, bir web sitesindeki anlık yardımcı — bunların hepsi artık gerçek olabilir.

Gelecek: Yapay Zekanın Elde Kalması

2024’te yapay zeka, merkeziyetçi bir trendle büyüyordu: daha büyük, daha pahalı, daha çok enerji tüketen modeller. Ama LiquidAI’nin bu modeli, tam tersini gösteriyor: daha akıllı, daha verimli, daha yerel. Bu, sadece bir teknik ilerleme değil, bir felsefi dönüşüm. Yapay zekanın, insana hizmet etmesi için insana yakın olması gerekiyor. Bu model, o yakınlığı sağlıyor.

Yakında, bir telefonunuzda çalışan, kendi verilerinizi öğrenen, hiçbir şeyi buluta göndermeyen bir AI asistanı olacak. Ve bu, LiquidAI’nin bu küçük .gguf dosyasıyla başladı. Teknoloji, artık sadece şirketlerin elinde değil, herkesin elinde.

Yapay Zeka Destekli İçerik
Kaynaklar: www.reddit.comHugging Face

starBu haberi nasıl buldunuz?

İlk oylayan siz olun!