800 Eski GPU ile Yapay Zeka Çılgınlığı: RX 580'ler, AI Cluster'a Dönüştürülüyor

800 Eski GPU ile Yapay Zeka Çılgınlığı: RX 580'ler, AI Cluster'a Dönüştürülüyor
Madencilik Çöpleri, Yapay Zeka Devi Haline Geldi
Eski Ethereum madenciliği ekipmanları, artık çöp yığını değil, yapay zeka devriminin sırrı haline geldi. Reddit’te r/LocalLLaMA forumunda paylaşılan bir güncelleme, 800 adet RX 580 GPU’nun nasıl birbirinden bağımsız yapay zeka işleyicilerine dönüştürüldüğünü detaylıca anlatıyor. Bu, sadece bir teknik yeniden kullanım örneği değil — tam bir felsefi dönüşüm: ‘Büyük bir model yerine, binlerce küçük modelin bir araya gelmesi’ fikriyle, AI altyapılarının temel paradigması sarsılıyor.
Neden RX 580? Neden Bu Kadar Çok?
2018’de Ethereum madenciliği için satın alınan bu kartlar, 4GB ve 8GB VRAM’li Sapphire Nitro+ ve Pulse modelleri. Zamanla ETH mining’in karlılığı kayboldu, ve bu 800 GPU, karanlık bir depoda tozlanmaya başladı. Teknik olarak, bu kartlar 2026 itibarıyla çok eski: AMD’nin Polaris mimarisi (gfx803), PCIe 3.0 x16 arayüzü, düşük bellek bant genişliği ve 64-bit memory bus’u ile modern AI eğitimlerine uygun değil. Tensor parallelism gibi modern teknikler, bu kartlar arasında yüksek gecikme nedeniyle tamamen başarısız oldu. Birbirine bağlanmaya çalışıldığında, iletişim gecikmesi modelin tamamını durduruyordu.
Bu yüzden ekip, tamamen farklı bir strateji benimsedi: ‘Bir GPU, Bir Model, Bir İstek’. Her RX 580, kendi başına küçük bir AI inferans işlecine dönüştürüldü. Her biri, yalnızca bir modeli — örneğin, 7B parametreli bir Llama 3 türevi — barındırıyor ve tek bir kullanıcı isteğini işliyor. 800 kart = 800 bağımsız AI sunucusu. Bu yaklaşım, klasik bulut AI’nın ‘merkezi’ modeliyle tamamen tersine dönmüş durumda.
Vulkan: Tek Umarı
AMD’nin ROCm desteği, bu eski kartlarda neredeyse yok. HIP (AMD’nin CUDA benzeri arayüzü) ile 6 kartlı bir sistemde sadece bir tanesini görebiliyorlardı. ROCm’in bu kartlarla uyumlu olmaması, teknik bir duvar gibi duruyordu. Alternatifler denendi: OpenCL yavaş, CUDA yoktu. Sonunda, Vulkan API’si kurtarıcı oldu. Vulkan, GPU’ya doğrudan erişim sağlıyor, sürücü katmanında çok az bağımlılık gerektiriyor ve özellikle AMD’nin eski donanımlarında daha stabil çalışıyor. Llama.cpp’i Vulkan üzerinden derleyip, her bir RX 580’de ayrı ayrı çalıştırmak, en azından ‘çalışabilir’ hale getirdi. Bu, teknik bir mucize gibi görünse de, aslında ‘kısıtlı kaynaklarla maksimum verim’ prensibinin mükemmel bir örneği.
Yapay Zekanın Yeni Modeli: Dağıtık, Küçük, Ucuz
Bu proje, AI dünyasında bir devrimi çağrıştırıyor. Şu ana kadar, büyük modellerin eğitimi ve dağıtımı, yalnızca NVIDIA A100/H100 gibi 100.000 dolarlık kartlarla mümkün sayılıyordu. Bu proje ise, 800 adet 300 dolarlık eski kartla, benzer bir işlevsellik sağlıyor — ve bu, özellikle gelişmekte olan ülkelerde, akademik kurumlar ve küçük şirketler için kritik bir fırsat. Her bir GPU, sadece 150-200 watt tüketiyor. Toplamda 160 kW’lık bir güç tüketimiyle, bir NVIDIA DGX sisteminin %5’i kadar enerjiyle 800 bağımsız AI servisi çalıştırılıyor.
Ek olarak, bu sistemde her kart bağımsız olduğundan, bir kart arızalandığında sistem tamamen çökmez. Sadece o kartın işi düşer, geri kalan 799 hala çalışıyor. Bu, ‘fault-tolerant’ bir altyapı oluşturuyor — yani çok daha dayanıklı. Bulut sağlayıcıları, bu tür ‘kümeleri’ küçük ölçekli, yüksek esneklikli servisler için kullanabilir. Örneğin, bir metin üretme API’si, 800 farklı isteği aynı anda 800 farklı kartta işleyebilir. Her istek, farklı bir model ağırlığıyla cevap verebilir. Bu, kişiselleştirilmiş AI servislerinin doğuşuna yol açıyor.
Gelecek: Küçük Kartlar, Büyük Etki
Bu proje, sadece bir teknik deney değil, bir felsefi değişiklik. AI’nın geleceği, yalnızca ‘büyük’ değil, aynı zamanda ‘dağıtık’ ve ‘ekonomik’ olacak. NVIDIA’nın monopolüne karşı, bu tür ‘yapay zeka çöpleri’ yeniden canlanarak, altyapıya yeni bir anlam kazandırıyor. 2026’da, bir üniversite laboratuvarı, 800 RX 580 ile bir AI cluster kurabilir — ve bu, milyonlarca dolarlık bütçeleri sıfıra indiriyor.
Gelecekte, belki de AI modelleri, büyük merkezi sistemlerde değil, evlerde, kafe server’larında, küçük veri merkezlerinde, eski oyun kartlarıyla çalışacak. Bu, teknolojinin en güzel yönü: çöp, yeniden düşünüldüğünde, devrim olabilir.


