Taalas, Llama 3.1 8B’i saniyede 17.000 tokenle çalıştırdı: Nvidia’nın tahtına sıçrama mı?

Taalas, Llama 3.1 8B’i saniyede 17.000 tokenle çalıştırdı: Nvidia’nın tahtına sıçrama mı?
Çin merkezli çip startup’ı Taalas, yapay zeka dünyasında bir şok dalgası yarattı. Saniyede 17.000 token hızıyla Meta’nın Llama 3.1 8B modelini çalıştırmayı başaran şirket, bu başarısıyla Nvidia’nın uzun süredir sahip olduğu AI inferans hızı rekorunu kırarak teknoloji tarihine bir sayfa daha ekledi. Reuters’a göre, Taalas bu başarıyı elde ettikten birkaç gün sonra 169 milyon dolarlık bir sermaye topladı. Bu yatırım, şirketin Nvidia’yı hedef alan AI çiplerini geliştirmek için gerekli altyapıyı inşa etme vizyonunu somutlaştırdı.
Neden Bu Kadar Önemli?
Saniyede 17.000 token işlemi, teknik olarak ne anlama geliyor? Basitçe söylemek gerekirse: Bu hız, bir AI modelinin bir insanın bir dakikada okuyabileceği metni sadece birkaç saniyede anlayıp cevap verebilmesi demek. Llama 3.1 8B, açık kaynaklı modeller arasında en güçlü ve en verimli olanlardan biri. Ancak bu modeli Nvidia H100 gibi premium çiplerle bile 8.000-10.000 token/saniye hızında çalıştırmak zor oluyor. Taalas’ın bu modeli neredeyse iki kat daha hızlı çalıştırması, sadece donanımın daha iyi olduğu anlamına gelmiyor. Bu, yazılım, mimari ve sistem entegrasyonunun tamamen yeniden tasarlandığının kanıtı.
Taalas’ın web sitesindeki "The model is the computer" (Model, bilgisayardır) sloganı, bu başarının özünü tam olarak yansıtır. Şirket, geleneksel CPU-GPU mimarilerine değil, AI modelinin kendisinin işlem birimi olarak çalıştığı bir mimariye odaklanıyor. Yani, modelin ağırlıkları, bellek erişimleri ve hesaplama akışları, donanım seviyesinde optimize ediliyor. Bu, Nvidia’nın CUDA ekosistemi gibi katmanlı bir yaklaşım yerine, modelin doğasına uygun bir "doğrudan donanım-akıl" entegrasyonu demek.
Nvidia’nın Yerini Almak mı, Yoksa Yeni Bir Pazar mı?
Reuters, Taalas’ın hedefinin Nvidia olduğunu açıkça belirtiyor. Ancak bu sadece bir rekabet değil, bir dönüşüm. Nvidia, AI bulut hizmetleri ve kurumsal AI çözümleri için hâlâ egemen. Ama Taalas, daha küçük, daha verimli, daha ucuz ve daha hızlı sistemlerle özellikle kenar (edge) ve özel AI uygulamalarında bir boşluk yarattı. Örneğin, bir telekom şirketi, Taalas çipleriyle birlikte 10.000 adet akıllı telefonun yerel olarak gerçek zamanlı dil çevirisi yapmasını sağlayabilir. Nvidia’nın çözümleri bu tür durumlarda çok pahalı ve enerji tüketici.
Yeni sermaye, Taalas’ın üretim kapasitesini artırmak, global pazarlara yayılmak ve yazılım araçlarını geliştirmek için kullanılacak. Şirketin mission log sayfasında, "her modelin kendi donanımını oluşturması" vizyonu açıkça belirtiliyor. Bu, gelecekte AI modellerinin, farklı veri türleri ve görevler için özelleştirilmiş çiplerle birlikte dağıtılacağı anlamına geliyor. Yani, bir modelin her yerde aynı çip üzerinde çalışması zorunlu değil — her model, kendi için en iyi donanıma sahip olacak.
Teknolojik Devrim mi, Yoksa Kısa Bir Şov mu?
Tabii ki, bu başarıya şüpheyle yaklaşılmakta. Birçok uzman, Taalas’ın performans verilerinin gerçek dünya koşullarında tekrarlanabilir olup olmadığını sorguluyor. Özellikle, modelin tamamı RAM’de tutulabiliyor mu? Soğutma ve enerji tüketimi nasıl? Gerçek bir üretim ortamında bu hız korunabilir mi? Şirket, henüz teknik detayları paylaşmadı. Bu, biraz gizemli bir hava yaratıyor — ya çok büyük bir keşif, ya da bir demo için optimize edilmiş bir "lab stajı".
Ancak, bu sorgulara rağmen, Taalas’ın başarısı, AI donanım endüstrisindeki bir eğilimi ortaya koyuyor: Nvidia’nın tekelleri kırılıyor. Artık sadece büyük şirketler değil, küçük ekipler de, kreatif mimarilerle global rekabeti değiştirebiliyor. Intel, AMD, Qualcomm bile bu alanda hızlanıyor. Taalas, bu yarışta ilk sırayı almak için sadece hız değil, yeni bir felsefe sunuyor: AI, bilgisayar değil, bilgisayarın zihnidir.
Gelecek İçin Ne Anlama Geliyor?
- Verimlilik, büyüklükten daha önemli hale geliyor: Daha büyük modeller değil, daha akıllıca çalışan küçük modeller öne çıkıyor.
- Open-source + özel donanım = yeni güç: Llama gibi açık kaynak modeller, kendi özel çipleriyle birleştiğinde, kapalı sistemlerle rekabet edebilir.
- Çin, AI donanımında lider olmaya hazırlanıyor: Taalas, Huawei, Cambricon gibi şirketlerle birlikte, ABD’nin teknolojik üstünlüğünü zorlayan bir Çinli ekosistemin parçası.
Taalas, belki de bir kere daha bir şeyi değiştirmeyecek. Ama bu başarı, bir mesaj gönderiyor: AI’nın geleceği, sadece Nvidia’nın elinde değil. Gelecek, her modelin kendi bilgisayarını yapabileceği, her yazılımın kendi donanımını şekillendirebileceği bir dünyada. Ve bu dünyada, saniyede 17.000 token, sadece bir başlangıç.


