EN

Omost Nerede? AI ile Görüntü Üreten Dev Proje Neden Sessizlikte?

calendar_today
schedule4 dk okuma süresi dk okuma
visibility14 okunma
trending_up43
Omost Nerede? AI ile Görüntü Üreten Dev Proje Neden Sessizlikte?
Paylaş:
YAPAY ZEKA SPİKERİ

Omost Nerede? AI ile Görüntü Üreten Dev Proje Neden Sessizlikte?

0:000:00

Omost Nerede? AI ile Görüntü Üreten Dev Proje Neden Sessizlikte?

2024’ün başlarında, yapay zeka görsel üretimi dünyasında bir şok dalgası gibi yükselen Omost projesi, kısa sürede hem teknik toplulukları hem de sanatçıları etkiledi. GitHub’da paylaşılan bu açık kaynaklı proje, dillerin kod yazma yeteneğini görsel oluşturma gücüne dönüştürüyordu. Sadece bir model değil, bir felsefeydi: ‘İnsanlar bir şeyi tarif eder, AI onu kodlar, kod çalışır, resim doğar.’ Adı, ‘almost’ (neredeyse) kelimesinin sesli okunuşundan türetilmişti — çünkü her seferinde sonuç ‘neredeyse’ tamamdı. Ama şimdi? Sessizlik. Hiçbir güncelleme. Hiçbir yorum. Hiçbir commit.

Nasıl Çalışıyordu? Teknik Bir Sihir

Omost’un temel fikri, geleneksel text-to-image modellerinin sınırlarını aşmaktı. DALL·E veya Stable Diffusion gibi sistemler, bir metni doğrudan bir piksel haritasına çevirir. Omost ise, metni bir Python koduna çevirirdi. Örneğin: “Bir kedi, mavi bir şapka takmış, güneşli bir ormanda kitap okuyor” cümlesi, bir Canvas nesnesi oluşturup, ona çizim komutları ekleyen, fonksiyonlar çağıran, hatta renk paletlerini ayarlayan bir kod dizisine dönüşüyordu. Bu kod, sonra bir görsel üretici (örneğin Stable Diffusion) tarafından yorumlanarak gerçek bir görüntü haline geliyordu.

Bu yaklaşımın avantajı, çok daha yüksek kontrol düzeyiydi. Kullanıcılar “kediye şapka tak” demek yerine, “şapkanın rengini #003366 yap, sol gözünde bir ışık yansımaları ekle” gibi detaylı komutlar verebilirdi. Proje, Open-Images, GPT-4o verileri ve DPO (Direct Preference Optimization) ile eğitilmişti — yani sadece doğru çıktıları değil, “kodun derlenebilirliği” gibi teknik detayları da öğrenmişti. Bu, AI’nın sadece estetik değil, aynı zamanda teknik bir disiplinle çalıştığını gösteriyordu.

Neden Sessizlik?

Projenin kurucusu, lllyasviel, GitHub profilinde 2024 yazından beri hiçbir commit yapmadı. Son commit, 15 Haziran 2024. O zamanlar, Omost’un üç farklı Llama3 ve Phi3 tabanlı modeli mevcuttu. Ancak şu anda, projenin ana sayfası, bir zamanlar canlı bir tartışma forumuymuş gibi görünen yorumlarla doluydu — şimdi ise sadece 300+ yorum, “Omost nerede?” diye sormakla dolu. Reddit’deki “Whatever happened to Omost?” başlıklı konu, 5 bin okunma ve 300+ yorum aldı. Kimi kullanıcılar “Bir şirket satın aldı belki” dedi, kimi “Yapımcısı başka bir projeye geçti” dedi, kimisi de “Bu teknik, çok karmaşık ve ölçeklenemez — doğal bir ölümdür” dedi.

Ancak en çarpıcı hipotez, teknik bir zorluk değil, etik bir çatışmaydı. Omost, GPT-4o’nun çoklu modallı yeteneklerinden küçük bir veri setiyle eğitilmişti. Bu, OpenAI’nin verilerini kullanmak anlamına geliyordu — ve bu, açık kaynak bir projede yasal ve etik bir zeminde oldukça riskliydi. OpenAI, GPT-4o’nun çıktısını açıkça ticari amaçlarla kullanmayı yasaklamıştı. Omost’un bu verileri nasıl topladığı, nasıl kullandığı ve kimin izin verdiği tamamen belirsizdi. Belki de bu, projenin sessizce kaldırılmasının nedeniydi.

Alternatifler Var Mı?

Reddit’deki kullanıcılar, “Klein”, “Qwen-Image” veya “Z-Image” gibi yeni modellerin Omost’un yerini alıp alamayacağını sordu. Cevap: Hayır. Çünkü bu modeller, Omost’un temel felsefesini — kod üretimi üzerinden görsel kontrol — benimsemiyor. Onlar, daha büyük veri setleriyle daha çok “görsel tahmin” yapıyorlar. Omost’un özü, “yazma”ydı. İnsanların düşüncelerini kod olarak ifade etmek. Bu, AI’nın yalnızca bir araç değil, bir “yazar” olarak davranmasını gerektiriyordu.

Şu anda, en yakın alternatifler, Google’ın Gemini 1.5 Pro veya Meta’nın Llama 3.2 Vision gibi modeller. Ama bunlar, kod üretimi değil, görsel anlama üzerine kuruludur. Omost’un kaybı, sadece bir proje kaybı değil — bir felsefi fırsatın kaybıydı: AI’nın sanatı, sadece algılayarak değil, yaratıcı bir şekilde yazarak üretmesi.

Gelecek İçin Bir Ders

Omost’un kayboluşu, AI görsel üretiminin bir çatıda yaşadığını gösteriyor: İnovasyonun hızı, etik ve yasal sınırlarla çatıştığında, teknik mükemmellik bile yok olabilir. Bir proje, sadece akıllı değil, aynı zamanda yasal ve sürdürülebilir olmalı. Omost, bir “neredeyse” gerçekleştirdi — ama tamamlanamadı. Belki de tam olarak bu yüzden, hatırlanacak.

Şimdi, bir sanatçı, bir programcı, bir araştırmacı, Omost’un kaybını duyduğunda ne düşünür? Belki de şu soruyu sorar: “Benim fikrim de, bir gün Omost gibi sessizliğe gömülecek mi?”

Yapay Zeka Destekli İçerik

starBu haberi nasıl buldunuz?

İlk oylayan siz olun!

KONULAR:

#Omost#AI görsel üretimi#yapay zeka kodlama#Stable Diffusion#lllyasviel#GPT-4o#açık kaynak AI#AI projeleri#Omost nerede#AI ve etik