EN

Ferret-UI Lite: Cihazda Çalışan Küçük AI'lar, Ekranları Nasıl Okuyor?

calendar_today
schedule4 dk okuma süresi dk okuma
visibility0 okunma
Ferret-UI Lite: Cihazda Çalışan Küçük AI'lar, Ekranları Nasıl Okuyor?
Paylaş:
YAPAY ZEKA SPİKERİ

Ferret-UI Lite: Cihazda Çalışan Küçük AI'lar, Ekranları Nasıl Okuyor?

0:000:00

Ekranı Okuyan Bir Zeka: Ferret-UI Lite, AI’nın Görme Becerisini Yeniden Tanımlıyor

Apple’ın machinelearning.apple.com adresinde paylaştığı Ferret-UI Lite projesi, yapay zekânın grafik arayüzlerle etkileşim kurma konusunda attığı bir adımı detaylı bir şekilde açıklıyor. Bu teknoloji, yalnızca bir başka AI modeli değil; cihazın kendi içinde çalışan, veri göndermeden, buluta bağlanmadan, ekranı okuyan ve karar veren bir ‘göz’ ve ‘zihin’ kombinasyonu. 3 milyar parametrelik bu model, mobil, web ve masaüstü arayüzlerinde çalışan uygulamaları anlayabiliyor — ve bunu, büyük bulut tabanlı modellerin gerektirdiği kaynaklardan çok daha azıyla yapıyor.

Neden Küçük Modeller? Gizlilik, Hız ve Kaynak Tasarrufu

Geçtiğimiz on yılın AI trendi, her şeyi daha büyük yapmaktı: daha fazla veri, daha fazla parametre, daha fazla enerji. Ama Apple, bu trende karşı bir kırılma noktası yaratıyor. Ferret-UI Lite, 3B parametrelik bir modelle, 70B’lik modellerin yaptığı görevleri — örneğin bir butona tıklamayı, bir metin kutusuna yazmayı, bir menüde gezinmeyi — cihazda gerçekleştirebiliyor. Bu, sadece teknik bir başarı değil; bir felsefi dönüşüm. Kullanıcının verileri artık sunucuya gidiyor değil, cihazın içinde kalıyor. Bu, özellikle sağlık, finans ve çocuk koruma uygulamalarında kritik bir avantaj. Bir diabet uygulaması, kan şekeri takip ekranını okuyup not alabiliyor; bir anne, çocuğunun oyun uygulamasındaki reklamları otomatik olarak engelleyebiliyor — ve hiçbir veri internete çıkmıyor.

Nasıl Çalışıyor? Görme + Akıl + Araç Kullanımı

Ferret-UI Lite, üç temel teknikle çalışır: zincirleme akıl yürütme (chain-of-thought reasoning), görsel araç kullanımı ve gerçek ve sentetik veri karışımı. İlk olarak, model bir ekran görüntüsünü gördüğünde, yalnızca ‘bu bir buton’ demiyor. ‘Bu butonun etiketi “Ödeme Yap” diyor, önceki adımda kullanıcı “Sepete Ekle” dedi, şimdi ödeme aşamasındayız, bu butona tıklanmalı.’ gibi bir mantık zinciri oluşturuyor. İkinci olarak, model sadece görsel analizle kalmıyor; ekranın içindeki ‘araçları’ — örneğin klavye, fare imleci, diyalog kutuları — kullanarak etkileşim kuruyor. Üçüncü olarak, modeli eğitmek için yalnızca gerçek kullanıcı ekranları değil, yapay olarak oluşturulan binlerce senaryo da kullanıldı. Bu, modelin nadir görülen durumlara (örneğin, dil değişikliği sonrası arayüz bozulması) karşı dayanıklı olmasını sağlıyor.

2010 Mercury Milan’dan Ferret-UI Lite’a: Veri Çatışması ve Gerçeklik

İlginç bir şekilde, bu teknolojiyi araştırırken, internet üzerindeki bir kaynak — jlaforums.com — 2010 model bir Mercury Milan aracının tamir maliyeti hakkında bir tartışma sayfası sunuyordu. Ancak bu sayfa, reklam engelleyicileri nedeniyle erişilemez hale getirilmiş. Bu çelişki, modern teknolojinin iki yüzünü gözler önüne seriyor: Bir tarafta, Apple’ın cihazda çalışan, gizliliği koruyan, insan odaklı bir AI modeli geliştiriyor; diğer tarafta, bazı web siteleri, kullanıcıların özgür erişim hakkını reklam geliri adına kısıtlıyor. Ferret-UI Lite, kullanıcıya kontrolü geri veriyor; jlaforums.com ise kullanıcıyı reklam sistemine tutsak ediyor. Bu iki dünya, AI’nın geleceğini nasıl şekillendireceğini simgeliyor: Kullanıcıyı körükleyen mi, yoksa koruyan mı?

Gelecek: Her Cihazda Bir UI Asistanı

Ferret-UI Lite, sadece Apple ürünlerinde değil, Android, Windows ve hatta akıllı buzdolaplarında da kullanılabilecek bir altyapı sunuyor. Gelecek yıllarda, bir telefonunuzun ekranını okuyup size ‘bu bildirimdeki link güvenli değil’ diye uyarı vermesi, bir bilgisayarınızın otomatik olarak reklam bloğunu tespit edip kapatması, veya bir akıllı saatinizin doktorunuzun yazdığı reçete ekranını okuyup ilacı hatırlatması mümkün olacak. Bu, teknolojinin ‘sadece hızlı’ olmaktan çıkıp, ‘anlayan’ hale gelmesi demek. Ve bu, AI’nın en büyük dönüşümü: Sadece bize cevap vermekten, bize ekranları anlamakta yardımcı olmaya geçmek.

Önemli Soru: Kimin İçin Yapılıyor?

Apple’ın bu projesi, yalnızca teknik bir başarı değil, bir etik seçimi. Büyük teknoloji şirketleri, kullanıcı verilerini toplayarak model eğitiyor; Apple ise, kullanıcı verilerini koruyarak model eğitiyor. Ferret-UI Lite, AI’nın ‘gözü’ne sahip olmak isteyenler için bir yol haritası. Ama bu yol, yalnızca teknolojiyle değil, değerlerle de çiziliyor. Gizlilik, erişilebilirlik, verimlilik — bu kelimeler artık sadece pazarlama dili değil, AI’nın temel taşları haline geliyor.

Yapay Zeka Destekli İçerik

starBu haberi nasıl buldunuz?

İlk oylayan siz olun!

KONULAR:

#Ferret-UI Lite#Apple AI#on-device AI#GUI agent#gizlilikli yapay zeka#küçük AI modelleri#ekran anlama#chain-of-thought