Apple, görselleri yorumlayıp nesneleri sayabilen AI modeli geliştirdi

Apple araştırmacıları, hem metin hem de görsel bilgileri sorunsuz bir şekilde entegre eden büyük dil modellerini (LLM) eğitmek için yeni bir yöntem geliştirdi. Apple MM1 olarak belirtilen model, 30 milyara kadar parametre içeren çok modlu modeller (Google Gemini gibi) dünyasına adım atıyor. Apple MM1, resim-altyazı çiftleri, resim-metin belgeleri ve yalnızca metin verilerinden oluşan bir veri seti kullanarak çok modluluğunu sergiliyor.

Apple’dan yeni yapay zeka modeli

Çok modlu büyük dil modelleri (MLLM) ile büyük dil modelleri (LLM) arasında önemli farklar bulunuyor ve artık gelişmiş güncel yapay zekalar çok modlu olarak karşımıza çıkıyor. ChatGPT (ücretsiz) gibi yapay zeka sohbet robotları sadece metinsel girdi kabul ederken Apple MM1 veya Gemini ve Copilot gibi yapay zekalar metinlerle birlikte görsel veya ses içeriklerini de işleyebiliyor.

Apple, MM1’in nesneleri sayabildiğini, görüntülerin parçalarını tanımlayabildiğini ve temel matematiksel işlevleri yerine getirebildiğiniiddia ediyor. Ayrıca bağlam içi öğrenmeyi de destekliyor, yani modelin her sorgu için yeniden eğitilmesi veya ince ayar yapılması gerekmiyor. MM1 ayrıca birden fazla görüntüyü yorumlamasına ve bunlardan sonuçlar çıkarmasına olanak tanıyan çoklu görüntü muhakemesine de sahip.
Makale ayrıca MM1 modelinin, özellikle modelin en büyük 30 milyar parametreli konfigürasyonunda, bağlam içi öğrenme yeteneklerini vurguluyor. Bu versiyon, yapay zekanın minimum örneklere dayanarak karmaşık, açık uçlu problem çözme gerçekleştirmesine olanak tanıyor.  Araştırma makalesinde araştırmacılar modele gösterdikleri fotoğrafta masadaki tüm biralar için ne kadar ödemeleri gerektiğini soruyor. Bu soru Emu-Chat-37B ve LLaVA-NeXT-34B’ye de yöneltiliyor. Ve sadece Apple MM1’in doğru cevap verdiği görülüyor.

Öte yandan MM1, şimdilik sadece bir araştırma makalesinden ibaret ve ortada somut bir ürün yok. Apple’ın yapay zeka araştırmaları umut verse de herhangi bir demonun bile mevcut olmaması endişe uyandırıyor. Geçtiğimiz gün ise Apple’ın iOS 18 ile üretken yapay zekayı iPhone’lara getirmek için Google Gemini’yi kullanabileceği gündeme gelmişti. İddialar güçlü görünürken aynı zamanda Apple’ın yapay zekada umduğu ilerlemeyi yakalayamadığına işaret ediyor.

İlk yorum yapan olun

Bir yanıt bırakın

E-posta hesabınız yayımlanmayacak.


*