Yapay zeka alanında dünya modeli geliştirme çalışmaları hız kazanırken, JEPA mimarisini temel alan yeni bir model dikkat çekti. Araştırmacılar tarafından tanıtılan LeWorldModel (LeWM), ham piksel verisinden uçtan uca kararlı şekilde eğitilebilen ilk JEPA tabanlı mimari olarak öne çıkıyor. Joint Embedding Predictive Architectures çerçevesini kullanan model, eğitim sürecindeki sade yaklaşımı ve yüksek planlama hızıyla mevcut yöntemlere alternatif sunuyor. Geleneksel dünya modellerine kıyasla daha az karmaşık ayarlara ihtiyaç duyan sistem, fiziksel dünyayı anlama kapasitesiyle de teknik çevrelerin ilgisini çekti.
Sadece İki Kayıp Terimiyle Eğitim
LeWorldModel, karmaşık eğitim teknikleri yerine yalnızca iki kayıp terimi kullanarak çalışıyor. Bu sayede hiperparametre sayısı önemli ölçüde azalıyor ve modelin eğitimi daha kararlı hale geliyor.
Yaklaşık 15 milyon parametreye sahip olan model, tek bir GPU üzerinde birkaç saat içinde eğitilebiliyor. Açıklanan verilere göre mevcut temel model tabanlı dünya modellerine kıyasla 48 kat daha hızlı planlama yapabiliyor.Model, temsil çökmesini önlemek için Gaussian dağılımlı gizli gömme düzenleyicisi kullanıyor. Bu yöntem, sistemin fiziksel olarak imkansız olayları ayırt edebilmesine ve fiziksel yapıları daha doğru analiz edebilmesine olanak tanıyor.
2D Ve 3D Görevlerde Rekabetçi Performans
Yapılan testlerde LeWorldModel’in hem 2D hem de 3D kontrol görevlerinde rekabetçi sonuçlar verdiği belirtildi. Fiziksel ortamı modelleme ve simülasyon kabiliyeti, robotik ve otonom sistemler gibi alanlarda kullanım potansiyeli sunuyor.Araştırmacılar, bu yaklaşımın daha verimli ve ölçeklenebilir dünya modellerinin geliştirilmesinde önemli bir adım olabileceğini ifade ediyor.