- Avrupa Bilim ve Teknoloji Dergisi
- Issue:53
- Video Altyazılama için Önceden Eğitilmiş 3B-CNN'lerden Yararlanma
Video Altyazılama için Önceden Eğitilmiş 3B-CNN'lerden Yararlanma
Authors : Bengü Fetiler, Özkan Çaylı, Volkan Kılıç
Pages : 58-63
View : 80 | Download : 69
Publication Date : 2024-02-15
Article Type : Research Paper
Abstract :Video altyazılama, hem dilbilgisel hem de anlamsal olarak doğru açıklamalar oluşturmayı amaçlayan bir görsel anlama görevidir. Video altyazılamadaki ana zorluklardan biri, videolardaki karmaşık dinamikleri yakalamaktır. Bu çalışma bu zorluğu aşmak için önceden eğitilmiş 3B Evrişimli Sinir Ağlarını (3D-CNNs) kullanmaktadır. Bu ağlar bu tür dinamikleri modellemede özellikle etkilidir, böylece videoların bağlamsal anlayışını artırır. Önerilen yaklaşım, video altyazılama için yaygın olarak tanınan bir ölçüt olan Microsoft Araştırma Video Açıklama (MSVD) veri seti üzerinde değerlendirildi. Performansı değerlendirmek için BLEU-1’den BLEU-4’e, CIDEr, ROUGE-L, METEOR ve SPICE de dahil olmak üzere standart metrikler kullandık. Sonuçlar, tüm bu metriklerde önemli iyileşmeler göstererek, önceden eğitilmiş 3D-CNN’lerin video altyazılama doğruluğunu artırdığını vurgulamaktadır.Keywords : Video Altyazılama, Video Dil Multimodal Öğrenme, Hareket Nitelikleri
ORIGINAL ARTICLE URL
