- ALKÜ Fen Bilimleri Dergisi
- Cilt: 7 Sayı: 2
- Hibrit Derin Öğrenme Modeli ile Web Sitelerinin Görsel ve Metinsel Verilere Dayalı Sınıflandırılması...
Hibrit Derin Öğrenme Modeli ile Web Sitelerinin Görsel ve Metinsel Verilere Dayalı Sınıflandırılması: DeepCLA-Web
Authors : Harun Şeker, Burakhan Çubukçu
Pages : 66-79
Doi:10.46740/alku.1639372
View : 98 | Download : 63
Publication Date : 2025-08-31
Article Type : Research Paper
Abstract :Bu çalışmada, web sitelerinin sınıflandırılması için metin ve görsel içerikleri işleyen hibrit bir derin öğrenme modeli önerilmektedir. İnternette erişilebilen bilgi hizmetlerinin miktarı her geçen gün artmakta olup, yoğun veri akışı içinde web sitelerinin içeriğe göre doğru sınıflandırılması önem arz etmektedir. Kullanıcılar için bu işlemi yapabilecek bir derin öğrenme modeli oluşturmak amacıyla, Université Toulouse tarafından yayınlanan UT1 Blacklist içerisinden 430 web adresi seçilmiş ve bu adresler alışveriş, haber ve oyun olmak üzere üç kategoriye ayrılmıştır. Önerilen model, web sitelerinin metin içeriklerini işlemek için Uzun Kısa Süreli Bellek (LSTM) kullanırken, görüntü verilerini analiz etmek için Evrişimli Sinir Ağı (CNN) kullanmaktadır. LSTM ve CNN modellerinin çıktısını birleştiren bir Yapay Sinir Ağı (ANN) nihai sınıflandırmayı gerçekleştirmektedir. CNN ile görsel, LSTM ile metin işleyerek ANN ile nihai karar veren, önerilen web sitesi sınıflandırma modelinin (DeepCLA-Web) başarımı, sadece görsel verileri kullanan CNN modeli ve sadece metin verileri kullanan LSTM modeli ile literatürde sık kullanılan metrikler üzerinden kıyaslanmıştır. CNN modeli %59,22, LSTM modeli %75,85 doğruluk oranına ulaşırken, önerilen DeepCLA-Web %80,89 doğruluk oranına ulaşmıştır.Keywords : Web sitesi sınıflandırma, Hibrit derin öğrenme, Uzun Kısa Süreli Bellek, Evrişimli Sinir Ağı
ORIGINAL ARTICLE URL
