- Uludağ Üniversitesi Mühendislik Fakültesi Dergisi
- Cilt: 30 Sayı: 3
- DENGESİZ VERİ SETLERİ İÇİN İKİ AŞAMALI DENGELEME STRATEJİSİ: ADASYN İLE ÖRNEKLEM ARTIRMA, SVM TABANL...
DENGESİZ VERİ SETLERİ İÇİN İKİ AŞAMALI DENGELEME STRATEJİSİ: ADASYN İLE ÖRNEKLEM ARTIRMA, SVM TABANLI ÖRNEKLEM AZALTMA
Authors : Duygu Yılmaz Eroğlu
Pages : 825-844
Doi:10.17482/uumfd.1722270
View : 107 | Download : 209
Publication Date : 2025-12-19
Article Type : Research Paper
Abstract :Bu çalışma, makine öğrenmesi alanında sıkça karşılaşılan dengesiz veri sorununu ele alarak, azınlık sınıf örneklerinin çoğunluk sınıf tarafından gölgede bırakıldığı durumlara odaklanmaktadır. Böyle bir dengesizlik, sağlık hizmetlerinden finansal sahtekârlık tespitine ve IoT tabanlı endüstriyel süreçlere kadar pek çok alanda model performansını ciddi biçimde zayıflatır. Sorunu gidermek için, azınlık sınıfını sentetik örneklerle zenginleştiren ADASYN yöntemi, SVM tabanlı uzaklık ölçümüyle belirlenen “en uzak” %10’luk çoğunluk örneklerinin çıkarılmasıyla birleştirilmiştir. Önerilen yaklaşım, SVM, RF, XGBoost ve KNN sınıflandırıcılarıyla on farklı veri seti üzerinde test edilmiştir. Bunlar arasında hem kalite kontrol verilerini hem de IoT sensör ölçümlerini içeren, gerçek üretim ortamından elde edilmiş \\\'Tekstil\\\' veri seti de yer almaktadır. Özellikle iplik kopması gibi nadir ancak üretim açısından kritik olayları barındıran bu veri seti, yoğun dengesizlik nedeniyle standart yöntemlerde düşük başarı sergilemektedir. G-Ortalamalar metriğinde önemli iyileşmeler sunan yöntem, azınlık sınıfın daha başarılı tespitine katkıda bulunmuş ve on veri setinden beşinde en yüksek G-Ortalamalar değerini elde etmiştir.Keywords : Sınıflandırma, Dengesiz Veri, Örneklem Artırma, Örneklem Azaltma, Tekstil
ORIGINAL ARTICLE URL
