- Veri Bilimi
- Volume:4 Issue:1
- Boyut Azaltmanın Bulanık C-Ortalama Kümeleme Teknikleri Üzerindeki Etkisi
Boyut Azaltmanın Bulanık C-Ortalama Kümeleme Teknikleri Üzerindeki Etkisi
Authors : Nuran PEKER, Cemalettin KUBAT
Pages : 1-7
View : 17 | Download : 14
Publication Date : 2021-01-15
Article Type : Research Paper
Abstract :Bulanık c-ortalama kümeleme, literatürde farklı alanlarda kullanılan yaygın kümeleme algoritmalarından biridir. Boyut küçültme, büyük veri kümelerini, en az bilgi kaybıyla eşdeğeri olan daha küçük boyutlu veri kümelerine dönüştüren bir tekniktir. Bu makalede, boyut azalmasının farklı bulanık kümeleme teknikleri üzerindeki etkisi incelenmektedir. Bu amaçla farklı dört bulanık kümeleme algoritması kullanıldı: Bulanık C-Ortalamalar insert ignore into journalissuearticles values(BCO);, Tip-2 Bulanık C-Ortalamalar insert ignore into journalissuearticles values(BCO2);, Olasılıksal Bulanık C-Ortalamalar insert ignore into journalissuearticles values(OBCO); ve Denetimsiz Olasılıksal Bulanık C-Ortalamalar insert ignore into journalissuearticles values(DOBC);. Boyut küçültme için verilerdeki varyansı minimum %80 açıklayan bir dizi bileşen seçildi. Boyutsallığın azaltılması için Kesik Tekil Değer Ayrıştırma insert ignore into journalissuearticles values(KTDA); tekniği kullanıldı. Çalışmada, ilk olarak, orijinal gerçek dünya veri kümeleri, bahsedilen dört yöntemle kümelendi. Daha sonra, bu veri kümelerinin boyutu küçültülmüş hali de yine bu dört yöntemle kümelendi. Kümeleme performansı için dört dahili kümeleme değerlendirme metriği kullanıldı. Bunlar Silhouette İndeksi insert ignore into journalissuearticles values(SI);, Bölme Katsayısı insert ignore into journalissuearticles values(BK);, Bölme Entropisi insert ignore into journalissuearticles values(BE); ve Kök Ortalama Kare Hatası insert ignore into journalissuearticles values(KOKH);. Yöntemlerin, orijinal ve boyutu azaltılmış veri kümeleri için kümeleme performansı, karşılaştırmalı olarak sunulmaktadır. Sonuçlara göre, indirgenmiş veriler üzerinde, yöntemlerin performansı orijinal verilerden daha başarılıdır. Boyut azaltımının kümeleme başarısına katkısı en çok BCO için, en az BCO2 için elde edilmektedir.Keywords : Kümeleme, Bulanık C ortalamalar, KTDA, Boyut azaltma