IAD Index of Academic Documents
  • Home Page
  • About
    • About Izmir Academy Association
    • About IAD Index
    • IAD Team
    • IAD Logos and Links
    • Policies
    • Contact
  • Submit A Journal
  • Submit A Conference
  • Submit Paper/Book
    • Submit a Preprint
    • Submit a Book
  • Contact
  • Bilecik Şeyh Edebali Üniversitesi Fen Bilimleri Dergisi
  • Volume:7 Issue:1
  • Comparison of Serial and Parallel Programming Performance in Outlier Detection with DBSCAN Algorithm

Comparison of Serial and Parallel Programming Performance in Outlier Detection with DBSCAN Algorithm

Authors : Hüseyin YAŞAR, Mehmet ALBAYRAK
Pages : 129-140
Doi:10.35193/bseufbd.649539
View : 15 | Download : 15
Publication Date : 2020-06-28
Article Type : Research Paper
Abstract :Bilgisayarların hayatımıza girmesiyle beraber dijital verilerin boyutları giderek artmaktadır. Dijital dünyada üretilen bu verilerin içinde benzerlerinden farklı davranış sergileyen standart dışı değerler (aykırı değerler) bulunabilmektedir. Bu değerlerin özellikle büyük veri setleri içinde tespiti; güvenlik, sigortacılık, finans, tıp ve genetik gibi alanlarda büyük önem taşımaktadır. Büyük veri setlerinde standart dışı değerlerin tespitinde veri madenciliği yöntemlerinden kümeleme teknikleri sıklıkla kullanılmaktadır. Gürültülü ve aykırı değerlere karşı hassas olan kümeleme algoritmalarından, yoğunluk tabanlı DBSCAN (Density-based spatial clustering of applications with noise) algoritması standart dışı değerlerin tespitinde kullanılan en önemli yöntemlerdendir. Bu çalışmada standart dışı değerlerin tespiti için C# programlama dilinde DBSCAN algoritması kullanılarak bir uygulama geliştirilmiştir. Geliştirilen uygulamada; veri sayıları birbirinden farklı 2 adet veri seti ele alınmış ve analizleri yapılmıştır. Veri setleri analizinin en kısa süreye indirilebilmesi için seri ve paralel programlama teknikleri ayrı ayrı kullanılmıştır. Büyük veri setlerinin analiz süresini kısaltmak amacı ile. Net 4.0 ile gelen TPL (Task Parallel Library) içinde yer alan paralel sınıf üyelerinden yararlanılmıştır. Veri setlerinde yapılan analizlerde DBSCAN algoritmasının standart dışı değerlerin tespiti açısından seçilen diğer algoritmalara göre daha yüksek doğruluk oranında sonuç verdiği ve kullanılabilir olduğu görülmüştür. Hesaplama performansı açısından ele alındığında ise paralel programlamanın veri sayısı arttıkça daha verimli olabileceği sonucuna varılmıştır.
Keywords : Standart dışı veri, Kümeleme, DBSCAN, Paralel programlama

ORIGINAL ARTICLE URL
VIEW PAPER (PDF)

* There may have been changes in the journal, article,conference, book, preprint etc. informations. Therefore, it would be appropriate to follow the information on the official page of the source. The information here is shared for informational purposes. IAD is not responsible for incorrect or missing information.


Index of Academic Documents
İzmir Academy Association
CopyRight © 2023-2025