- Düzce Üniversitesi Bilim ve Teknoloji Dergisi
- Volume:9 Issue:2
- Initial Seed Value Effectiveness on Performances of Data Mining Algorithms
Initial Seed Value Effectiveness on Performances of Data Mining Algorithms
Authors : Tunahan TİMUÇİN, İrem DUZDAR ARGUN
Pages : 555-567
Doi:10.29130/dubited.813101
View : 34 | Download : 11
Publication Date : 2021-04-25
Article Type : Research Paper
Abstract :2000'li yıllardan sonra, Bilgisayar kapasiteleri ve özellikleri artmış ve verilere erişim kolaylaşmıştır. Ancak üretilen ve kaydedilen veriler anlamlı olmalıdır. İşlenmemiş verilerin anlamlı bilgilere dönüştürülmesi, veri madenciliği yardımı ile yapılabilmektedir. Bu çalışmada, veri madenciliği uygulamalarından sınıflandırma yöntemleri incelenmiştir. Öncelikle aynı veri setinin sonuçlarını farklı kılan parametreler 4 farklı veri madenciliği aracında (Weka, Rapid Miner, Knime, Orange) araştırılmış, 3 farklı algoritma ile test edilmiştir (K nearest neighborhood, Naive Bayes, Random Forest). Sınıflandırma modelleri oluşturulurken veri setinin performansını değerlendirmek için veri seti eğitim verileri ve test verileri olarak % 80-% 20, % 70-% 30 ve% 60-40 olarak ayrılmıştır. Accuracy, roc and precision değerleri, sınıflandırma verilerinin performansını test etmek için kullanılmıştır. Sınıflandırma yapılırken algoritma parametrelerinin sonuçlar üzerindeki etkisi gözlemlenmiştir. Bu parametrelerden en önemlisi ilk tohum değeridir. İlk tohum, özellikle verilerin ilk yerleşimini belirleyen ve sonucu doğrudan etkileyen sınıflandırma algoritmalarında kullanılan bir değerdir. Bu açıdan ilk tohum değerinin doğru belirlenmesi çok önemlidir. Bu çalışmada 0 ile 100 arasındaki başlangıç tohum değerleri değerlendirilmiş ve sınıflandırmanın doğruluk değerini yaklaşık %5 değiştirebileceği gösterilmiştir.Keywords : Veri Madenciliği, Sınıflandırma, Kredi Onayı, Tohum Değeri
ORIGINAL ARTICLE URL
