- Türkiye Bilişim Vakfı Bilgisayar Bilimleri ve Mühendisliği Dergisi
- Volume:3 Issue:1 - Volume:3 Issue:1
- Türkçe Dokümanlar İçin N-gram Tabanlı Yeni Bir Sınıflandırma(Ng-ind): Yazar, Tür ve Cinsiyet...
Türkçe Dokümanlar İçin N-gram Tabanlı Yeni Bir Sınıflandırma(Ng-ind): Yazar, Tür ve Cinsiyet
Authors : Sibel DOĞAN, Banu DİRİ
Pages : 11-19
View : 41 | Download : 14
Publication Date : 2016-06-24
Article Type : Research Paper
Abstract :Bu çalışmada Türkçe bir dokümanın türü, yazarı ve doküman yazarının cinsiyeti Türkçe’nin n-gram modeli kullanılarak belirlenmeye çalışılmıştır. N-gram modelinde 2-, 3-, 4-gram’lar kullanılmış ve üç farklı veri seti üzerinde toplam altı adet özellik vektörü oluşturulmuştur. Naive Bayes insert ignore into journalissuearticles values(NB);, Destek Vektör Makinesi insert ignore into journalissuearticles values(DVM);, Rastgele Orman insert ignore into journalissuearticles values(RO);, K-En Yakın Komşuluk insert ignore into journalissuearticles values(K-EYK); gibi sınıflandırıcıların yanında geliştirdiğimiz Ng-ind yöntemi kullanılarak testler yapılmış ve başarı performansları birbirleri ile karşılaştırılmıştır. Ng-ind yöntemi cinsiyet ve tür belirlemede diğer yöntemlere göre daha iyi sonuç vermiştir. Bununla birlikte Ng-ind, tür belirlemede birleştirilmiş sınıflandırıcılardan da daha iyi performans göstermiştir.Keywords :
ORIGINAL ARTICLE URL
