IAD Index of Academic Documents
  • Home Page
  • About
    • About Izmir Academy Association
    • About IAD Index
    • IAD Team
    • IAD Logos and Links
    • Policies
    • Contact
  • Submit A Journal
  • Submit A Conference
  • Submit Paper/Book
    • Submit a Preprint
    • Submit a Book
  • Contact
  • Uluslararası Bilişim Kongresi
  • IIC 2022 FULL PAPERS
  • TÜRKÇE MAKALELERDEN TEXTRANK VE TFIDF İLE ANAHTAR KELİME ÇIKARIMI

TÜRKÇE MAKALELERDEN TEXTRANK VE TFIDF İLE ANAHTAR KELİME ÇIKARIMI

Authors : Adem Mehmet YILDIZ
Pages : 482-489
View : 86 | Download : 113
Publication Date : 2022-04-22
Abstract :Anahtar kelimeler belgelerin kısa bir özetini veren terimlerdir. Ana fikre ait bir öznitelik bilgisi sunan anahtar kelimeler farklı yöntemlerle çıkarılmaktadır. Danışmansız anahtar kelime çıkarımlarından graf tabanlı ve istatistik tabanlı yöntemler farklı sonuçlar vermektedir. Bu çalışmada graf tabanlı yaklaşımlardan TextRank yöntemi ve istatistik tabanlı TFIDF yöntemi ile Türkçe makalelerden anahtar kelimeler çıkarılmıştır. 8 farklı alandan makaleler web örümcekleri yardımı ile toplanmış ve metin ön işleme aşamalarından geçirilmiştir. Araştırmanın veri setini sosyal, fen, mühendislik, sağlık, eğitim, din, iktisat ve işletme alanlarından 8158 makale oluşturmaktadır. Web örümcekleri veri setini oluştururken makalelerin orijinal anahtar kelimelerini karşılaştırılmalarda kullanmak için almıştır. TextRank ve TFIDF yöntemleri makalelerin tüm metinlerini kullanarak anahtar kelimeler türetmiş ve türetilen anahtar kelimeler orijial anahtar kelimeler ile karşılaştırılmıştır. Ön işleme aşamalarından geçirilmiş derlemler literatürdeki yöntemler baz alınarak tek kelimelik, üç kelimelik, beş kelimelik ve yedi kelimelik anahtar kelimeler türetilmiştir. Türetilen kelimelerin birbirleriyle ne kadar tutarlılık gösterdiğini ölçebilmek için ise çakışma skorlarına bakarak çıkarımlarda bulunulmuştur. Türetilen kelimeler ile orijinal derlemdeki kelimelerin çakışma frekansları hesaplanarak performans metrikleri hesaplanabilmiştir. İki farklı yöntemin performans metrikleri tablolar halinde sunulmuştur. Yöntemlerin orijinal anahtar kelimelerle doğruluklarının karşılaştırmasını yapmak ve performans metriklerini ölçmek için anma, geri çağırma ve f1 skorları hesaplanmıştır. Elde edilen araştırma sonuçları TFIDF yönteminin TextRank yönteminden daha yüksek doğrulukta anahtar kelime çıkardığını göstermiştir.
Keywords : Anahtar Kelime Çıkarımı, TextRank, TFIDF

ORIGINAL PAPER URL

* There may have been changes in the journal, article,conference, book, preprint etc. informations. Therefore, it would be appropriate to follow the information on the official page of the source. The information here is shared for informational purposes. IAD is not responsible for incorrect or missing information.


Index of Academic Documents
İzmir Academy Association
CopyRight © 2023-2026