- Journal of Science, Technology and Engineering Research
- Volume:5 Issue:2
- Bulanık K-En Yakın Komşuluk Algoritmasında Lempel-Ziv Mesafe Ölçütünün Etkisi: Büyüme Faktörlerinin ...
Bulanık K-En Yakın Komşuluk Algoritmasında Lempel-Ziv Mesafe Ölçütünün Etkisi: Büyüme Faktörlerinin Sınıflandırılması Örneği
Authors : Berk Tolga Çifci, Ramazan Kabadayı, Çağın Kandemir Çavaş
Pages : 148-162
Doi:10.53525/jster.1573661
View : 83 | Download : 57
Publication Date : 2024-12-21
Article Type : Research Paper
Abstract :Hücresel olaylar, proteinlerin eylemleri sonucunda gerçekleşir. Amino asitlerin farklı dizilimleri farklı protein yapılarının oluşmasına neden olur. Yapılarına göre hücresel olaylardaki aktiviteleri de değişiklik gösterir. Bu nedenle protein dizilerinin yapısal veya işlevsel olarak sınıflandırılması hücresel olaylardaki rolleri hakkında bilgi edinmek için oldukça değerlidir. Büyüme faktörleri; hücreler üzerinde çoğalma, farklılaşma, onarım ve bakım gibi birçok süreçte yer alan proteinlerdir. Büyüme faktörlerinin in vivo çalışmaları kısa yarı ömre, zayıf bir dayanıklılığa yol açar. Biyoenformatik alanı temelinde literatürde NGF ve BDNF’nin sınıflandırılmasıyla ilgili herhangi bir çalışma bulunmamaktadır Büyüme faktörlerinin biyoenformatik alanında incelenmesi düşük maliyetle, daha hızlı sonuçlara ulaşılmasını sağlayabilir. Nörotrofinler; sinir hücrelerinin büyümesi, çoğalması, farklılaşması ve fonksiyonları üzerinde etkili olan büyüme faktörü ailelerinden biridir. Çalışmalar, her ne kadar nörotrofin ailesinin üyeleri olan NGF ve BDNF’ye dair bilgiler sunsa da hücresel ve moleküler işlevlerinin hala iyi anlaşılmadığını da göstermektedir. Biyoenformatik alanında yaygın olarak kullanılan k-En Yakın Komşuluk (KNN) algoritmasının performansı önemli ölçüde kullanılan mesafeye bağlıdır. Bulanık KNN (FKNN) algoritması için de mesafe ölçümleri, bulanıklık derecesini hesaplamak için önemlidir. Çalışmamızda, ortak bir atadan gelen ve çok benzer yüksek dereceli protein yapısına sahip olan NGF ve BDNF’nin, ayrıca NT-3’ün bulanık sınıflandırılması yapılmaktadır. Ayrıca çalışmada, FKNN algoritmasında test verisi ile eğitim verileri arasındaki mesafeyi ölçmek için protein sekanslarının Lempel-Ziv karmaşıklık değerlerine dayalı mesafe ölçümünün kullanılması önerilmektedir. Uniprot veri tabanından alınan verilerle birlikte FKNN algoritmasında Lempel-Ziv uzaklığı kullanıldığında K komşu sayısının 12 olması karşılığında, sınıflandırma performansı %83 olarak elde edilmiştir. Öklid Uzaklığı kullanıldığında elde edilen en yüksek sınıflandırma performansı ise %75’tir. Maksimum doğruluk oranını elde ettiğimiz noktada Öklid uzaklığını kullandığımızda algoritmamızın çalışma süresi 0.0054 ms iken Lempel-Ziv uzaklığı kullandığımızda 0.0038 ms’dir. Literatürde NGF ve BDNF’nin sınıflandırılmasıyla ilgili herhangi bir çalışma bulunmaması sebebiyle, elde edilen bulgular, makine öğrenmesi tekniklerinin nörotrofinlerin sınıflandırılmasında ilk kez uygulanması açısından bir yenilik sunmaktadır.Keywords : Bulanık k-en yakın komşu algoritması, büyüme faktörü, Lempel-Ziv karmaşıklığı, nörotrofinler, protein sekansı.