Sertdemir Y. (Yürütücü), Binokay H.
Yükseköğretim Kurumları Destekli Proje, 2017 - 2018
Sağlık bilimlerinde
sınıflama amaçlı yapılan çalışmalar, daha çok belirli bir hastalığın tanısının
konulmasında etkili olan risk faktörlerinin, istatistiksel olarak modellenerek
belirlenmesi şeklinde yapılmaktadır. Bu modeller
1. Tanımlayıcı Model ve
2. Tahmin Edici olarak 2’ye
ayrılmaktadır.
Tanımlayıcı modeller
bağımlı ve bağımsız değişkenlerin bilindiği veri setlerinde kullanılmaktadır.
Tahmin edici modeller bağımlı ve bağımsız değişkenlerin bilindiği veri setleri
kullanılarak oluşturulmuştur ama asıl amaç, bağımsız değişkenlerin bilinmediği
yeni veri setlerinin olması durumunda bağımlı değişkeni tahmin etmektir.
Sınıflama amaçlı kullanılan yöntemler arasında en yaygın olanlar; Lojistik
regresyon, karar ağaçları, destek vektör makinaları, Naive Bayes ve topluluk
yöntemleridir. Literatürdeki önceki çalışmalarda iki veya üç yöntem
karşılaştırılmıştır. Bu yöntemlerin üstünlüğü, ikili bağımlı değişken
olması durumunda araştırma gerektirmektedir.