Lojistik Regresyon ve Ağaç Tabanlı Sınıflama Modellerinin Performanslarının Üretilmiş ve Gerçek Veri Setleri ile Değerlendirilmesi


Sertdemir Y. (Yürütücü), Binokay H.

Yükseköğretim Kurumları Destekli Proje, 2017 - 2018

  • Proje Türü: Yükseköğretim Kurumları Destekli Proje
  • Başlama Tarihi: Ekim 2017
  • Bitiş Tarihi: Ağustos 2018

Proje Özeti

Sağlık bilimlerinde sınıflama amaçlı yapılan çalışmalar, daha çok belirli bir hastalığın tanısının konulmasında etkili olan risk faktörlerinin, istatistiksel olarak modellenerek belirlenmesi şeklinde yapılmaktadır. Bu modeller

1. Tanımlayıcı Model ve

2. Tahmin Edici olarak 2’ye ayrılmaktadır.

Tanımlayıcı modeller bağımlı ve bağımsız değişkenlerin bilindiği veri setlerinde kullanılmaktadır. Tahmin edici modeller bağımlı ve bağımsız değişkenlerin bilindiği veri setleri kullanılarak oluşturulmuştur ama asıl amaç, bağımsız değişkenlerin bilinmediği yeni veri setlerinin olması durumunda bağımlı değişkeni tahmin etmektir. Sınıflama amaçlı kullanılan yöntemler arasında en yaygın olanlar; Lojistik regresyon, karar ağaçları, destek vektör makinaları, Naive Bayes ve topluluk yöntemleridir. Literatürdeki önceki çalışmalarda iki veya üç yöntem karşılaştırılmıştır. Bu yöntemlerin üstünlüğü, ikili bağımlı değişken olması durumunda araştırma gerektirmektedir.