25. Ulusal ve 8. Uluslararası Biyoistatistik Kongresi, Sakarya, Türkiye, 18 - 20 Kasım 2024, ss.32
Sağlık alanındaki sınıflama işlemi sıklıkla tanı konması ve prognozun belirlenmesi gibi amaçlarla yapılmaktadır. Bu amaçlarla yapılan bir çalışmada bir tanı testinin başarısı incelenmek istendiğinde duyarlılık ve seçicilik gibi prevalanstan etkilenmeyen doğruluk ölçütleri kullanılır. Tanı testinin sayısal olması halinde bu değerler kullanılarak çizilen ROC eğrisi altında kalan alan değeri ile sınıflama başarısı ölçülür. Özellikle makine öğrenmesi algoritmalarının kullanım sıklığı artması ile bu algoritmaların önerildiği alanlarda sıklıkla kullanılan Precision (pozitifi prediktif değer), Recall (duyarlılık), F ölçütü gibi ölçütlerin sağlık alanında da popülerliği artmıştır. Yine bu ölçütler kullanılarak çizilen PR eğrileri ile ikili sınıflama yapan ölçümlerin sınıflama başarısını ölçülebilmektedir. Ancak bilindiği üzere pozitif ve negatif prediktif değerler prevalanstan etkilenmektedir. Bu durumda da prevalansın dikkate alınmadığı bir çalışmadan hareketle hesaplanan doğruluk ölçütleri ile yapılacak sınıflama başarısı değerlendirmesinde yanlılık görülebilecektir. Bu çalışmada bu yanlılığı ortadan kaldırmak amacıyla standart PR eğrileri yerine ilk defa sunulan Prevalans Düzeltmeli PR Eğrilerinin kullanılması önerilmektedir. Önerilen yeni eğri ile mevcut eğri arasındaki üstünlükler ve farklılıklar sağlık alanında karşılaşılabilecek durumlar dikkate alınarak oluşturulmuş simülasyon senaryoları kullanılarak ortaya konmuştur. Yapılan değerlendirmeler sonucunda, PR eğrileri yerine prevalans düzeltmeli PR eğrilerinin kullanımı ile sınıflama başarısının daha yansız elde edildiği görülmüştür.