Classifying breast cancer by using decision tree algorithms


AL-SALIHY N. K. , İBRİKÇİ T.

6th International Conference on Software and Computer Applications, ICSCA 2017, Bangkok, Tayland, 26 - 28 Şubat 2017, ss.144-148 identifier

  • Cilt numarası:
  • Doi Numarası: 10.1145/3056662.3056716
  • Basıldığı Şehir: Bangkok
  • Basıldığı Ülke: Tayland
  • Sayfa Sayısı: ss.144-148

Özet

Günümüzde, büyük veri setinden bilgi edinmek için veri setleri her geçen gün büyümektedir. Veri setinden yararlı bilginin çıkarılması işlemi, özellikle meme kanseri gibi tıbbi bakım alanlarında tanısal sonuçları elde etmek için kullanılan en önemli tekniklerden biri olan veri madenciliği olarak adlandırılır. Meme kanseri, tüm dünyadaki diğer bütün tümörlerle eşleştirilirse, kadınlar arasındaki yaygın kanserlerden biridir. Sınıflandırma, tüm alanlardaki gerçek yaşam uygulamalarında en önemli ve gerekli görevlerde yaygın olarak kullanılmaktadır. Bu teknik, bir insan analistinin fark etmediği çok benzerlik / farklılıkları saptama ve dolayısıyla daha doğru / faydalı kategoriler yaratma ve tanıtma becerisine sahiptir. Bu çalışma, meme kanseri veri setini sınıflandırma karar ağacı algoritmaları ile karşılaştırma ve analiz etmeyi sunmaktadır. Karar ağacı algoritmaları, J48, İşlev Ağacı, Rasgele Orman Ağacı, AD Değiştirme Kararı Ağacı, Karar Vuruşu ve En İyisi olan bu algoritmalara uygulanır. Bu karar ağacı algoritmalarının, bilgeli analiz için Waikato Çevre (WEKA) kullanılarak geliştirilmiş ve bir dizi makine öğrenme algoritması içeren, hesaplamaya göre verimli bir sınıflandırıcı. Bu kitleler sınıflandırma yöntemleri ya da algoritmalar arasındaki farklılıkları test etmek ve kanıtlamak için 569'u benign 357'si benign, 212'si malign olan 32 olgudan oluşmaktadır. Bu sonuçlar, modeli eğitmeyen belirli bir tıbbi veri seti örneklemesinin saklanmasını içerir. Karar ağacı sınıflandırması, daha düşük hata ortalaması ve doğru sınıflandırılmış vakaların daha yüksek hassasiyeti ile meme tümörü tahminini oluşturur (% 97.7). Karar verme algoritması  modeli için tahmin edilen 88.0% doğruluk  ile doğru sınıflandırılmış örneklerinde en düşük oranıdır.

Nowadays, datasets are growing daily to obtain knowledge from a big dataset. Extraction operation of useful information from the dataset is called data mining that is one of the major techniques to get the diagnostic results especially in medical care fields as breast cancer. Breast cancer is one of the widespread cancers among women if matched with all other tumors all over the world. Classification is widely used in most important and necessary tasks in the real life applications in all fields. This technique has an ability to detect very similarities/differences that a human analyst may be not noticed and therefore create and introduction more accurate/useful categories. This study presents comparison and analyses breast cancer dataset by using classification decision tree algorithms. Decision tree algorithms are applied to these algorithms which are J48, Function Tree, Random Forest Tree, AD Alternating Decision Tree, Decision Stump and Best First. A computationally efficient classifiers of these decision tree algorithms by employing Waikato Environment for Knowledge Analysis (WEKA) that is development program which includes a set of machine learning algorithms. These masses included 569 with 357 benign and 212 malignant cases with 32 attributes to test and proof the differences among the classification methods or algorithms. These results found by the manner which involves reserving a particular sample of a medical dataset on which do not train the model. The decision tree classification forms forecast breast tumor with lower error average and higher precision of correctly classified cases 97.7%. The predicted accuracy correctly classified instances for decision stump algorithm 88.0% model is the lowest of all.