Analisis Perbandingan Algoritma Klasifikasi untuk Penyakit Jantung

  • Jalis Dwi Muthohhar Universitas Negeri Surabaya
  • Agus Prihanto Universitas Negeri Surabaya

Abstract

Penyakit jantung menjadi penyebab tertinggi kematian didunia setelah stroke. Dengan kemajuan teknologi yang sangat pesat mendorong berbagai penelitian untuk mempermudah dalam mendiagnosa penyakit jantung menggunakan klasifikasi machine learning. Model klasifikasi yang digunakan yaitu Decision Tree, Naive Bayes dan Random Forest Classifier. Model Decision Tree menggunakan pohon keputusan, metode Naïve Bayes menggunakan probabilitas disetiap data, sedangkan model Random Forest Classifier menggunakan sekumpulan pohon keputusan yang disatukan. Data yang digunakan adalah Heart Attack Analysis & Prediction Dataset diambil dari Kaggle. Penelitian ini bertujuan untuk medapatkan model yang terbaik untuk mengklasifikasikan data penyakit jantung dari ketiga model tersebut. Untuk mendapatkan model yang terbaik penelitian ini melakukan cross validation  pada setiap model machine learning. Dari hasil cross validation didapatkan adanya overfiting pada setiap model. Untuk mengatasi overfiting peneliti melakukan fine tuning pada setiap model dengan parameter F1-Score. Berdasarkan rata-rata hasil pengujian model decision tree menggunakan evaluasi random search mendapatkan nilai 0.844 dan grid search 0.84. Kemudian hasil pengujian model naïve bayes tidak ada perbedaan antara evaluasi menggunakan random search maupun grid search yaitu sebesar 0.85. Selanjutnya hasil pengujian model random forest classifier menggunakan evaluasi random search mendapatkan nilai 0.852 dan grid search 0.868. Dengan demikian dapat dilihat dari hasil pengujian bahwa model random forest classifier merupakan model terbaik dalam mengklasifikasi penyakit jantung baik itu menggunakan hyperparamter tuning grid search.

Published
2023-01-25
Section
Articles
Abstract Views: 287
PDF Downloads: 571