EVALUASI KINERJA PENANGANAN DATA TIDAK SEIMBANG DALAM MEMPREDIKSI LAJU PERTUMBUHAN PENDUDUK DI KALIMANTAN

Authors

  • Khusnia Nurul Khikmah Universitas Palangka Raya
  • A'yunin Sofro Actuarial Science, Faculty of Mathematics and Natural Sciences, Universitas Negeri Surabaya

DOI:

https://doi.org/10.26740/mathunesa.v13n3.p332-341

Abstract

Laju pertumbuhan penduduk merupakan indikator demografi krusial yang memengaruhi berbagai aspek kabupaten dan kota di Kalimantan, sehingga membutuhkan analisis komprehensif dalam memodelkan data. Fakta lapangannya masalah ini salah satunya dipengaruhi oleh fenomena ketidakseimbangan data atau satu kategori laju pertumbuhan penduduk lebih dominan. Oleh karena itu, penelitian ini mengusulkan kajian perbandingan metode penanganan data tidak seimbang dengan model analisis regresi logistik. Empat metode penanganan data tidak seimbang ini adalah tanpa penanganan atau baseline, kedua dengan metode random over sampling (ROS), random undersampling (RUS), dan synthetic minority oversampling technique (SMOTE). Dimana data yang digunakan adalah data sekunder yang diambil dari Badan Pusat Statistik (BPS) lima provinsi di Kalimantan. Hasil analisis laju pertumbuhan penduduk kabupaten dan kota di Kalimantan menunjukkan bahwa model regresi logistic biner dengan tanpa penanganan atau baseline memberikan akurasi hasil prediksi terbaik. Berdasarkan nilai akurasi, balanced accuracy, dan ROC menunjukkan nilai tertinggi dibandingkan metode penanganan data tidak seimbang lainnya, yaitu untuk data latih sebesar 66.7%, 53.1%, dan 76.51%. Sedangkan untuk data uji sebesar 72.7%, 62.5%, dan 82.14%.

Downloads

Download data is not yet available.

Downloads

Published

2025-12-31

Issue

Section

Articles
Abstract views: 10 , PDF Downloads: 8