EVALUASI KINERJA PENANGANAN DATA TIDAK SEIMBANG DALAM MEMPREDIKSI LAJU PERTUMBUHAN PENDUDUK DI KALIMANTAN
DOI:
https://doi.org/10.26740/mathunesa.v13n3.p332-341Abstract
Laju pertumbuhan penduduk merupakan indikator demografi krusial yang memengaruhi berbagai aspek kabupaten dan kota di Kalimantan, sehingga membutuhkan analisis komprehensif dalam memodelkan data. Fakta lapangannya masalah ini salah satunya dipengaruhi oleh fenomena ketidakseimbangan data atau satu kategori laju pertumbuhan penduduk lebih dominan. Oleh karena itu, penelitian ini mengusulkan kajian perbandingan metode penanganan data tidak seimbang dengan model analisis regresi logistik. Empat metode penanganan data tidak seimbang ini adalah tanpa penanganan atau baseline, kedua dengan metode random over sampling (ROS), random undersampling (RUS), dan synthetic minority oversampling technique (SMOTE). Dimana data yang digunakan adalah data sekunder yang diambil dari Badan Pusat Statistik (BPS) lima provinsi di Kalimantan. Hasil analisis laju pertumbuhan penduduk kabupaten dan kota di Kalimantan menunjukkan bahwa model regresi logistic biner dengan tanpa penanganan atau baseline memberikan akurasi hasil prediksi terbaik. Berdasarkan nilai akurasi, balanced accuracy, dan ROC menunjukkan nilai tertinggi dibandingkan metode penanganan data tidak seimbang lainnya, yaitu untuk data latih sebesar 66.7%, 53.1%, dan 76.51%. Sedangkan untuk data uji sebesar 72.7%, 62.5%, dan 82.14%.
Downloads
Downloads
Published
Issue
Section
License
Copyright (c) 2025 MATHunesa: Jurnal Ilmiah Matematika

This work is licensed under a Creative Commons Attribution-NonCommercial 4.0 International License.
Abstract views: 10
,
PDF Downloads: 8









