Analisis Faktor Dominan Prediksi Dropout Mahasiswa Menggunakan Random Forest, XGBoost dan XAI

Main Article Content

Norma Devi Kurniasari
Trian Basofi Rohman
Ari Widianto
Anis Shobikah
Gaguk Triono

Abstract

Masalah mahasiswa yang putus kuliah (dropout) menjadi tantangan signifikan bagi perguruan tinggi karena memengaruhi reputasi institusi dan efisiensi pemanfaatan sumber daya kampus. Untuk mengatasi fenomena tersebut, diperlukan sistem prediksi dini guna mengidentifikasi mahasiswa yang berisiko sejak awal perkuliahan. Penelitian ini bertujuan membandingkan kinerja dua algoritma machine learning, yaitu Random Forest dan XGBoost, sekaligus memetakan faktor utama penyebab dropout menggunakan pendekatan Explainable AI (XAI) melalui metode SHAP (SHapley Additive exPlanations). Studi ini menggunakan dataset sekunder dengan total 4.424 record data mahasiswa yang mencakup variabel demografi, sosial-ekonomi, makroekonomi, dan akademik. Proses eksperimen dan pemodelan dilakukan menggunakan lingkungan Google Colab. Hasil pengujian menunjukkan bahwa model Random Forest menghasilkan tingkat akurasi optimal yang lebih tinggi yaitu sebesar 77,40%, dibandingkan model XGBoost yang menghasilkan akurasi sebesar 76,05%. Melalui analisis interpretasi SHAP, penelitian ini menemukan bahwa jumlah mata kuliah yang lulus di semester dua (Curricular units 2nd sem (approved)) dan status kelancaran pembayaran biaya kuliah (Tuition fees up to date) merupakan faktor paling dominan yang memengaruhi keputusan prediksi. Hasil penelitian ini memberikan dasar empiris bagi pengelola perguruan tinggi untuk memprioritaskan kebijakan intervensi pada aspek akademik tahun kedua serta stabilitas finansial mahasiswa sebagai strategi menekan angka putus kuliah.

Article Details

Section
Articles

References

, doi: 10.1080/03054985.2024.2316616.

S. Kim, E. Yoo, and S. Kim, “Why do students drop out? university dropout prediction and associated factor analysis using machine learning techniques,” arXiv preprint arXiv:2310.10987, 2023.

M. V Martins, L. Baptista, J. Machado, and V. Realinho, “Multi-class phased prediction of academic performance and dropout in higher education,” Applied Sciences, vol. 13, no. 8, p. 4702, 2023.

M. Vaarma and H. Li, “Predicting student dropouts with machine learning: An empirical study in Finnish higher education,” Technol. Soc., vol. 76, p. 102474, 2024, doi: https://doi.org/10.1016/j.techsoc.2024.102474.

A. Alhardi and S. Alan, Predicting Student Dropout in Higher Education Using Machine Learning Techniques : A Predictive Model Using XGBoost Algorithm. 2024.

M. Nagy and R. Molontay, “Interpretable Dropout Prediction: Towards XAI-Based Personalized Intervention,” Int. J. Artif. Intell. Educ., vol. 34, no. 2, pp. 274–300, 2024, doi: 10.1007/s40593-023-00331-8.

V. Realinho, J. Machado, L. Baptista, and M. V Martins, “Predicting student dropout and academic success,” Data (Basel)., vol. 7, no. 11, p. 146, 2022.

E. Alshdaifat, D. Alshdaifat, A. Alsarhan, F. Hussein, and S. M. F. S. El-Salhi, “The effect of preprocessing techniques, applied to numeric features, on classification algorithms’ performance,” Data (Basel)., vol. 6, no. 2, p. 11, 2021.

A. Fernández, F. Herrera, and N. Chawla, “SMOTE for Learning from Imbalanced Data: Progress and Challenges, Marking the 15-year Anniversary,” Journal of Artificial Intelligence Research, vol. 61, pp. 863–905, Apr. 2018, doi: 10.1613/jair.1.11192.

S. Raschka, J. Patterson, and C. Nolet, “Machine learning in python: Main developments and technology trends in data science, machine learning, and artificial intelligence,” Information, vol. 11, no. 4, p. 193, 2020.

A. B. Arrieta et al., “Explainable Artificial Intelligence (XAI): Concepts, taxonomies, opportunities and challenges toward responsible AI,” Information fusion, vol. 58, pp. 82–115, 2020.

I. Alcauter, L. Martinez-Villaseñor, and H. Ponce, “Explaining factors of student attrition at higher education,” Computación y Sistemas, vol. 27, no. 4, pp. 929–940, 2023.

R. A. M. Al Hashmi, P. D. Zervopoulos, H. M. Elmehdi, and I. Ozturk, “Predicting Dropout in MENA STEM Higher Education Using Explainable AI: A Machine Learning Approach,” Emerging Science Journal, vol. 9, no. Special Issue, pp. 268–286, 2025.