PENINGKATAN AKURASI PREDIKSI PEMILIHAN PROGRAM STUDI CALON MAHASISWA BARU MELALUI OPTIMASI ALGORITMA DECISION TREE DENGAN TEKNIK PRUNING DAN ENSEMBLE

Harminto Mulyo, Nadia Annisa Maori

Abstract


ENHACING PREDICTION ACCURACY OF NEW STUDENT PROGRAM SELECTION THROUGH DECISION TREE ALGORITHM OPTIMIZATION WITH PRUNING TECHNIQUE AND ENSEMBLE

In the current era of reform and globalization, the complexity of choosing the right study program is increasing with the many choices available. One of the challenges faced by the Nahdlatul Ulama Islamic University (UNISNU) Jepara is the increase in students with non-active status which can have an impact on the reputation of the university. One of the factors that can influence is the inaccuracy of students in choosing a study program, so that they are reluctant to continue because they are not enthusiastic about continuing their studies. The solution provided is to predict the selection of the right study program for prospective new students by utilizing the Decision Tree algorithm which is optimized with pruning and ensemble techniques with Random Forest which can help overcome overfitting in the decision tree. The data used is UNISNU student data from 2013 to 2023 with a total of 15,289 records and 52 attributes. The results showed that the Decision Tree and Random Forest models provided the highest accuracy, namely 0.88 with a max_depth value of 20 and succeeded in overcoming the problem of overfitting the decision tree. This model can then be used as a recommendation in predicting the selection of study programs for prospective new students at UNISNU Jepara.



Dalam era reformasi dan globalisasi saat ini, kompleksitas dalam memilih program studi yang sesuai semakin meningkat dengan banyaknya pilihan yang tersedia. Salah satu tantangan yang dihadapi oleh Universitas Islam Nahdlatul Ulama (UNISNU) Jepara adalah meningkatnya mahasiswa dengan status non-aktif yang dapat berdampak pada reputasi universitas. Salah satu faktor yang dapat mempengaruhi adalah ketidaktepatan mahasiswa dalam memilih program studi, sehingga enggan untuk meneruskan karena tidak bersemangat dalam melanjutkan perkuliahan. Solusi yang diberikan adalah dengan melakukan prediksi pemilihan program studi bagi yang tepat bagi calon mahasiswa baru dengan memanfaatkan algoritma Decision Tree yang dioptimalkan dengan teknik pruning dan ensemble dengan Random Forest yang dapat membantu mengatasi overfitting pada decision tree. Data yang digunakan adalah data mahasiswa UNISNU dari tahun 2013 sampai dengan 2023 dengan jumlah 15.289 record dan 52 atribut. Hasil penelitian menunjukkan model Decision Tree dan Random Forest memberikan akurasi tertinggi, yaitu 0.88 dengan nilai max_depth sebesar 20 dan berhasil mengatasi masalah overfitting pada decision tree. Model ini selanjutnya dapat menjadi rekomendasi dalam prediksi pemilihan program studi bagi calon mahasiswa baru di UNISNU Jepara.


Keywords


Prediksi; Prediction; Decision Tree; Pruning; UNISNU;

Full Text:

PDF

References


Nurazizah, S. J. A. Putri, A. Muftirah, dan Irmayanti, “Daya Tarik Mahasiswa dalam Memilih Program Studi di Perguruan Tinggi,” 2023.

N. Rista Yonanda, M. Iswari, dan D. Daharnis, “PENTINGNYA MINAT DAN BAKAT DALAM MEMILIH PROGRAM STUDI YANG PROSPEKTIF DI INDUSTRI MELALUI BIMBINGAN DAN KONSELING KARIR DI SEKOLAH MENENGAH KEJURUAN,” 2022.

Sulvinajayanti, iskandar, dan N. Hayat, “Analisis Kepuasan Pengguna Lulusan Terhadap Alumni Komunikasi dan Penyiaran Islam IAIN Parepare,” 2019.

Y. A. Saputro, K. Umam, dan D. M. Kakantini, “ANALISA KEBUTUHAN DAN KAPASITAS RUANG PARKIR PADA ZONA A UNIVERSITAS ISLAM NAHDLATUL ULAMA JEPARA,” Rang Teknik Journal, vol. 4, no. 2, hlm. 206–210, Jun 2021, doi: 10.31869/rtj.v4i2.1916.

“Laporan Tracer Study Tahun 2021,” 2021.

D. Made Aryadi Mertha Sanjaya, A. A. Istri Ita Paramitha, dan N. Widya Utami, “Penerapan Data Mining untuk Prediksi Mahasiswa Berpotensi Non-Aktif Menggunakan Algoritma C4.5: Studi Kasus STMIK Primakara,” Jurnal Ilmiah Ilmu Terapan Universitas Jambi, vol. 6, no. 1, hlm. 84–97, 2022.

Dahani dan S. M. Abdullah, “PENGAMBILAN KEPUTUSAN JURUSAN DITINJAU DARI DUKUNGAN SOSIAL ORANGTUA PADA MAHASISWA,” Seminar Nasional, hlm. 386–391, 2020.

D. P. S. Sinaga, R. Marwati, dan B. A. P. Martadiputra, “Aplikasi Web Prediksi Dampak Gempa di Indonesia Menggunakan Metode Decision Tree dengan Algoritma C4.5,” JMT : Jurnal Matematika dan Terapan, vol. 5, no. 2, hlm. 97–108, Agu 2023, doi: 10.21009/jmt.5.2.5.

Y. A. Setiawan, Y. Divayana, dan W. Widiadha, “PERBANDINGAN ALGORITMA SUPERVISED MACHINE LEARNING UNTUK SISTEM PENGHINDARAN HALANGAN PADA ROBOT ASSISTANT UDAYANA 02 (RATNA02),” 2022.

D. M. Al Hafiz, K. Amaly, J. Jonathan, dan M. Teranggono Rachmatullah, “Sistem Prediksi Penyakit Jantung Menggunakan Metode Naive Bayes,” Jurnal Rekayasa Elektro Sriwijaya, vol. 2, no. 2, hlm. 151–157, [Daring]. Tersedia pada: http://archive.ics.uci.edu/ml/datasets/Heart+Disease

R. Supriyadi, W. Gata, N. Maulidah, dan A. Fauzi, “Penerapan Algoritma Random Forest Untuk Menentukan Kualitas Anggur Merah,” vol. 13, no. 2, hlm. 67–75, 2020, [Daring]. Tersedia pada: http://journal.stekom.ac.id/index.php/E-Bisnis■page67

H. Rianto, “Resampling Logistic Regression untuk Penanganan Ketidakseimbangan Class pada Prediksi Cacat Software,” Journal of Software Engineering, vol. 1, no. 1, hlm. 46–53, 2015, [Daring]. Tersedia pada: http://journal.ilmukomputer.org

M. S. Faradisa, Muliadi, dan D. T. Nugrahadi, “Implementasi IQR-SMOTE Untuk Mengatasi Ketidakseimbangan Kelas Pada Klasifikasi Diabetes menggunakan K-Nearest Neighbors,” Jurnal Ilmu Kpmputer, vol. 15, no. 1, hlm. 48–60.

I. H. Witten dan E. Frank, “Data Mining: Practical Machine Learning Tools and Techniques, Second Edition.”

J. H. Friedman, “Stochastic gradient boosting,” Comput Stat Data Anal, vol. 38, no. 4, hlm. 367–378, 2002, doi: https://doi.org/10.1016/S0167-9473(01)00065-2.

W. Yustanti, N. Iriawan, dan I. Irhamah, “Categorical encoder based performance comparison in pre-processing imbalanced multiclass classification,” Indonesian Journal of Electrical Engineering and Computer Science, vol. 31, no. 3, hlm. 1705, Sep 2023, doi: 10.11591/ijeecs.v31.i3.pp1705-1715.

Y. Manzali dan P. M. E. Far, “A new decision tree pre-pruning method based on nodes probabilities,” dalam 2022 International Conference on Intelligent Systems and Computer Vision (ISCV), 2022, hlm. 1–5. doi: 10.1109/ISCV54655.2022.9806124.

T. Tundo dan S. ’Uyun, “Konsep Decision Tree Reptree untuk Melakukan Optimasi Rule dalam Fuzzy Inference System Tsukamoto,” Jurnal Teknologi Informasi dan Ilmu Komputer, vol. 9, no. 3, hlm. 513–522, Jun 2022, doi: 10.25126/jtiik.2022922601.

Faisal, H. Dhika, dan H. Veris, “PENERAPAN ALGORITMA DECISION TREE DALAM PENJUALAN HANDPHONE,” 2021.

D. D. S. Fatimah dan E. Rahmawati, “Tampilan Penggunaan Metode Decision Tree dalam Rancang Bangun Sistem Prediksi untuk Kelulusan Mahasiswa,” Jurnal Algoritma, vol. 18, no. 2, hlm. 553–561, 2021.

W. A. Firmansyach, U. Hayati, dan Y. A. Wijaya, “View of ANALISA TERJADINYA OVERFITTING DAN UNDERFITTING PADA ALGORITMA NAIVE BAYES DAN DECISION TREE DENGAN TEKNIK CROSS VALIDATION,” JATI (Jurnal Mahasiswa Teknik Informatika), vol. 7, no. 1, hlm. 262–269, Feb 2023.

F. M. J. M. Shamrat, S. Chakraborty, M. M. Billah, P. Das, J. N. Muna, dan R. Ranjan, “A comprehensive study on pre-pruning and post-pruning methods of decision tree classification algorithm,” dalam 2021 5th International Conference on Trends in Electronics and Informatics (ICOEI), 2021, hlm. 1339–1345. doi: 10.1109/ICOEI51242.2021.9452898.

W. Zhang dan Y. Li, “A Post-Pruning Decision Tree Algorithm Based on Bayesian,” dalam 2013 International Conference on Computational and Information Sciences, 2013, hlm. 988–991. doi: 10.1109/ICCIS.2013.265.

A. Nugroho, “Analisa Splitting Criteria Pada Decision Tree dan Random Forest untuk Klasifikasi Evaluasi Kendaraan,” JSITIK: Jurnal Sistem Informasi dan Teknologi Informasi Komputer, vol. 1, no. 1, hlm. 41–49, Des 2022, doi: 10.53624/jsitik.v1i1.154.

L. M. Sotarjua dan D. B. Santoso, “PERBANDINGAN ALGORITMA KNN, DECISION TREE,*DAN RANDOM*FOREST PADA DATA IMBALANCED CLASS UNTUK KLASIFIKASI PROMOSI KARYAWAN,” Jurnal Instek, vol. 7, no. 2, hlm. 192–200, 2022.




DOI: https://doi.org/10.34001/jdpt.v15i1.5585

Article Metrics

Abstract view : 110 times
PDF - 50 times

Creative Commons License
This work is licensed under a Creative Commons Attribution-ShareAlike 4.0 International License.

Disprotek Indexed by:

1 Google Scholar  2 BASe3 Onsesearch 4 Garuda 5 Sinta 6 Dimensions7 Crossref 8 JurnalStories 9 ROAD 10 ICE11 ORCID  

Visitor Statistics
Web
Analytics Made Easy - StatCounter
Flag Counter

Lisensi Creative Commons

DISPROTEK: Journal of Informatics Engineering, Information Systems, Electrical Engineering, Industrial Engineering, Civil Engineering, and Aquaculture is licensed under a Creative Commons Attribution-ShareAlike 4.0 International License.