Perbandingan Metode Klasifikasi Random Forest dan XGBoost Serta Implementasi Teknik SMOTE pada Kasus Prediksi Hujan

Tiara Sakinah, Isma'il Muhammad Falih, Ghaitsa Amany Mursianto, Muhammad Irfan, Desta Sandhya Prasvita

Abstract


Cuaca pada hakikat merupakan suatu keadaan udara pada waktu tertentu di wilayah yang berbeda-beda dengan cakupan wilayah yang luas maupun sempit dalam jangka waktu yang relatif singkat. Cuaca juga merupakan suatu kombinasi dari beberapa komponen yaitu tekanan suhu, kecepatan angin dan arah mata angin, jumlah volume air yang terkandung pada awan, tekanan udara, kelembaban udara, dan lain-lain. Cuaca sendiri merupakan gambaran dari suatu fenomena alam yang tidak dapat diprediksi seperti hujan dengan intensitas pada saat musim kemarau, udara panas pada saat musim hujan, badai, dan lain-lain. Oleh sebab itu penelitian ini bertujuan untuk mengklasifikasi prediksi hujan pada hari-hari berikutnya, dengan menggunakan beberapa metode klasifikasi yaitu Random Forest, XGBoost dari metode tersebut akan menentukan kelas mana yang paling optimal. Sistem prediksi cuaca yang telah kami buat mendapatkan tingkat akurasi tertinggi diperoleh klasifikasi Random Forest dengan Resampling yakni sebesar 95.59%, namun pada klasifikasi tanpa resampling akurasi tertinggi diperoleh XGBoost yakni sebesar 94.34%.


Keywords


Klasifikasi; Random Forest; XGBoost; Cuaca

References


Setiawan, P., Hidayat, A., & Sugiharto, T. (2010). ESTIMASI AIR MAMPU CURAH MENGGUNAKAN DATA MODIS SEBAGAI INFORMASI CUACA SPASIAL DI PULAU JAWA. Jurnal Penginderaan Jauh dan Pengolahan Data Citra Digital, 3(1).

Dhawangkhara, M., & Riksakomara, E. (2017). Prediksi Intensitas Hujan Kota Surabaya dengan Matlab menggunakan Teknik Random Forest dan CART (Studi Kasus Kota Surabaya). Jurnal Teknik ITS, 6(1), 88–93.

Siregar, A. M., dkk. (2020). PERBANDINGAN ALGORITME KLASIFIKASI UNTUK PREDIKSI CUACA. Accounting Information System, 15-24.

Karo, I. M. K. (2020). Implementasi Metode XGBoost dan Feature Importance untuk Klasifikasi pada Kebakaran Hutan dan Lahan. Journal of Software Engineering, Information and Communication Technology, 1, 10-16.

Sutoyo, E., & Fadlurrahman, M. A. (2020). Penerapan SMOTE untuk Mengatasi Imbalance Class dalam Klasifikasi Television Advertisement Performance Rating Menggunakan Artificial Neural Network. JEPIN (Jurnal Edukasi dan Penelitian Informatika), 6(3), 379-385.

Affendi, F. M., dkk. (2013). Penerapan Synthetic Minority Oversampling Technique (Smote) Terhadap Data Tidak Seimbang Pada Pembuatan Model Komposisi Jamu. Xplore, Vol. 1(1):e9(1-6).

Renata, E., & Ayub, M. (2020). Penerapan Metode Random Forest untuk Analisis Risiko pada dataset Peer to peer lending. Jurnal Teknik Informatika dan Sistem Informasi, 462-474.

Syukron, M., dkk. (2020). Perbandingan Metode Smote Random Forest Dan Smote Xgboost Untuk Klasifikasi Tingkat Penyakit Hepatitis C. Jurnal Gaussian, 227-236.

Rachmi, A.N., (2020). Implementasi Metode Random Forest Dan Xgboost Pada Klasifikasi Customer Churn. Laporan Tugas Akhir. Fakultas Matematika Dan Ilmu Pengetahuan Alam Universitas Islam Indonesia Yogyakarta.

Fauzi, A., dkk. (2020). Deteksi Penyakit Kanker Payudara dengan Seleksi Fitur berbasis Principal Component Analysis dan Random Forest. Jurnal Infortech, 96-101.


Refbacks

  • There are currently no refbacks.


Copyright (c) 2022 Senamika

Creative Commons License
This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License.