Implementasi Algoritma Extra Trees Untuk Klasifikasi Cuaca Provinsi Dki Jakarta Dengan Oversampling SMOTE

Raihan Kemmy Rachmansyah, Ria Astriratma

Abstract


Cuaca yang sulit diprediksi membuat banyak aktivitas warga Provinsi DKI Jakarta terganggu sehingga diperlukan sebuah ilmu teknologi yang diimplementasikan untuk mengklasifikasikan sebuah cuaca. Maka dari itu, penelitian ini menerapkan metode Machine Learning untuk klasifikasi cuaca Provinsi DKI Jakarta menggunakan algoritma Extra Trees dengan metode oversampling SMOTE. Data yang digunakan pada penelitian ini adalah data Prakiraan Cuaca Provinsi DKI Jakarta pada tahun 2017 hingga 2018 yang diperoleh dari situs https://data.jakarta.go.id/. Data yang diperoleh memiliki distribusi data yang tidak seimbang sehingga perlu diseimbangkan terlebih dahulu menggunakan metode resampling data menggunakan Synthetic Minority Oversampling Technique atau SMOTE. Berdasarkan hasil penelitian, metode oversampling SMOTE tidak mempengaruhi hasil evaluasi pada klasifikasi cuaca Provinsi DKI Jakarta menjadi lebih baik. Hasil evaluasi terbaik didapatkan oleh model menggunakan algoritma Extra Trees tanpa metode oversampling SMOTE pada rasio 80% data latih dan 20% data uji dengan nilai akurasi sebesar 79,8%, precision 63,1%, dan recall 56,1%.


Keywords


Klasifikasi, Extra Trees, Oversampling SMOTE, Cuaca Provinsi DKI Jakarta

References


B. Santoso, A. I. S. Azis, and Zohrahayaty. (2020). Machine Learning & Reasoning Fuzzy Logic Algoritma, Manual, Matlab, & Rapid Miner. DEEPUBLISH

A. Luthfiarta, A. Febriyanto, H. Lestiawan, and W. Wicaksono. (2020). Analisa Prakiraan Cuaca dengan Parameter Suhu, Kelembaban, Tekanan Udara, dan Kecepatan Angin Menggunakan Regresi Linear Berganda. JOINS (Journal of Information System), vol. 5, no. 1, pp. 10–17. doi: 10.33633/joins.v5i1.2760.

G. A. Mursianto, I. M. Falih, M. Irfan, T. Sakinah, and D. Sandya. (2021). Perbandingan Metode Klasifikasi Random Forest dan XGBoost Serta Implementasi Teknik SMOTE pada Kasus Prediksi Hujan. Seminar Nasional Mahasiswa Ilmu Komputer dan Aplikasinya (SENAMIKA).

F. Hamami and A. Dahlan. (2022). Klasifikasi Cuaca Provinsi Dki Jakarta Menggunakan Algoritma Random Forest Dengan Teknik Oversampling.

P. Shi and Z. Wang. (2021). An Ensemble Tree Classifier for Highly Imbalanced Data Classification. J Syst Sci Complex, vol. 34, no. 6, pp. 2250–2266. doi: 10.1007/s11424-021-1038-8.

Ibnu Daqiqil. (2021). MACHINE LEARNING: Teori, Studi Kasus dan Implementasi Menggunakan Python, 1st ed. UR PRESS.

M. Yunus, M. Husni, and M. M. Mufadhdha. (2021). Klasifikasi Sentimen Terhadap Badan Penyelenggara Jaminan Sosial (BPJS) Pada Media Sosial Twitter Menggunakan Naive Bayes. SMATIKA JURNAL, vol. 11, no. 02, pp. 81–91. doi: 10.32664/smatika.v11i02.577.

B. Suma. (2020). Implementasi Machine Learning Di Dalam Prediksi Cuaca. Jurnal RESTI (Rekayasa Sistem dan Teknologi Informasi), vol. 4, no. 4, pp. 648–654. doi: 10.13140/RG.2.2.16086.47680.

S. Khomsah and Agus Sasmito Aribowo. (2020). Text-Preprocessing Model Youtube Comments in Indonesian. doi: 10.29207/resti.v4i4.2035.

Y. A. Sir and A. H. H. Soepranoto. (2022). Pendekatan Resampling Data Untuk Menangani Masalah Ketidakseimbangan Kelas. Jurnal Komputer dan Informatika, vol. 10, no. 1, pp. 31–38. doi: 10.35508/jicon.v10i1.6554.

E. V. Rahcmadani, N. H. Harani, and S. F. Pane. (2020). Algoritma C4.5 dan K-Nearest Neighbors (KNN) untuk Memetakan Matakuliah dan Keterlambatan Kelulusan Mahasiswa, 1st ed. Kreatif.


Refbacks

  • There are currently no refbacks.


Copyright (c) 2023 Prosiding Seminar Nasional Mahasiswa Bidang Ilmu Komputer dan Aplikasinya

Creative Commons License
This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License.