Analisis dan Prediksi Curah Hujan Bulanan Kota Serang Berbasis Apache Spark Menggunakan Dataset BPS Provinsi Banten
DOI:
https://doi.org/10.64803/juikti.v2i1.78Kata Kunci:
Prediksi Curah Hujan, Apache Spark, Machine Learning, Random ForestAbstrak
Curah hujan merupakan salah satu parameter iklim yang berperan penting dalam sektor pertanian, perencanaan tata kota, serta mitigasi bencana hidrometeorologi seperti banjir dan kekeringan. Namun, pengolahan dan analisis data curah hujan dalam rentang waktu panjang sering menghadapi tantangan akibat besarnya volume data dan kompleksitas pola yang terbentuk. Penelitian ini bertujuan untuk menganalisis pola curah hujan bulanan serta membangun model prediksi curah hujan di Kota Serang dengan memanfaatkan teknologi Big Data menggunakan Apache Spark dan dataset resmi dari Badan Pusat Statistik (BPS) Provinsi Banten periode 2005–2024. Proses penelitian meliputi tahap pembersihan data, analisis eksploratif, perhitungan klimatologi dan anomali, serta pemodelan prediksi menggunakan algoritma Linear Regression, Decision Tree, dan Random Forest. Kinerja model dievaluasi menggunakan Root Mean Square Error (RMSE), koefisien determinasi (R²), dan Skill Score dengan baseline klimatologi dan baseline lag sebagai pembanding. Hasil penelitian menunjukkan bahwa model Random Forest memberikan performa terbaik dengan nilai RMSE sebesar 84,07 dan nilai R² sebesar 0,14, serta Skill Score tertinggi dibandingkan model lainnya. Temuan ini mengindikasikan bahwa Random Forest lebih mampu menangkap pola non-linear pada data curah hujan bulanan. Penerapan Apache Spark terbukti efektif dalam mendukung proses analisis dan pemodelan data iklim berskala besar, sehingga hasil penelitian ini diharapkan dapat menjadi referensi dalam pengembangan sistem prediksi curah hujan serta mendukung pengambilan keputusan di tingkat daerah.
Referensi
[1] S. Putramulyo and S. Alaa, “Prediksi Curah Hujan Bulanan Di Kota Samarinda Menggunakan Persamaan Regresi Dengan Prediktor Data Suhu dan Kelembapan Udara,” Eig. Math. J., vol. 1, no. 2, pp. 13–16, 2018, doi: 10.29303/emj.v2i2.20.
[2] J. Pebralia, “Analisis Curah Hujan Menggunakan Machine Learning Metode Regresi Linier Berganda Berbasis Python dan Jupyter Notebook Rainfall Analysis using Machine Learning-Multiple Linear Regression Method Based on Python and Jupyter Notebook,” J. Ilmu Fis. dan Pembelajarannya, vol. 6, no. 2, pp. 23–30, 2022, [Online]. Available: http://jurnal.radenfatah.ac.id/index.php/jifp/
[3] A. Primajaya and B. N. Sari, “Random Forest Algorithm for Prediction of Precipitation,” Indones. J. Artif. Intell. Data Min., vol. 1, no. 1, p. 27, 2018, doi: 10.24014/ijaidm.v1i1.4903.
[4] N. A. Prakoso Indaryono, R. R. Saedudin, and F. Hamami, “Analisa Perbandingan Algoritma Random Forest Dan Naïve Bayes Untuk Klasifikasi Curah Hujan Berdasarkan Iklim Di Indonesia,” JIPI (Jurnal Ilm. Penelit. dan Pembelajaran Inform., vol. 9, no. 1, pp. 158–167, 2024, doi: 10.29100/jipi.v9i1.4421.
[5] E. Dewi, S. Mulyani, I. Septianingrum, N. Nurjanah, and R. Rahmawati, “Prediksi Curah Hujan Di Kabupaten Majalengka Dengan Menggunakan Algoritma Regresi,” e-Jurnal JUSITI (Jurnal Sist. Inf. dan Teknol. Informasi), vol. 8–1, no. 1, pp. 67–77, 2019, doi: 10.36774/jusiti.v8i1.602.
[6] A. Rahman et al., “Rainfall Prediction System Using Machine Learning Fusion for Smart Cities,” MDPI, pp. 1–51, 2022, [Online]. Available: https://bibliotecadigital.fgv.br/dspace/handle/10438/18386
[7] F. Rahutomo and B. Harjito, “Machine Learning-Based Climate Prediction in Indonesia: A Baseline Experiment,” Int. J. Adv. Comput. Sci. Appl., vol. 16, no. 8, pp. 797–810, 2025, doi: 10.14569/IJACSA.2025.0160877.
[8] Badan Pusat Statistik Provinsi Banten, “Curah Hujan menurut Bulan dan Stasiun Pengamatan di Provinsi Banten.” 2025.
[9] C. D. Usman, A. P. Widodo, K. Adi, and R. Gernowo, “Rainfall prediction model in Semarang City using machine learning,” Indones. J. Electr. Eng. Comput. Sci., vol. 30, no. 2, pp. 1224–1231, 2023, doi: 10.11591/ijeecs.v30.i2.pp1224-1231.
[10] F. Schiavio, D. Bonetta, and W. Binder, “Dynamic speculative optimizations for SQL compilation in apache spark,” Proc. VLDB Endow., vol. 13, no. 5, pp. 754–767, 2020, doi: 10.14778/3377369.3377382.
[11] C. Onyutha, “A hydrological model skill score and revised R-squared,” Hydrol. Res., vol. 53, no. 1, pp. 51–64, 2022, doi: 10.2166/NH.2021.071.
Unduhan
Diterbitkan
Terbitan
Bagian
Lisensi
Hak Cipta (c) 2026 Muhammad Rifqi Maulana, Azwa Fazilatunnisa, M. Yogi Febriansyah, Alfi Muiz, Irfan Fauzan, Ahmad Tabrani (Author)

Artikel ini berlisensiCreative Commons Attribution-ShareAlike 4.0 International License.






