IMPLEMENTASI ALGORITMA K-NEAREST NEIGHBOR (KNN) MENGGUNAKAN RAPID MINER UNTUK PREDIKSI PENYAKIT DIABETES BERDASARKAN DATASET PIMA INDIAN

Penulis

Kata Kunci:

Data Mining, K-Nearest Neighbor, RapidMiner, Prediksi Diabetes, Pima Indian Dataset

Abstrak

Tujuan dari penelitian ini adalah untuk menggunakan algoritma K-Nearest Neighbor (KNN) untuk memprediksi penyakit diabetes dengan menggunakan dataset Pima Indian yang tersedia secara publik. Metode KNN adalah salah satu algoritma klasifikasi yang paling sederhana namun efektif, terutama ketika digunakan untuk mengolah data medis. Perangkat lunak RapidMiner digunakan untuk melakukan proses analisis penelitian ini, yang dimulai dengan tahap pra-pemrosesan data; setelah itu, data dipisahkan menjadi data uji dan data latih; dan akhirnya, model klasifikasi dievaluasi. Usia, kadar glukosa, tekanan darah, dan indeks massa tubuh adalah beberapa variabel kesehatan yang digunakan untuk memprediksi data Pima Indian. Hasil pengujian menunjukkan bahwa algoritma KNN dapat mengklasifikasikan pasien dengan cukup akurat. Untuk menilai kinerja model, metrik akurasi, presisi, recall, dan confusion matrix digunakan. Oleh karena itu, menerapkan KNN pada dataset seperti ini dapat menjadi metode yang mungkin untuk membantu dalam sistem yang mendukung keputusan tentang diagnosis awal diabetes.

Referensi

Maryanah Safitri, dan Ardian Dwi Praba. (2024). Prediksi Penyakit Diabetes Dengan Menggunakan Algoritma C4.5. (Jurnal of Informatics) Universitas Muhammadiyah Tangerang Vol 8, No.1, January 2024, pp 74-81

Nurrika, Riskya. dan Selvira Yuliana. (2023). Penerapan Data Mining Untuk Prediksi Perilaku Pelanggan Menggunakan Multiple Linear Regression. (Jurnal Informatika dan Teknik Elektro Terapan) Vol. 11 No. 3

Gunawan, M. I. (2020).Penyakit gula darah adalah sekelompok penyakit metabolik yang ditandai dengan tingginya kadar gula darah pada seseorang yang terkena, dan bertahan dalam jangka waktu lama. (Sumber tidak lengkap - sebaiknya dilengkapi nama jurnal atau buku).

Gunawan, M. I., & Fenriana. (2023).Evaluasi variabel K pada algoritma KNN untuk prediksi penyakit diabetes. (Sumber tidak lengkap - sebaiknya dilengkapi nama jurnal atau prosiding).

Perdana, A., Sari, D. F., & Lestari, P. (2023).Studi akurasi KNN dengan nilai K bervariasi pada dataset Pima Indian Diabetes. (Sumber tidak lengkap - sebaiknya dilengkapi nama jurnal).

Arrohman, M. A., & Fatah, M. (2024).Pengaruh teknik praproses data terhadap akurasi model klasifikasi kesehatan. (Sumber tidak lengkap - sebaiknya dilengkapi nama jurnal atau prosiding).

Kementerian Kesehatan Republik Indonesia (Kemenkes RI). (2022).Data prevalensi diabetes di Indonesia. Jakarta: Kementerian Kesehatan RI. (Sebaiknya tambahkan tautan atau laporan resmi jika ada).

RapidMiner. (n.d.).RapidMiner user guide and operator reference. Retrieved from https://docs.rapidminer.com/

Chawla, N. V., Bowyer, K. W., Hall, L. O., & Kegelmeyer, W. P. (2002).SMOTE: Synthetic minority over-sampling technique. Journal of Artificial Intelligence Research, 16, 321-357. https://doi.org/10.1613/jair.953

Han, J., Pei, J., & Kamber, M. (2011).Data mining: Concepts and techniques (3rd ed.). Elsevier.

Unduhan

Diterbitkan

2025-06-30

Cara Mengutip

Tetta Thirza Herdyawan, Dimas Cahyo Saputra, Gabriel Carol Aldosion, Salsha Sabilla Nurhidayat, & Sukrinah. (2025). IMPLEMENTASI ALGORITMA K-NEAREST NEIGHBOR (KNN) MENGGUNAKAN RAPID MINER UNTUK PREDIKSI PENYAKIT DIABETES BERDASARKAN DATASET PIMA INDIAN. Journal of Information Technology and Informatics Engineering, 1(1), 36-40. https://journal.jci.co.id/jitie/article/view/111