Penerapan Principal Component Analysis untuk Peningkatan Kinerja Algoritma Decision Tree pada Iris Dataset

Putri Kurnia Handayani

Abstract


Data mining merupakan salah bidang ilmu yang bermanfaat untuk pengenalan pola/knowledge yang tersimpan dalam database. Klasifikasi merupakan salah satu peran dalam bidang data mining. Termasuk ke dalam supervised learning, klasifikasi digunakan untuk memprediksi objek yang belum memiliki kelas/label. Penggunaan algoritma decision tree untuk proses mining dataset bunga iris dikarenakan kemudahan dalam representasi knowledge yang dihasilkan. Selain itu, decision tree juga termasuk ke dalam eager learner sehingga akurasi dari knowledge yang dihasilkan lebih baik. Penggunaan principal component analysis (PCA) dalam optimasi algoritma decision tree, dilakukan saat preprocessing dataset. PCA berfungsi untuk mereduksi dimensi, fitur yang saling berkorelasi akan dipertahankan. Penggunaan dataset publik bunga iris diambil dari UCI Repository. Berdasarkan hasil perhitungan, akurasi algoritma decision tree setelah dilakukan optimasi dengan PCA terhadap dataset bunga iris sebesar 95.33%.

Keywords


data mining, klasifikasi, decision tree, PCA

Teks Lengkap:

PDF

Referensi


Gorunescu, F., 2011. Data Mining Concepts, Models and Techniques. Australia: Springer.

Han, J. & Micheline, K., 2000. Data Mining: Concept and Techniques. Simon Fraser University: Morgan Kaufmann.

Maimon, O. & Rokarch, L., 2010. Data Mining and Knowledge Discovery Handbook. 2 ed. London: Springer.

Nasution, M. Z., 2019. Penerapan Principal Component Analysis (PCA) dalam Penentuan Faktor Dominan yang Mempengaruhi Prestasi Belajar Siswa (Studi Kasus: SMK Raksana 2 Medan). Jurnal Teknologi Informasi, Volume 3, pp. 41-48.

Witten, I. H., Frank, E. & Hall, M. A., 2011. Data Mining Practical Machine Learning Tools and Techniques. 3 ed. Burlington: Elsevier.




DOI: https://doi.org/10.24176/ijtis.v1i2.4939

Article Metrics

Abstract views : 82| PDF views : 98

Refbacks

  • Saat ini tidak ada refbacks.