Analisis Perbandingan Decision Tree dan Random Forest Pada Klasifikasi Teks Data Kesehatan

  • Hardian Oktavianto Universitas Muhammadiyah Jember
  • Henny Wahyu Sulistyo Universitas Muhammadiyah Jember
  • Guruh Wijaya Universitas Muhammadiyah Jember
  • Dudi Irawan Universitas Muhammadiyah Jember
  • Ginanjar Abdurrahman Universitas Muhammadiyah Jember

Abstract

Salah satu topik penelitian yang diminati para peneliti adalah klasifikasi teks otomatis. Klasifikasi teks pada saat ini sering digunakan karena semakin banyaknya jumlah dokumen teks yang harus kita tangani maupun kita gunakan setiap hari. Metode pengklasifikasi yang banyak digunakan diantaranya adalah decision tree dan random forest. Decision Tree umumnya dipilih memiliki kesederhanaan visual, konstruksi keputusan yang relatif cepat, dan tidak memerlukan asumsi sebelumnya tentang data. Algoritma Random Forest menggunakan konsep yang sama dengan Decision Tree kemudian melakukan agregasi hasil dari setiap pohon keputusan untuk memperoleh hasil. Algoritma Random Forest juga menggunakan pendekatan perluasan, yang disebut pendekatan bagging, yang mana fitur-fitur berbeda dari kumpulan data akan ditugaskan ke setiap pohon keputusan. Tujuan penelitian ini adalah melakukan kategorisasi dengan menggunakan teknik klasifikasi menggunakan algoritma decision tree dan random forest, yang merupakan algoritma pengklasifikasi yang banyak digunakan. Dengan menggunakan empat buah skenario uji dimana membagi data latih dan data uji dengan kombinasi 10%-90% 15%-85% 20%-80% dan 25%-75% menghasikan informasi bahwa Random Forest memiliki akurasi yang lebih baik. Akurasi Random Forest pada tiap skenario uji selalu lebih baik daripada nilai akurasi Decision Tree. Pada Decision Tree, menunjukkan nilai akurasi cukup stabil pada kisaran 75%, sedangkan pada Random Forest menunjukkan nilai akurasi lebih stabil pada nilai 99%.

References

C.-Y. Ho, M. Syamsudin e Y.-C. Shen, “Cancer Literature Classification Methods Performance,” em 2020 International Conference on Decision Aid Sciences and Application, 2020.
Z. A. Abutiheen, A. H. Aliwy e K. B. S. Aljanabi, “Arabic text classification using master-slaves technique,” em J. Phys.: Conf. Ser. 1032 012052, 2018.
Z. Hamid e H. K. Khafaji, “Classification of Arabic Documents depending on Maximal Frequent Itemsets,” em J. Phys.: Conf. Ser. 1804 012009, 2021.
W. Dai, “Classification and analysis of literary works based on distribution weighted term frequency-inverse document frequency,” em J. Phys.: Conf. Ser. 1941 012018, 2021.
Irfan, I. M. Wildani e I. N. Yulita, “Classifying Botnet Attack on Internet of Things Device Using Random Forest,” em IOP Conf. Ser.: Earth Environ. Sci. 248 012002, 2019.
S. Rahmadani, A. Dongoran, M. Zarlis e Zakarias, “Comparison of Naive Bayes and Decision Tree on Feature Selection Using Genetic Algorithm for Classification Problem,” em J. Phys.: Conf. Ser. 978 012087, 2018.
A. S. Fitrani, “Prediction of Study Period Students (Bachelor Degree) Muhammadiyah University of Sidoarjo Based on Decision Tree Method using C4.5 Algorithm,” em J. Phys.: Conf. Ser. 1179 012033, 2019.
Y. Kustiyahningsih, B. K. Khotimah, D. R. Anamisa, M. Yusuf, T. Rahayu e J. Purnama, “Decision Tree C 4.5 Algorithm for Classification of Poor Family Scholarship Recipients,” em IOP Conf. Ser.: Mater. Sci. Eng. 1125 012048, 2021.
Normah, I. Yulianti, D. Novianti, M. N. Winnarto, A. Zumarniansyah e S. Linawati, “Comparison of Classification C4.5 Algorithms and Naive Bayes Classifier in Determining Merchant Acceptance on Sponsorship Program,” em J. Phys.: Conf. Ser. 1641 012006, 2020.
R. Wang, “Comparison of Decision Tree, Random Forest and Linear Discriminant Analysis Models in Breast Cancer Prediction,” em J. Phys.: Conf. Ser. 2386 012043, 2022.
Published
2024-06-30
How to Cite
OKTAVIANTO, Hardian et al. Analisis Perbandingan Decision Tree dan Random Forest Pada Klasifikasi Teks Data Kesehatan. BINA INSANI ICT JOURNAL, [S.l.], v. 11, n. 1, p. 56 - 65, june 2024. ISSN 2527-9777. Available at: <http://ejournal-binainsani.ac.id/index.php/BIICT/article/view/2928>. Date accessed: 08 sep. 2024. doi: https://doi.org/10.51211/biict.v11i1.2928.