Komparasi Algoritma Klasifikasi untuk Prediksi Leads yang akan Menjadi Customer

  • Abednego Steven Sihite Universitas Kristen Maranatha
  • Hendra Bunyamin Universitas Kristen Maranatha

Abstract

Leads adalah sekelompok orang yang memiliki potensi untuk menjadi pelanggan dari sebuah produk dan jasa dari sebuah bisnis. Oleh karena itu, mengetahui segmentasi leads dan memprediksi leads yang akan menjadi pelanggan merupakan hal yang sangat penting bagi sebuah perusahaan. Beruntungnya di era digital ini, teknologi dapat digunakan untuk membantu pekerjaan manusia seperti memprediksi leads yang akan menjadi pelanggan. Salah satu teknologi yang dapat digunakan adalah penerapan machine learning. Proses penerapan machine learning dalam memprediksi leads yang akan menjadi pelanggan meliputi preprocessing data, analisis data eksploratif, serta pembuatan dan interpretasi model machine learning itu sendiri. Algoritma klasifikasi yang diujicobakan pada penelitian ini adalah Logistic Regression, Support Vector Machine, Decision Trees, Random Forest, Naive Bayes, dan K-Nearest Neighbors. Dataset yang digunakan dalam penelitian ini adalah data sekunder yang diambil dari platform Kaggle dengan total 9.240 baris dan 37 kolom. Preprocessing data dapat membersihkan kualitas dari dataset sehingga dataset tersebut dapat digunakan sebagai data training dan data testing dengan kualitas yang baik. Analisis Data Eksplorasi dapat menghasilkan informasi penting dari sebuah dataset. Terakhir, pembangunan dan interpretasi model dapat menjelaskan bagaimana sebuah fitur dalam dataset dapat mempengaruhi prediksi sebuah model. Pada bagian algoritma, berdasarkan hasil uji coba didapatkan bahwa algoritma Random Forest merupakan algoritma dengan nilai terbaik dalam memprediksi prospek yang akan menjadi pelanggan. Terakhir, pada tahap interpretasi model dengan menggunakan metode partial dependence plot menghasilkan kesimpulan bahwa semakin lama calon pelanggan menghabiskan waktu di website perusahaan, maka semakin besar kemungkinan calon pelanggan tersebut menjadi pelanggan, kemudian leads yang teridentifikasi melalui Lead Add Form memiliki peluang lebih besar untuk menjadi pelanggan dan yang terakhir calon pelanggan atau lead yang bekerja secara profesional memiliki peluang lebih besar untuk menjadi pelanggan

References

[1] Luis G. Serrano, “Grokking Machine Learning: What is Machine Learning? It is common sense”, Manning Publication, 2021.
[2] Tim Editorial Rumah.com, “Lead Adalah: Ini Penjelasannya dan 5 Cara Jitu Mendapatkan Lead”,rumah.com/panduan-properti/lead-adalah-ini-penjelasannya-dan-5-cara-jitu-mendapatkan-lead-65744.
[3] Goldstein, A., Kapelner, A., Bleich, J., & Pitkin, E., “Peeking inside the black box: Visualizing statistical learning with plots of individual conditional expectation. Journal of Computational and Graphical Statistics”, 24(1), 44-65, 2015.
[4] Maalouf, Maher. "Logistic regression in data analysis: an overview." International Journal of Data Analysis Techniques and Strategies 3.3 : 281-299, 2011.
[5] Luis G. Serrano, “Grokking Machine Learning: Support Vector Machine and the Kernel Method”, Manning Publication, 2021.
[6] Awad, Mariette, Rahul Khanna, Mariette Awad, and Rahul Khanna. "Support vector machines for classification." Efficient Learning Machines: Theories, Concepts, and Applications for Engineers and System Designers, 2015.
[7] Binus Bandung, “Algoritma Naive Bayes,” [Online]. Available: https://binus.ac.id/bandung/2019/12/algoritma-naive-bayes, 2022
[8] Jadhav, Sayali D., and H. P. Channe. "Comparative study of K-NN, naive Bayes and decision tree classification techniques." International Journal of Science and Research (IJSR) 5.1, 2016.
[9] G. Stein, B. Chen, A. S. Wu, and K. A. Hua, “Decision tree classifier for network intrusion detection with GA-based feature selection,” in Proceedings of the 43rd annual Southeast regional conference- Volume 2, 2005.
[10] Shaik, Anjaneyulu Babu, and Sujatha Srinivasan. "A brief survey on random forest ensembles in classification model." International Conference on Innovative Computing and Communications: Proceedings of ICICC 2018, Volume 2. Springer Singapore, 2019
[11] Jason Brownlee, “Machine Learning Algorithms From Scratch, Machine Learning Mastery,” 2016.
Published
2023-12-30
How to Cite
SIHITE, Abednego Steven; BUNYAMIN, Hendra. Komparasi Algoritma Klasifikasi untuk Prediksi Leads yang akan Menjadi Customer. BINA INSANI ICT JOURNAL, [S.l.], v. 10, n. 2, p. 188 - 199, dec. 2023. ISSN 2527-9777. Available at: <https://ejournal-binainsani.ac.id/index.php/BIICT/article/view/2638>. Date accessed: 16 june 2024. doi: https://doi.org/10.51211/biict.v10i2.2638.