Penerapan Algoritma Machine Learning untuk Klasifikasi Pesan Media Sosial pada Perguruan Tinggi
Abstract
Abstrak: Di era digital, media sosial seperti Direct Message (DM) Instagram dan WhatsApp seringkali menjadi sarana utama komunikasi antara perguruan tinggi dan calon mahasiswa. Universitas Bina Insani menerima banyak pesan setiap harinya yang berisi berbagai pertanyaan terkait pendaftaran, informasi_kampus, biaya, kelas_karyawan, jurusan, beasiswa dan lainnya. Namun, pesan-pesan tersebut masih dikelola secara manual tanpa pengelompokan topik yang terstruktur, sehingga menyulitkan admin dalam mengidentifikasi kebutuhan informasi yang paling sering diajukan. Penelitian ini bertujuan untuk mengembangkan sistem klasifikasi pesan media sosial menggunakan algoritma machine learning guna mengelompokkan pesan berdasarkan topik secara otomatis. Dataset yang digunakan terdiri dari 350 pesan yang dikumpulkan dari Instagram dan WhatsApp, yang telah diberi label ke dalam beberapa kategori. Tahapan pengolahan data meliputi pra-pemrosesan teks, ekstraksi fitur menggunakan Term Frequency–Inverse Document Frequency (TF-IDF), serta proses klasifikasi menggunakan algoritma Support Vector Machine (SVM). Hasil pengujian menunjukkan bahwa model SVM mampu melakukan klasifikasi pesan dengan tingkat akurasi sebesar 61%. Untuk meningkatkan performa pada kelas dengan jumlah data yang tidak seimbang, diterapkan pendekatan gabungan antara model machine learning dan rule-based berbasis kata kunci, yang menghasilkan peningkatan akurasi hingga 70%. Sistem yang dikembangkan kemudian diimplementasikan dalam bentuk dashboard interaktif berbasis Streamlit untuk memudahkan pengguna dalam mengunggah data, melihat hasil klasifikasi, dan memantau distribusi topik pesan.Abstract: In the digital era, social media platforms such as Instagram Direct Messages (DM) and WhatsApp have become the primary communication channels between higher education institutions and prospective students. Universitas Bina Insani receives a large number of messages daily containing various inquiries related to admission information, tuition fees, study programs, scholarships, and campus services. However, these messages are still managed manually without structured topic classification, making it difficult for administrators to identify the most frequently requested information. This study aims to develop a social media message classification system using machine learning algorithms to automatically group messages based on their topics. The dataset used in this study consists of 350 messages collected from Instagram and WhatsApp, which were manually labeled into several categories. The data processing stages include text preprocessing, feature extraction using Term Frequency–Inverse Document Frequency (TF-IDF), and message classification using the Support Vector Machine (SVM) algorithm. The experimental results show that the SVM model achieved a classification accuracy of 61%. To improve performance on imbalanced classes, a hybrid approach combining machine learning and keyword-based rule-based methods was applied, resulting in an accuracy improvement of up to 70%. The developed system was then implemented in the form of an interactive dashboard based on Streamlit, enabling users to upload data, view classification results, and monitor the distribution of message topics more effectively.
References
[2] M. Raihan, S. Putra Pamungkas, M. Nurul Huda, D. A. Fauzan, A. Hilal Itsna, and M. Al-Hijri, “Sistem Klasifikasi Otomatis Dengan Konsep Machine Learning As A Service (MLaaS) Pada Kasus Pesan Berindikasi Cyberbullying,” Ilk. J. Comput. Sci. Appl. Informatics, vol. 4, no. 3, pp. 252–261, 2022.
[3] O. I. Gifari, M. Adha, F. Freddy, and F. F. S. Durrand, “Film Review Sentiment Analysis Using TF-IDF and Support Vector Machine,” J. Inf. Technol., vol. 2, no. 1, pp. 36–40, 2022.
[4] G. A. Syafarina and Z. Zaenuddin, “Implementasi Framework Streamlit Sebagai Prediksi Harga Jual Rumah Dengan Linear Regresi,” Metik J., vol. 7, no. 2, pp. 121–125, 2023, doi: 10.47002/metik.v7i2.608.
[5] M. S. Haris, A. N. Khudori, and W. T. Kusuma, “Perbandingan Metode Supervised Machine Learning untuk Prediksi Prevalensi Stunting di Provisi Jawa Timur,” J. Teknol. Inf. dan Ilmu Komput., vol. 9, no. 7, p. 1571, 2022, doi: 10.25126/jtiik.2022976744.
[6] R. Nazar, “Implementasi Pemrograman Python Menggunakan Google Colab,” J. Inform. dan Komput. , vol. 15, no. 1, pp. 50–56, 2024.
[7] T. Tan, H. Sama, G. Wijaya, and O. E. Aboagye, “Studi Perbandingan Deteksi Intrusi Jaringan Menggunakan Machine Learning: (Metode SVM dan ANN),” J. Teknol. dan Inf., vol. 13, no. 2, pp. 152–164, 2023, doi: 10.34010/jati.v13i2.10484.
[8] A. Supratman, B. Indarmawan Nugroho, and R. Dwi Kurniawan, “Penerapan Metode Rule-Based System untuk Menentukan Jenis Tanaman Pertanian Berdasarkan Ketinggian dan Curah Hujan,” Innov. J. Soc. Sci. Res., vol. 4, pp. 7879–7890, 2024.
[9] H. Leidiyana, T. Misriati, and R. Aryanti, “Klasifikasi Sentimen Terhadap Kebijakan Tapera Menggunakan Komparasi Machine Learning dan SMOTE,” J. Komtika (Komputasi dan Inform., vol. 8, no. 2, pp. 125–135, 2024, doi: 10.31603/komtika.v8i2.12595.
[10] Syahril Dwi Prasetyo, Shofa Shofiah Hilabi, and Fitri Nurapriani, “Analisis Sentimen Relokasi Ibukota Nusantara Menggunakan Algoritma Naïve Bayes dan KNN,” J. KomtekInfo, vol. 10, pp. 1–7, 2023, doi: 10.35134/komtekinfo.v10i1.330.
[11] A. Putranto, N. L. Azizah, and A. I. Ratna Ika, “Sistem Prediksi Penyakit Jantung Berbasis Web Menggunakan Metode SVM dan Framework Streamlit,” J. Penerapan Sist. Inf. (Komputer Manajemen), vol. 4, no. 2, pp. 442–452, 2023, [Online]. Available: https://archive.ics.uci.edu/ml/datasets/heart+disease
[12] M. Hariz Izzuddin and M. Daniel Krisna Halim Putra, “Implementasi Metodologi Agile dalam Pengembangan Platform Kursus Online pada Platform Eduskill,” J. Educ., vol. 06, no. 04, pp. 20158–20166, 2024.
[13] F. D. Pramakrisna, F. D. Adhinata, and N. A. F. Tanjung, “Aplikasi Klasifikasi SMS Berbasis Web Menggunakan Algoritma Logistic Regression,” Teknika, vol. 11, no. 2, pp. 90–97, 2022, doi: 10.34148/teknika.v11i2.466.






