Klasifikasi Tweet Berdasarkan Keterkaitan Tweet Terhadap Topik Tertentu Pada Twitter Menggunakan Naïve Bayes

  • Muhamad Baydhowi Sistem Informasi; Universitas Bina Insani
  • Widya Apriliah Sistem Informasi; Universitas Bina Sarana Informatika
  • Ilham Kurniawan Sistem Informasi; Universitas Bina Sarana Informatika

Abstract

Abstrak: Twitter merupakan salah satu jejaring sosial atau mikroblog yang memungkinkan penggunanya untuk mengirim dan membaca pesan yang di sebut kicauan (tweets) yang berisi 140 karakter. Indonesia menduduki urutan ke lima jumlah pengguna (user) Twitter terbanyak di seluruh dunia dan Jakarta adalah kota yang paling aktif diseluruh dunia dalam membuat posting di Twitter. Berdasarkan informasi tersebut, kita dapat memanfaatkan data tweet untuk kepentingan tertentu seperti mengklasifikasikan tweet berdasarkan ketertarikan terhadap topik tertentu dengan kriteria yang telah ditentukan. Hasil penelitian ini diharapkan dapat digunakan untuk mendapatkan user potensial yang terkait dengan topik yang telah ditentukan sebagai sasaran marketing dari produk yang berkaitan dengan topik yang telah ditentukan sebelumnya. Namun penentuan klasifikasi tweet yang terkait dan tidak terkait dengan suatu topik manjadi kendala bagi para internet marketer. Tujuan penelitian ini adalah untuk menemukan metode klasifikasi tweet berdasarkan label terkait dan tidak terkait untuk kategori tertentu berdasarkan isi teks dari tweet tersebut. Data tweet diolah sehingga membentuk Bag of Words yang nantinya akan digunakan sebagai data training untuk melakukan klasifikasi dengan algoritma Naïve Bayes terhadap tweet yang diinput sebagai data testing.
 
Kata kunci: Bag of words, Internet marketer, Klasifikasi, Naïve Bayes, Tweet.
 
Abstract: Twitter is one of the social network or microblog that allows users to send and read messages called tweets that contain 140 characters. Indonesia ranks the fifth largest number of Twitter users worldwide and Jakarta is the most active city in the world in posting on Twitter. Based on that information, we can utilize tweet data for specific purposes such as classifying tweets based on interest in a particular topic with predetermined criteria. The results of this study are expected to be used to obtain potential users associated with the topic that has been determined as a marketing target of the product relating to a predetermined topic. But determining the classification of related tweets and unrelated tweets to a topic becomes an obstacle for the internet marketers. The purpose of this research is to find the method of tweet classification based on related and unrelated labels for certain categories based on the text content of the tweet. Tweet data is processed and becomes Bag of Words which will be used as training data to classify tweet that inputted as testing data with Naïve bayes algorithm.
 
Keywords: Bag of words, Classification, Internet marketer, Naïve bayes, Tweet.

References


Allah FA. 2008. Information Retrieval: Applications to English and Arabic Documents.

Chantar HKH. 2013. New Techniques for Arabic Document Classication. 165 p.

Eddyono AS. 2013. Twitter: Kawan, Sekaligus Lawan Bagi Redaksi Berita. J. Commun. Spectr. 3: 47–65.

Han J, Kamber M. 2006. Data mining: Data mining concepts and techniques, 2e. Stephan A, editor. San Fransisco: Morgan Kaufman. 1-745 p.

Manning CD, Raghavan P, Schutze H. 2008. Introduction to Information Retrieval. 307-309 p.

Masripah S. 2016. Komparasi Algoritma Klasifikasi Data Mining untuk Evaluasi Pemberian Kredit. Bina Insa. ICT J. 3: 187–193.

Nurelasari E. 2018. Komparasi Algoritma Naive Bayes Dengan Support Vector Machine Berbasis Particle Swarm Optimization untuk Prediksi Kesuburan. Bina Insa. ICT J. 5: 61–70.

Rish I. 2001. An empirical study of the naive bayes classifier. IJCAI 2001 Work. Empir. methods Artif. Intell. 3: 41–46.

Rodiansyah SF, Winarko E. 2012. Klasifikasi Posting Twitter Kemacetan Lalu Lintas Kota Bandung Menggunakan Naive Bayesian Classification. Indones. J. Comput. Cybern. Syst. 6: 91–100.

Witten IH, Frank E. 2005. Data Mining: Practical Machine Learning Tools and Techniques (Google eBook), 2e. Diane Cerra. 664 p.

Published
2019-12-02
How to Cite
BAYDHOWI, Muhamad; APRILIAH, Widya; KURNIAWAN, Ilham. Klasifikasi Tweet Berdasarkan Keterkaitan Tweet Terhadap Topik Tertentu Pada Twitter Menggunakan Naïve Bayes. INFORMATION SYSTEM FOR EDUCATORS AND PROFESSIONALS : Journal of Information System, [S.l.], v. 4, n. 1, p. 95 – 103, dec. 2019. ISSN 2548-3587. Available at: <http://ejournal-binainsani.ac.id/index.php/ISBI/article/view/1244>. Date accessed: 03 apr. 2020.