Algoritma Stemming Sebagai Pra-Proses Pengecekan Kemiripan Naskah

  • Rahmadya Trias Handayanto Teknik Komputer; Universitas Islam 45 http://orcid.org/0000-0001-9433-3882
  • Ahmad Wafiq Amrillah Teknik Komputer; Universitas Islam 45
  • Intan Juwita Teknik Komputer; Universitas Islam 45
  • Muhammad Arifin Teknik Komputer; Universitas Islam 45
  • Setiaji Setiaji Teknik Komputer; Universitas Islam 45
  • Reyvan Karani Teknik Komputer; Universitas Islam 45

Abstract

Abstrak: Proses pencarian kata dasar dari suatu kata dalam Bahasa Indonesia lebih sulit dari pada bahasa Inggris. Proses yang dikenal dengan istilah stemming itu membutuhkan algoritma tertentu dalam mencari kata dasar suatu kata. Berbeda dengan bahasa Inggris yang hanya mengenal akhiran, dalam Bahasa Indonesia dikenal awalan, akhiran dan sisipan sehingga proses stemming jauh lebih rumit. Beberapa algoritma stemming untuk Bahasa Indonesia telah banyak diterapkan untuk proses temu kembali. Penelitian ini mencoba menerapkan algoritma stemming untuk mengecek kemiripan naskah berdasarkan kata dasarnya. Selain itu sebuah aplikasi sederhana dibuat untuk menguji akurasi proses stemming yang diusulkan.
 
Kata kunci: kata dasar, kemiripan naskah, Matlab, pemrosesan teks, temu kembali.
 
Abstract: Searching a root of word in Indonesian is more difficult that English. This process, which is called stemming, need specific algorithms in finding the root. Whereas in English usually the roots are found by separating the suffixes, in Indonesia are found by separating preffixes, suffixes, and inffixes as well, so it adds the complexity of stemming process. Many stemming algorithms have been proposed in information retrieval, but in this study, the stemming was also used for similarity check of papers. In addition, a prototype was created for checking the proposed-algorithm’s accuracy.
 
Keywords: information retrieval, Matlab, root word, similarity, text processing.

Author Biographies

Rahmadya Trias Handayanto, Teknik Komputer; Universitas Islam 45
Teknik Komputer; Universitas Islam 45
Ahmad Wafiq Amrillah, Teknik Komputer; Universitas Islam 45
Teknik Komputer; Universitas Islam 45
Intan Juwita, Teknik Komputer; Universitas Islam 45
Teknik Komputer; Universitas Islam 45
Muhammad Arifin, Teknik Komputer; Universitas Islam 45
Teknik Komputer; Universitas Islam 45
Setiaji Setiaji, Teknik Komputer; Universitas Islam 45
Teknik Komputer; Universitas Islam 45
Reyvan Karani, Teknik Komputer; Universitas Islam 45
Teknik Komputer; Universitas Islam 45

References

Adriani M, Asian J, Nazief B, Williams HE. 2007. Stemming Indonesian : A Confi x-Stripping Approach. 6: 1–33.

Banchs RE. 2013. Text Mining with MATLAB. Barcelona: Springer.

Cormen TH, Leiserson C, Rivest RL, Stein C. 2009. Introduction to Algorithms. Massachusetts: The MIT Press.

Keke D, Chikita R, Prayogo AD. 2012. Sistem Temu Balik Informasi. Yogyakarta.

Kraaij W. 1994. Porter ’ s stemming algorithm for Dutch. 167–180.

Manning C. 2009. An Introduction to Information Retrieval. Cambridge: Cambridge University Press.

Susyanto T. 2018. Implementasi dan Analisis Algoritma Stemming Nazief dan Adriani. SINUS.
Published
2018-12-30
How to Cite
HANDAYANTO, Rahmadya Trias et al. Algoritma Stemming Sebagai Pra-Proses Pengecekan Kemiripan Naskah. BINA INSANI ICT JOURNAL, [S.l.], v. 5, n. 2, p. 175 - 182, dec. 2018. ISSN 2527-9777. Available at: <http://ejournal-binainsani.ac.id/index.php/BIICT/article/view/1044>. Date accessed: 08 sep. 2024.