Naive Bayes dengan Ekstraksi Fitur N-gram dalam Mendeteksi Spam Ulasan Bahasa Indonesia

  • Mukti Setyaji Institut Teknologi Telkom Purwokerto
  • Muhammad Zidny Naf’an Institut Teknologi Telkom Purwokerto
  • Wahyu Adi Prabowo Institut Teknologi Telkom Purwokerto
  • Galuh Boy Hertantyo Institut Teknologi Telkom Purwokerto
Keywords: Klasifikasi, Machine Learning, Naive Bayes, Opini, Review, Supervised Learning, Spam, Text Mining, Ulasan

Abstract

Abstrak—Ulasan memiliki banyak dan beragam informasi berharga yang biasa digunakan oleh calon pembeli untuk melihat / menilai profile produk, mutu produk, jasa dan kredibilitas pemilik bisnis berdasarkan opini dari pengguna. ulasan biasa dijadikan sebagai alat untuk mengambil keputusan bagi pembeli maupun penjual. Namun, sangat disayangkan ada beberapa orang yang tidak bertanggung jawab memanfaatkannya dengan membuat ulasan yang bersifat menipu untuk mempromosikan atau merusak reputasi sebuah produk atau jasa. Dalam tugas akhir ini, akan digunakan pendekatan supervised learning yang merupakan pendekatan machine learning yang sering digunakan dalam klasifikasi spam. Model yang digunakan, ialah Naive Bayes Classifier dengan ekstraksi fitur n-gram. Dengan membandingkan lima nilai n dalam n-gram didapatkan nilai akurasi tertinggi sebesar 80.44%.

References

[1] J. Krumm, N. Davies, dan C. Narayanaswami, “User-generated content,” IEEE Comput. Soc., 2008.
[2] M. N. I. Ahsan, T. Nahian, A. A. Kafi, M. I. Hossain, dan F. M. Shah, “An ensemble approach to detect review spam using hybrid machine learning technique,” in 2016 19th International Conference on Computer and Information Technology (ICCIT), 2016, hal. 388–394.
[3] N. Jindal dan B. Liu, “Opinion spam and analysis,” in Proceedings of the international conference on Web search and web data mining - WSDM ’08, 2008, hal. 219.
[4] A. Mukherjee, V. Venkataraman, B. Liu, dan N. Glance, “What Yelp Fake Review Filter Might Be Doing?,” Assoc. Adv. Artif. Intell., 2013. [5] D. Streitfeld, “Buy Reviews on Yelp, Get Black Mark,” The New York Times, 2012.
[6] M. Ott, Y. Choi, C. Cardie, dan J. T. Hancock, “Finding Deceptive Opinion Spam by Any Stretch of the Imagination,” in Proceedings ofthe 49th Annual Meeting ofthe Association for Computational Linguistics, 2011, hal. 309–319.
[7] A. Mukherjee, V. Venkataraman, B. Liu, dan N. Glance, “Fake Review Detection: Classification and Analysis of Real and Pseudo Reviews,” Chicago, 2013.
[8] J. O. Cooper, T. E. Heron, dan W. L. Heward, Applied Behavior Analysis, 2nd ed. Edinburgh Gate: Pearson, 2014.
[9] K. P. Murphy, Machine Learning: A Probabilistic Perspective. Massachusetts Institute of Technology, 2012.
Published
2019-04-16
How to Cite
Setyaji, M., Naf’an, M. Z., Prabowo, W. A., & Hertantyo, G. B. (2019). Naive Bayes dengan Ekstraksi Fitur N-gram dalam Mendeteksi Spam Ulasan Bahasa Indonesia. Proceedings of the National Conference on Electrical Engineering, Informatics, Industrial Technology, and Creative Media, 1(1), 56-60. Retrieved from https://conferences.ittelkom-pwt.ac.id/index.php/centive/article/view/10