Naive Bayes dengan Ekstraksi Fitur N-gram dalam Mendeteksi Spam Ulasan Bahasa Indonesia

Mukti Setyaji; Muhammad Zidny Naf’an; Wahyu Adi Prabowo; Galuh Boy Hertantyo

Mukti Setyaji Institut Teknologi Telkom Purwokerto
Muhammad Zidny Naf’an Institut Teknologi Telkom Purwokerto
Wahyu Adi Prabowo Institut Teknologi Telkom Purwokerto
Galuh Boy Hertantyo Institut Teknologi Telkom Purwokerto

Keywords: Klasifikasi, Machine Learning, Naive Bayes, Opini, Review, Supervised Learning, Spam, Text Mining, Ulasan

Abstract

Abstrak—Ulasan memiliki banyak dan beragam informasi berharga yang biasa digunakan oleh calon pembeli untuk melihat / menilai profile produk, mutu produk, jasa dan kredibilitas pemilik bisnis berdasarkan opini dari pengguna. ulasan biasa dijadikan sebagai alat untuk mengambil keputusan bagi pembeli maupun penjual. Namun, sangat disayangkan ada beberapa orang yang tidak bertanggung jawab memanfaatkannya dengan membuat ulasan yang bersifat menipu untuk mempromosikan atau merusak reputasi sebuah produk atau jasa. Dalam tugas akhir ini, akan digunakan pendekatan supervised learning yang merupakan pendekatan machine learning yang sering digunakan dalam klasifikasi spam. Model yang digunakan, ialah Naive Bayes Classifier dengan ekstraksi fitur n-gram. Dengan membandingkan lima nilai n dalam n-gram didapatkan nilai akurasi tertinggi sebesar 80.44%.

References

[1] J. Krumm, N. Davies, dan C. Narayanaswami, “User-generated content,” IEEE Comput. Soc., 2008.
[2] M. N. I. Ahsan, T. Nahian, A. A. Kafi, M. I. Hossain, dan F. M. Shah, “An ensemble approach to detect review spam using hybrid machine learning technique,” in 2016 19th International Conference on Computer and Information Technology (ICCIT), 2016, hal. 388–394.
[3] N. Jindal dan B. Liu, “Opinion spam and analysis,” in Proceedings of the international conference on Web search and web data mining - WSDM ’08, 2008, hal. 219.
[4] A. Mukherjee, V. Venkataraman, B. Liu, dan N. Glance, “What Yelp Fake Review Filter Might Be Doing?,” Assoc. Adv. Artif. Intell., 2013. [5] D. Streitfeld, “Buy Reviews on Yelp, Get Black Mark,” The New York Times, 2012.
[6] M. Ott, Y. Choi, C. Cardie, dan J. T. Hancock, “Finding Deceptive Opinion Spam by Any Stretch of the Imagination,” in Proceedings ofthe 49th Annual Meeting ofthe Association for Computational Linguistics, 2011, hal. 309–319.
[7] A. Mukherjee, V. Venkataraman, B. Liu, dan N. Glance, “Fake Review Detection: Classification and Analysis of Real and Pseudo Reviews,” Chicago, 2013.
[8] J. O. Cooper, T. E. Heron, dan W. L. Heward, Applied Behavior Analysis, 2nd ed. Edinburgh Gate: Pearson, 2014.
[9] K. P. Murphy, Machine Learning: A Probabilistic Perspective. Massachusetts Institute of Technology, 2012.

Naive Bayes dengan Ekstraksi Fitur N-gram dalam Mendeteksi Spam Ulasan Bahasa Indonesia

Abstract

References

Event Schedule