Text Processing Clustering dalam Menentuan Profesi Berdasarkan Data Twitter

Elisabet Sihite; Rima Dias Ramadhani; Muhammad Zidny Naf’an; Rifki Adhitama

Elisabet Sihite Institut Teknologi Telkom Purwokerto
Rima Dias Ramadhani Institut Teknologi Telkom Purwokerto
Muhammad Zidny Naf’an Institut Teknologi Telkom Purwokerto
Rifki Adhitama Institut Teknologi Telkom Purwokerto

Keywords: Twitter, Text Processing, Clustering, Algoritma Nazief & Adriani, TF-IDF

Abstract

Saat ini akibat jumlah data yang semakin besar, twitter tidak hanya digunakan untuk menulis pesan microblogging melainkan juga untuk melakukan penemuan pengetahuan untuk menyelidiki fenomena yang terjadi di kehidupan masyarakat. Salah satu fenomena yang terjadi di kehidupan sosial masyarakat adalah
pemilihan pekerjaan yang tidak sesuai kemampuan dan keahlian. Dampak buruk dapat terjadi pada perusahaan dan pegawai yang tidak memilih pekerjaan yang sesuai dengan keahlian dan kemampuan yang dimilikinya seperti kerugian besar pada perusahaan dan timbulnya tingkat stress yang tinggi yang tidak menutup kemungkinan timbulnya penyakit yang membahayakan pada pegawai yang tidak memilih pekerjaan sesuai dengan kemampuan dan keahliannya. Terdapat beberapa solusi yang ditawarkan untuk meminimalisir dampak negatif pada pegawai dan perusahaan. Salah satu teknik yang digunakan untuk menyelidiki fenomena yang terjadi dengan menggunakan metode clustering. Pada tahap pengelompokan (clustering) perlu dilakukan text processing hal ini dikarenakan tahapan preprocessing menjadi salah satu penentu untuk menghasilkan nilai keakuratan yang maksimal dan terbaik untuk suatu pengujian metode clustering. Melalui text processing yang telah dilakukan diketahui jika text processing harus dilakukan secara maksimal untuk dapat mencapai nilai keakuratan yang baik pada perancangan dan pengujian metode clustering. Tahapan text processing yang dilakukan dalam hal ini adalah Cleansing, Normalisasi, Transform Case, Stemming, Stop Word dan Tokenize.

References

[1] C. Chen et al., “Investigating the deceptive information in Twitter spam,” Futur. Gener. Comput. Syst., vol. 72, pp. 319–326, 2017.
[2] M. N. M. Klinczak dan C. A. A. Kaestner, “A study on topics identification on Twitter using clustering algorithms,” 2015 Latin-America Congr. Comput. Intell. LA-CCI 2015, 2016.
[3] M. Choi,, Y. Sang,, dan H. Park.”Exploring political discussions by Korean Twitter users: A look at opinion leadership dan homophily phenomenon,”
[4] J. PAN, X. QIN, dan G. G. LIU, “The impact of body size on urban employment: Evidence from China,” China Econ. Rev., vol. 27, pp. 249–263, 2013.
[5] N. Y. Lee, Y. Kim, dan Y. Sang, “How do journalists leverage Twitter? Expressive dan consumptive use of Twitter,” Soc. Sci. J., 2015.
[6] Z. Megri, “The Impact of Talent Management System on the Enterprise Performance: a Study on a Sample of Workers in National Company of Juice dan Cannedfood Unit MANAA (Batna),” Arab Econ. Bus. J., vol. 9, no. 2, pp. 156–165, 2014.
[7] Y. Chen, B. McCabe, dan D. Hyatt, “Impact of individual resilience dan safety climate on safety
[8] L. Lazuras dan A. Dokou, “Mental health professionals’ acceptance of online counseling,” Technol. Soc., vol. 44, pp. 10–14, 2016.
[9] Q. Wang, “Coaching for Learning: Exploring Coaching Psychology in Enquiry-based Learning dan Development of Learning Power in Secondary Education,” Procedia - Soc. Behav. Sci., vol. 69, no. Iceepsy, pp. 177–186, 2012.
[10] F. Gorunescu, Data Mining : Concepts, Model dan Techniques, New York: Springer-Verlag, 2011.
[11] A. S. Tahirsylaj, “Stimulating creativity dan innovation through Intelligent Fast Failure,” Think. Ski. Creat., vol. 7, no. 3, pp. 265–270, 2012.
[12] K. Singh, H. K. Shakya, dan B. Biswas, “Clustering of people in social network based on textual similarity,” Perspect. Sci., vol. 8, pp. 570–573, 2016.
[13] F. Goronescu, Data Mining : Concepts, Model dan Techniques, New York : Springer-Verlag, 2011.
[14] D. J. Suri and K. K. Purnamasari, “Perbandingan Seleksi Fitur Untuk Klasifikasi Sentimen SVM Pada Twitter.”
[15] L. Agusta, U. Kristen, and S. Wacana, “PERBANDINGAN ALGORITMA STEMMING PORTER DENGAN ALGORITMA NAZIEF & ADRIANI UNTUK STEMMING DOKUMEN TEKS BAHASA INDONESIA,” pp. 196–201, 2009.

Text Processing Clustering dalam Menentuan Profesi Berdasarkan Data Twitter

Abstract

References

Event Schedule