Pengelompokan Teks Berita Utama dengan Metode LDA (Latent Dirichlet Allocation) melalui Pemahaman Pemodelan Topik

  • Ilham Fadhilah Akbar Institut Teknologi Telkom Purwokerto
  • Tri Ginanjar Laksana Institut Teknologi Telkom Purwokerto
  • Amalia Beladinna Arifa Institut Teknologi Telkom Purwokerto
  • Mario Rudy Silalahi Institut Teknologi Telkom Purwokerto
Keywords: Pemodelan Topik, Topik Berita Utama, Latent Dirichlet Allocation (LDA)

Abstract

Berkembangnya teknologi informasi saat ini telah mengubah cara berita dan media disebarkan secara online, dengan perusahaan-perusahaan menggunakan teknologi ini untuk menyebarkan berita dan konten media. Namun, dengan meningkatnya jumlah berita di platform media online, masyarakat seringkali kesulitan memahami gambaran umum tentang topik utama dalam berita tersebut. Oleh karena itu, penelitian ini menerapkan konsep Topic Modeling, suatu metode yang memungkinkan ekstraksi konteks yang mewakili isi dokumen melalui analisis statistik pada kumpulan besar teks. Metode yang diterapkan pada penelitian ini adalah Latent Dirichlet Allocation (LDA), yang memungkinkan analisis topik yang tersembunyi dalam dokumen besar. Hasil analisis menunjukkan bahwa koherensi topik tertinggi adalah 0.57522 melalui berbagai percobaan dengan jumlah topik yang berbeda, dan model topik dengan lima topik telah ditentukan. Kelima topik ini masing-masing membahas pemain dalam klub sepak bola, sejarah pemain di Premier League, potret dramatis pemain dalam NBA dan sepak bola, pemain Liverpool dalam Liga Champions, dan pemain gelandang Jerman di klub Bayern Munchen. Temuan ini menggambarkan bahwa berita utama dalam kelompok teks ini fokus pada topik sepak bola dan basket, dengan penekanan lebih kuat pada sepak bola sebagai subkategori olahraga. Penggunaan berbagai batasan jumlah topik dalam analisis memberikan hasil yang optimal dan menghasilkan model topik yang lebih bermakna.

References

Asosiasi Penyelenggara Jasa Internet Indonesia, “Laporan Survei Internet APJII 2019 – 2020,” vol. 2020, pp. 1–146, 2020, [Online]. Available: https://apjii.or.id/survei

B. A. Romadhoni, “Meredupnya Media Cetak, Dampak Kemajuan Teknologi Informasi,” An-Nida J. Komun. Islam, vol. 10, no. 1, 2019, doi: 10.34001/an.v10i1.741.

B. Subeno, “Optimization Number of Topic Latent Dirichlet Allocation,” 2017.

J. C. Campbell, A. Hindle, and E. Stroulia, “Latent Dirichlet Allocation: Extracting Topics from Software Engineering Data,” Art Sci. Anal. Softw. Data, vol. 3, pp. 139–159, 2015, doi: 10.1016/B978-0-12-411519-4.00006-9.

S. Yang, “Text Mining of Twitter Data Using a Latent Dirichlet Allocation Topic Model and Sentiment Analysis,” Int. J. Comput. Inf. Eng., vol. 12, no. 7, pp. 525–529, 2018.

I. N. Kabiru and P. K. Sari, “Analisa Konten Media Sosial E-commerce Pada Instagram Menggunakan Metode Sentiment Analysis Dan Lda-based Topic Modeling (studi Kasus: Shopee Indonesia),” eProceedings Manag., vol. 6, no. 1, pp. 12–19, 2019, [Online]. Available: https://openlibrarypublications.telkomuniversity.ac.id/index.php/management/article/view/8498

F. S. Jumeilah, “Penerapan Support Vector Machine (SVM) untuk Pengkategorian Penelitian,” J. RESTI (Rekayasa Sist. dan Teknol. Informasi), vol. 1, no. 1, pp. 19–25, 2017, doi: 10.29207/resti.v1i1.11.

B. H. Prakoso, “Pengaruh Preprocessing Data pada Metode SVR dalam Memprediksi Permintaan Obat,” J. Sist. Teknol. Inf. Indones., vol. 2, no. 2, pp. 92–99, 2017.

M. Z. Naf’an, A. Burhanuddin, and A. Riyani, “Penerapan Cosine Similarity dan Pembobotan TF-IDF untuk Mendeteksi Kemiripan Dokumen,” J. Linguist. Komputasional, vol. 2, no. 1, pp. 23–27, 2019.

B. H. Puspita, M. Muhajir, and H. Aliady, “Topic Modeling Using Latent Dirichlet Allocation (LDA) and Sentiment Analysis for Marketing Planning Tiket.com,” vol. 474, no. Isstec 2019, pp. 16–22, 2020, doi: 10.2991/assehr.k.201010.004.

Published
2024-01-31
How to Cite
Akbar, I., Laksana, T., Arifa, A., & Silalahi, M. (2024). Pengelompokan Teks Berita Utama dengan Metode LDA (Latent Dirichlet Allocation) melalui Pemahaman Pemodelan Topik. Proceedings of the National Conference on Electrical Engineering, Informatics, Industrial Technology, and Creative Media, 3(1), 475 - 484. Retrieved from https://conferences.ittelkom-pwt.ac.id/index.php/centive/article/view/196