PENINGKATAN AKURASI TOPIC MODELING PADA KINERJA KEPOLISIAN REPUBLIK INDONESIA DI TWITTER MENGGUNAKAN ALGORITMA SPELL CHECKER

Isra Andika Bakhri - [ https://orcid.org/0000-0002-9879-8668 ]
Rifqi Mulyawan
Nurfajri Asfa
Ema Utami
Agus Fatkhurohman

Abstract


Kinerja polisi republik Indonesia saat ini menjadi soratan terutama munculnya banyak komentar dari netizen terutama di Twitter dengan diramaikannya hashtag #percumalaporpolisi dan #1hari1oknum. Hal ini mesti direspon cepat oleh kepolisian republik indonesia untuk melakukan counter issue dengan pertama-tama menggali topik tersembunyi dari sekian banyak tweet yang beredar salah satu caranya yaitu menerapkan topic modeling pada Twitter. Dalam rangka memetakan issue atau topik yang akan dibenahi menurut padangan publik terlebih dahulu. Salah satu kelemahan penerapan topic modeling ialah adanya typo maupun singkatan disengaja yang dapat menggangu keakuratan model yang akan dibangun. Maka penting diterapkannya peningkatan perbaikan teks tweet yang diakuisisi sebelum dimasukkan ke dalam model. Normalisasi teks dapat dikaloborasikan dengan algoritma spell checker yang dapat membantu menormalkan typo dan singkatan yang disengaja untuk membantu meningkatkan akurasi model. Penerapan algoritma spell cheker terbukti mampu meningkatkan akurasi model yang mengakibatkan topik yang dihasilkan sebelum dan sesudah diterapkan spell checker berbeda, ditandai dengan tidak ditemukannya lagi singkatan atau typo pada term yang diolah oleh LDA.

Keywords


topic modeling; LDA; spell checker; teorema bayesian; normalisasi teks; text mining

Teks Lengkap:

PDF

Referensi


[1] D. Ramamonjisoa, “Topic Modeling On Users ’ S Comments,” Pp. 177–180, 2014.

[2] S. Tan Et Al., “Interpreting The Public Sentiment Variations On Twitter,” Vol. 26, No. 5, Pp. 1158–1170, 2014.

[3] Z. Jiang And X. Zhou, “Using Link Topic Model To Analyze Traditional Chinese Medicine Clinical Symptom-Herb Regularities,” Pp. 15–18, 2012.

[4] M. J. Paul And M. Dredze, “You Are What You Tweet : Analyzing Twitter For Public Health,” Pp. 265–272, 2011.

[5] B. Chen, L. Zhu, D. Kifer, And D. Lee, “What Is An Opinion About ? Exploring Political Standpoints Using Opinion Scoring Model,” Pp. 1007–1012.

[6] R. Cohen And D. Ruths, “Classifying Political Orientation On Twitter : It ’ S Not Easy !,” Pp. 91–99, 2012.

[7] B. O. Connor, N. A. Smith, And E. P. Xing, “A Latent Variable Model For Geographic Lexical Variation,” 2008.

[8] M. Cristani, A. Perina, U. Castellani, And D. Informatica, “Geo-Located Image Analysis Using Latent Representations,” 2008.

[9] M. Gethers And D. Poshyvanyk, “Using Relational Topic Models To Capture Coupling Among Classes In Object-Oriented Software Systems,” 2010.

[10] H. U. Asuncion, A. U. Asuncion, And R. N. Taylor, “Software Traceability With Topic Modeling,” Pp. 95–104, 2010.

[11] N. I. V. K. Jovita Angela, “Pandemi Covid-19 Bagi Penerapan Inovasi Di Indonesia: Analisis Penambangan Teks Berita Dengan Model Topik Latent Dirichlet Allocation,” Ugm, 2021.

[12] Y. A. W. Damawan Bayu Aji, “Analisis Ulasan Pelanggan Dalam Penerapan M-Payment Di Industri E-Commerce,” Ugm, 2019.

[13] R. Sistem, Y. Sahria, And D. H. Fudholi, “Jurnal Resti Analisis Topik Penelitian Kesehatan Di Indonesia Menggunakan Metode,” Vol. 1, No. 10, Pp. 336–344, 2021.

[14] H. Jelodar, Y. Wang, C. Yuan, X. Feng, X. Jiang, And Y. Li, “Latent Dirichlet Allocation ( Lda ) And Topic Modeling : Models , Applications , A Survey,” Pp. 15169–15211, 2019.

[15] A. Krouska, C. Troussas, And M. Virvou, “The Effect Of Preprocessing Techniques On Twitter Sentiment Analysis.”

[16] M. Maybury, “New Direction In Question Answering,” Aaai Press. Mit Press, 2004.

[17] J. C. Campbell, A. Hindle, And E. Stroulia, “Latent Dirichlet Allocation: Extracting Topics From Software Engineering Data,” Art Sci. Anal. Softw. Data, Vol. 3, Pp. 139–159, 2015, Doi: 10.1016/B978-0-12-411519-4.00006-9.

[18] D. Blei, L. Carin, And D. Dunson, “Probabilistic Topic Models,” Ieee Signal Process. Mag., Vol. 27, No. 6, Pp. 55–65, 2010, Doi: 10.1109/Msp.2010.938079.

[19] K. Wang, “Panet : Few-Shot Image




DOI: https://doi.org/10.24176/simet.v13i1.7186

Article Metrics

Abstract views : 222| PDF views : 75

Refbacks

  • Saat ini tidak ada refbacks.


free hit counter View My Stats

Indexed by:

Dimensions logo

 

Flag Counter

Creative Commons License
Simetris : Jurnal Teknik Mesin, Elektro dan Ilmu Komputer is licensed under a Creative Commons Attribution 4.0 International License.

Dedicated to: