Pemodelan Topik dalam Al-Qur'an Menggunakan Library Bertopic pada Model Bahasa Bert


Abstract


Al-Qur'an adalah kitab suci dalam agama Islam yang terdiri dari 114 surah dan 6236 ayat. Isi Al-Qur'an telah dikategorikan ke dalam berbagai kategori oleh para ulama besar dari seluruh dunia, termasuk hukum, adat (perang), kenikmatan, sejarah, dan kehidupan setelah kematian. Namun, apakah pembagian ini sesuai dengan apa yang dikatakan dalam Al-Qur'an? Beberapa negara juga berusaha untuk mencari isu-isu yang terkandung dalam Al-Qur'an, dan ada banyak perbedaan dalam topik yang muncul dari satu negara ke negara lain. Berdasarkan studi ini, para peneliti mencoba untuk melihat isi Al-Qur'an dengan menerapkan pendekatan metode Deep Learning dengan menggunakan Library model bahasa BERT (Bidirectional Encoder Representations from Transformers), khususnya BERTopic, untuk seluruh 6236 ayat Al-Qur'an sebagai dataset. Berdasarkan penelitian ini ditemukan setidaknya ada 8 topik yang banyak dibahas didalam Al-quran.

Keywords


model bahasa; BERTopic; pemodelan topik; qur’an

Teks Lengkap:

PDF

Referensi


[1] Achmad Chodjim, al-Fatihah. Jakarta, 2017.

[2] E. Agustina, “Kajian Referensi Ayat-Ayat Al Qurâ€TMan Dalam Skripsi Mahasiswa Pendidikan Biologi Fakultas Tarbiyah Dan Keguruan Uin Ar-Raniry,” Biot. J. Ilm. Biol. Teknol. dan Kependidikan, vol. 3, no. 1, p. 69, 2017, doi: 10.22373/biotik.v3i1.994.

[3] S. Sunarsa, “Teori Tafsir,” Al-Afkar, vol. 2, no. 1, pp. 248–260, 2019, doi: 10.5281/zenodo.2561512.

[4] M. I. Helmy, “Kesatuan Tema dalam Al-Qur’an,” Ilmu Ushuludddin, vol. 19, no. 2, 2020, doi: 10.18592/jiiu.v.

[5] F. Rahman, Tema-Tema Pokok Al Qur’an. Bandung: Mizan Media Utama, 2017.

[6] S. Nath, A. Marie, S. Ellershaw, E. Korot, and P. A. Keane, “New meaning for NLP: the trials and tribulations of natural language processing with GPT-3 in ophthalmology,” Br. J. Ophthalmol., vol. 106, no. 7, pp. 889–892, 2022, doi: 10.1136/bjophthalmol-2022-321141.

[7] J. Devlin, M. W. Chang, K. Lee, and K. Toutanova, “BERT: Pre-training of deep bidirectional transformers for language understanding,” NAACL HLT 2019 - 2019 Conf. North Am. Chapter Assoc. Comput. Linguist. Hum. Lang. Technol. - Proc. Conf., vol. 1, pp. 4171–4186, 2019.

[8] A. Nagpal and G. Gabrani, “Python for Data Analytics, Scientific and Technical Applications,” in 2019 Amity International Conference on Artificial Intelligence (AICAI), 2019, pp. 140–145, doi: 10.1109/AICAI.2019.8701341.

[9] M. Grootendorst, “BERTopic: Neural topic modeling with a class-based TF-IDF procedure,” 2022, [Online]. Available: http://arxiv.org/abs/2203.05794.

[10] T. Wolf et al., “Transformers : State-of-the-Art Natural Language Processing,” pp. 38–45, 2020.

[11] M. Usama et al., “Unsupervised Machine Learning for Networking: Techniques, Applications and Research Challenges,” IEEE Access, vol. 7, pp. 65579–65615, 2019, doi: 10.1109/ACCESS.2019.2916648.

[12] M. Andika, L. Chaerani, K. K. Data, L. D. Allocation, M. Online, and P. Topik, “Pemodelan Topik Berita pada Portal Berita Online Berbahasa Indonesia Menggunakan Latent Dirichlet Allocation (LDA),” J. Ilm. Komputasi, vol. 20, no. 2, pp. 173–180, 2021, doi: 10.32409/jikstik.20.2.2719.

[13] W. Wahyudin, “APLIKASI TOPIC MODELING PADA PEMBERITAAN PORTAL BERITA ONLINE SELAMA MASA PSBB PERTAMA,” Semin. Nas. Off. Stat., vol. 2020, no. 1, pp. 309–318, Jan. 2020, doi: 10.34123/SEMNASOFFSTAT.V2020I1.579.

[14] C. Naury, D. H. Fudholi, and A. F. Hidayatullah, “Topic Modelling pada Sentimen Terhadap Headline Berita Online Berbahasa Indonesia Menggunakan LDA dan LSTM,” J. MEDIA Inform. BUDIDARMA, vol. 5, no. 1, pp. 24–33, Jan. 2021, doi: 10.30865/MIB.V5I1.2556.

[15] S.-A. N. Alexandropoulos, S. B. Kotsiantis, and M. N. Vrahatis, “Data preprocessing in predictive data mining,” Knowl. Eng. Rev., vol. 34, p. e1, 2019, doi: 10.1017/S026988891800036X.

[16] F. A. Muttaqin and A. M. Bachtiar, “Implementasi Teks Mining Pada Aplikasi Pengawasan Penggunaan Internet Anak ‘Dodo Kids Browser,’” J. Ilm. Komput. dan Inform., pp. 1–8, 2016.

[17] A. B. Dieng, F. J. R. Ruiz, and D. M. Blei, “Topic Modeling in Embedding Spaces,” Trans. Assoc. Comput. Linguist., vol. 8, pp. 439–453, 2020, doi: 10.1162/tacl_a_00325.




DOI: https://doi.org/10.24176/simet.v14i2.9900

Article Metrics

Abstract views : 178| PDF views : 264

Refbacks

  • Saat ini tidak ada refbacks.


free hit counter View My Stats

Indexed by:

Dimensions logo

 

Flag Counter

Creative Commons License
Simetris : Jurnal Teknik Mesin, Elektro dan Ilmu Komputer is licensed under a Creative Commons Attribution 4.0 International License.

Dedicated to: