PRA-PEMROSESAN TEKS PADA GRUP WHATSAPP UNTUK PEMODELAN TOPIK

Authors

  • Maya Cendana Universitas Trilogi
  • Silvester Dian Handy Permana Universitas Trilogi

Abstract

Fasilitas grup chat yang terdapat pada WhatsApp memungkinkan pengguna untuk saling berkomunikasi dalam kelompok yang diminatinya. Semakin banyak dan aktif sebuah grup WhatsApp maka akan meningkatkan jumlah pesan yang dikirimkan di dalam grup. Hal ini dapat memicu keinginan pengguna untuk mengetahui makna ataupun pola tersembunyi yang terdapat di dalam grup tersebut. Oleh karena itu, penelitian dibidang text mining, terutama natural language programming (NLP) menjadi semakin populer. Salah satunya adalah analisis data chat yang dapat menghasilkan informasi topik yang sering dibicarakan di dalam grup WhatsApp, terutama bagi pengguna yang tidak memiliki banyak waktu untuk membaca chat di dalam grup, ataupun jika grup tersebut merupakan grup diskusi, maka topik utama diskusi dapat diperoleh melalui teknik pemodelan topik. Tahapan penelitian yang dilalui adalah (1) pra-pemrosesan data, (2) pemrosesan teks menggunakan model atau algoritma tertentu, (3) analisis hasil, dan (4) evaluasi. Pada penelitian tahap awal ini akan dilakukan studi pendahuluan dan pra-pemrosesan data menggunakan bahasa pemrograman python yang mencakup proses tokenisasi, filtering dan stemming. Prototipe pra-pemrosesan data ini diharapkan dapat digunakan untuk kasus berbeda dengan data input chat-log Whatsapp. Aturan-aturan bahasa, terutama bahasa gaul atau bahasa alay yang nantinya ditemukan di dalam studi kasus chat-log grup WhatsApp diharapkan juga dapat memperkaya korpus Bahasa Indonesia.

 

Author Biographies

Maya Cendana, Universitas Trilogi

Universitas Trilogi

Silvester Dian Handy Permana, Universitas Trilogi

Universitas Trilogi

References

Statista. Most Popular Mobile Messaging Apps Worldwide As Of July 2018, Based On Number Of Monthly Active Users (In Millions). Sumber: https://www.statista.com/statistics/258749/most-popular-global-mobile-messenger-apps/

Statista. WhatsApp Has 600m Users Now. Sumber: https://www.statista.com/chart/2614/monthly-active-whatsapp-users-worldwide/

We are Social. Global Digital Report 2018. Sumber: https://digitalreport.wearesocial.com

Tanjum Kamboj dan Manoj Dayal. 2015. Usage of Instant Messaging Application on Smartphones among Youths: A study of Uses and Gratification of WhatsApp. URL: https://www.academia.edu/28203254/WhatsApp_Research_Paper.pdf

Statista. To how many WhatsApp groups do you think to belong to and to how many do you actually belong to?. Sumber: https://www.statista.com/statistics/664440/number-of-whatsapp-groups-among-millennials-italy/

Forbes. How To Run A Successful WhatsApp Group. Sumber: https://www.forbes.com/sites/paularmstrongtech/2018/04/29/how-to-run-a-successful-whatsapp-group/#66e050476364

WhatsAnalyzer. Sumber: https://whatsanalyzer.informatik.uni-wuerzburg.de

ChatVisualizer. Sumber: https://chatvisualizer.com

Pragna Debnath, Saniul Haque, Somprakash Bandyopandhyay, Siuli Roy. 2016. Post-disaster Situational Analysis from WhatsApp Group Chats of Emergency Response Providers. Proeedings of the ISCRAM 2016 Conference. Brazil: Rio de Janeiro.

R. Jayaparvathy . 2016. Analysis on Social Media Addiction using Data Mining Technique. International Journal of Computer Applications. Vol. 139. No. 7. Hal: 23-26.

Avi Rosenfeld, Sigan Sina, David Sarne, Or Avidov, Sarit Kraus. 2016. WhatsApp Usage Patterns and Prediction Models. ICWSM/IUSSP Workshop on Social Media and Demographic Research.

C. Premalatha, S. Jansi Rani. 2017. Sentimental Analysis of WhatsApp Data Using Data Analytics Techniques. Journal of Data Mining and Management. Vol 2. Issue 3. Hal: 1-6.

Abhishek Soni. Introduction to Text Mining in WhatsApp Chats using Python-Part 1, https://www.zeolearn.com/magazine/introduction-to-text-mining-in-whatsapp-chats-using-python-part-1

Amjad Karim. Whatsapp-(ening!) Text Analytics with a WhatsApp message Log. https://d-science.com/articles/whatsapp-ening-text-analytics-with-a-whatsapp-message-log/

Yashodhan Joglekar. Analysing WhatsApp messages with Python and Tableau, https://databulary.net/2016/07/04/analysing-whatsapp-messages/

Sanchita Patil. 2016. WhatsApp Group Data analysis with R. International Journal of Computer Applications. Vol. 154. No. 4. Hal: 31-36.

I Made Kusnanta Bramantya Putra, Renny Pradina Kusumawardani . 2017. Analisis Topik Informasi Publik Media Sosial di Surabaya Menggunakan Pemodelan Latent Dirichlet Allocation (LDA). Jurnal Teknik ITS. Vol. 6. No. 2. Hal: 11-16.

Agung Priyanto, Muhammad Rifqi Ma’arif. 2018. Implementasi Web Scraping dan Text Mining untuk Akuisisi dan Kategorisasi Informasi Laman Web Tentang Hidroponik. Indonesia Journal of Information Systems. Vol. 1. No. 1. Hal: 25-33.

Alfian Futuhul Hadi, Dimas Bagus C. W., Moh. Hasan. 2017. Text Mining pada Media Sosial Twitter. Studi Kasus: Masa Tenang Pilkada Dki 017 Putaran 2. Seminar Nasional Matematika dan Aplikasinya. Surabaya: Universitas Airlangga.

David M. Blei. 2012. Probabilistic Topic Model. Communications of the ACM. Vol. 55. No. 4. Hal: 77-84.

David M. Blei. 2003. Latent Dirichlet Allocation. Journal of Machine Learning Research. Vol. 3. Hal: 993-1022.

Matthew J. Denny dan Arthur Spirling. 2017. Text Preprocessing for Unsupervised Learning: Why it Matters, When it Misleads, and What to Do About it. https://doi.org/10.7910/DVN/XRR0HM, Harvard Dataverse, V1.

Jonathan Chang, Jordan Boyd-Graber, Chong Wang, Sean Gerrish, dan David M. Blei. 2009. Reading Tea Leaves: How Humans Interpret Topic Models. Proceedings of the 22nd International Conference on Neural Information Processing Systems. Hal: 288-296

Zhou Tong dan Haiyi Zhang. 2016. A Text Mining Research Based on LDA Topic Modelling. Computer Science and Information Technologi. Hal: 201-210

Downloads

Published

2019-12-18