Professional Documents
Culture Documents
Draft Jurnal Bencana UAS Analisis Media Sosial
Draft Jurnal Bencana UAS Analisis Media Sosial
[Jakarta, Indonesia]
Universitas Budi Luhur 1,
e-mail: 1 2111601957@Student.budiluhur.ac.id,
ABSTRACT
This study aims to analyze Twitter user sentiment related to natural disasters. The data used are tweets containing
keywords related to natural disasters during a certain period. The method used in sentiment analysis is text analysis
using natural language processing techniques and machine learning algorithms. The tweets were classified into three
main sentiment categories: positive, negative and neutral. A performance evaluation of the method was also
conducted to measure the accuracy of the sentiment analysis results. The results of this sentiment analysis provide
insight into Twitter users' views and reactions to natural disasters. This analysis helps in understanding public
perceptions, empathy levels, and responses to specific natural disasters. In addition, factors that influence sentiment,
such as the extent of damage, relief efforts, and news or information circulating, are also explored in this study.This
research has significant potential benefits. The information obtained from sentiment analysis can be used by the
government, disaster management agencies, and the general public to take appropriate actions in mitigating,
recovering, and handling natural disasters. In addition, this research can also serve as a foundation for the
development of better social media sentiment analysis methods in the future.
Keywords: Sentiment analysis, social media, Twitter, natural disasters, natural language processing, machine
learning
ABSTRAK
Penelitian ini bertujuan untuk menganalisis sentimen pengguna Twitter terkait dengan bencana alam. Data yang
digunakan adalah tweet-tweet yang mengandung kata kunci terkait bencana alam selama periode tertentu. Metode
yang digunakan dalam analisis sentimen adalah analisis teks menggunakan teknik pemrosesan bahasa alami dan
algoritma pembelajaran mesin. Tweet-tweet diklasifikasikan ke dalam tiga kategori sentimen utama: positif, negatif,
dan netral. Evaluasi kinerja metode juga dilakukan untuk mengukur keakuratan hasil analisis sentimen. Hasil
analisis sentimen ini memberikan wawasan tentang pandangan dan reaksi pengguna Twitter terhadap bencana alam.
Analisis ini membantu dalam memahami persepsi publik, tingkat empati, dan respons terhadap bencana alam
tertentu. Selain itu, faktor-faktor yang mempengaruhi sentimen, seperti tingkat kerusakan, upaya penanggulangan,
dan berita atau informasi yang beredar, juga dieksplorasi dalam penelitian ini.Penelitian ini memiliki potensi
manfaat yang signifikan. Informasi yang diperoleh dari analisis sentimen dapat digunakan oleh pemerintah, lembaga
penanggulangan bencana, dan masyarakat umum untuk mengambil tindakan yang tepat dalam mitigasi, pemulihan,
dan penanganan bencana alam. Selain itu, penelitian ini juga dapat menjadi landasan untuk pengembangan metode
analisis sentimen media sosial yang lebih baik di masa depan..
Kata Kunci: Analisis sentimen, media sosial, Twitter, bencana alam, pemrosesan bahasa alami, pembelajaran
mesin.
1. PENDAHULUAN
Bencana adalah peristiwa atau rangkaian peristiwa yang mengancam dan mengganggu kehidupan dan penghidupan
masyarakat yang disebabkan, baik oleh faktor alam dan/atau faktor nonalam maupun faktor manusia sehingga
mengakibatkan timbulnya korban jiwa manusia, kerusakan lingkungan, kerugian harta benda, dan dampak
psikologis (BNPB, 2007). Menurut Undang-Undang Republik Indonesia Nomor 24 Tahun 2007 tentang
Penanggulangan Bencana Pasal 21 (Pemerintah Republik Indonesia, 2007, p. 12), Badan Penanggulangan Bencana
Daerah memiliki tugas usaha penanggulangan bencana yang mencakup pencegahan bencana, penanganan
darurat, rehabilitasi, serta rekonstruksi secara adil dan setara. Seperti diketahui bencana sudah menjadi hal yang
acap terjadi di seluruh wilayah Indonesia. Menurut data BNPB, ada 1441 bencana alam yang melanda Indonesia
terhitung dari 1 Januari hingga Juni 2021. Bencana yang sering terjadi diantaranya banjir, puting beliung, tanah
longsor, kebakaran hutan dan lahan, gempa bumi, gelombang pasang dan abrasi, kekeringan dan lain sebagainya.
Terlebih lagi pandemi Covid-19 yang masih melanda. BPBD pun juga berperan menjadi garda terdepan
pencegahan dan penanganan Covid-19. Twitter merupakan platform media sosial yang digunakan penggunanya
untuk berkomunikasi dan menyebarkan informasi berupa tweet. Menurut Kominfo, dari 245 juta penduduk
Indonesia, pengguna internet di Indonesia mencapai 55 juta orang. Ini menjadikan Indonesia sebagai negara
kelima terbesar pengguna Twitter.
Natural Processing Language (NLP) adalah cabang dari Artificial Intelligence yang berhubungan dengan interaksi
antara mesin dan manusia menggunakan bahasa natural. Dalam hal ini memanfaatkan salah satu library python
yaitu TextBlob untuk mengerjakan algoritma text mining. Salah satu metode dari text mining di bidang NLP adalah
dengan pendekatan analisis sentimen. Pendekatan analisis sentimen digunakan untuk menganalisa data berbentuk
opini publik sebagai pendukung pengambilan keputusan. Tugas analisis sentimen adalah mengelompokkan
kumpulan polaritas dari teks yang berada dalam dokumentasi, kalimat atau fitur entitas dengan tingkat aspek
yang bersifat positif, netral atau negatif. (Buntoro, 2017; Fridom Mailo & Lazuardi, 2019; Yasah, 2020).
Berdasarkan uraian di atas, maka penulis akan menerapkan analisis sentimen terhadap penanggulangan bencana,
yang dalam hal ini mengacu pada Badan Penanggulangan Bencana Daerah (BPBD), berdasarkan dari opini
publik dengan kategori positif, netral atau negatif dari media sosial Twitter, dengan menggunakan library Python.
Hasil dari analisis sentimen ini dapat digunakan oleh pengemban tugas penanggulangan bencana untuk
mengevaluasi penanganan bencana yang terjadi agar selanjutnya bisa lebih baik lagi
2.3. Python
Python adalah perangkat lunak open source yang terkenal karena bahasa pemrogramannya yang
dinamis. Dalam penelitian ini, digunakan Python versi 3.9. Terdapat beberapa library yang digunakan
dalam penulisan ini. Untuk menginstal library, dapat menggunakan perintah pip.
2.3.1. Tweepy
Tweepy merupakan library Python yang digunakan untuk mengakses Twitter API dan mengambil data
dari Twitter.
2.3.2. TextBlob
TextBlob merupakan library Python yang digunakan untuk memproses data teks. TextBlob menyediakan
API sederhana untuk tugas Pemrosesan Bahasa Alami (NLP), antara lain pemberian tag kata, ekstraksi
kata benda, analisis sentimen, klasifikasi, terjemahan, dan lainnya (Loria, 2020).
2.3.3. Pandas
Library pandas digunakan untuk manipulasi dan analisis data. Dalam kode ini, pandas digunakan untuk
membaca dan memanipulasi data dari file CSV yang diambil dari Twitter.
2.3.4. Node.js
Node.js adalah platform untuk menjalankan JavaScript di sisi server. Dalam kode ini, Node.js digunakan
untuk menginstal paket tweet-harvest yang digunakan untuk mengambil data dari Twitter.
2.3.5. tweet-harvest:
tweet-harvest adalah sebuah paket Node.js yang digunakan untuk mengambil data dari Twitter. Di kode
ini, tweet-harvest digunakan dengan perintah npx untuk melakukan crawling data Twitter dengan kata
kunci, batasan waktu, dan jumlah yang ditentukan. Hasilnya disimpan dalam file CSV.
2.3.7. Display
Display adalah perintah untuk menampilkan DataFrame dengan menggunakan fungsi display().
2.3.8. len()
Fungsi len() digunakan untuk menghitung jumlah tweet dalam DataFrame.
2.3.9. CSV
CSV (Comma Separated Value) adalah library Python yang digunakan untuk menyimpan data dalam
format ".csv".
Pada penelitian ini, metode penelitian akan dilakukan seperti pada Gambar 1.
Pengambilan data
API
Pemrosesan Data
Hapus retweet
3.3. Visualisasi Data Data bersih kemudian ditampilkan dalam bentuk histogram, diagram lingkaran dan
word cloud.
Setelah berhasil mengumpulkan tweet, langkah selanjutnya adalah memproses data tersebut. Pertama, dilakukan pra-
pemrosesan data untuk membersihkan data yang diambil. Pra-pemrosesan ini melibatkan langkah-langkah seperti
menghapus mentions (@), hashtag (#), retweet (RT), dan URL yang ada dalam tweet. Tujuan dari pra-pemrosesan
ini adalah untuk memperbaiki validitas data yang diambil, sehingga diharapkan data sentimen yang diperoleh sesuai
dengan hasil yang dibutuhkan. Selanjutnya, data tweet akan diubah ke dalam bahasa Inggris menggunakan perintah
translate(to="en")
Setelah proses penerjemahan, dilakukan analisis sentimen menggunakan metode analysis.sentiment.polarity. Jika
nilai polaritas lebih besar dari 0, maka sentimen tersebut dianggap positif. Jika nilai polaritas sama dengan 0, maka
sentimen dianggap netral. Sedangkan jika nilai polaritas lebih kecil dari 0, maka sentimen dianggap negatif.
Dari 204 tweet yang diambil, dan dilakukan analisis, twit terdiri dari 40 tweet positif, 129 tweet netral dan 35 tweet
negatif. Gambar 3. Jumlah masing-masing sentimen Apabila ditampilkan dalam bentuk persentase sejumlah 19,61
% tweet positif, 17.16 % tweet negatif dan 63,23 % tweet positif.
Dengan memanfaatkan library Matplotlib, data tersebut ditampilkan dalam bentuk histogram, dengan masing-
masing kategori positif, netral dan negatif seperti pada Gambar 4.
Selain dalam bentuk histogram, hasil analisis sentimen juga ditampilkan dalam bentuk diagram lingkaran atau
pie chart seperti pada Gambar 5
Gambar 5. Pie Chart hasil analisis sentimen
5.2 Saran:
Dalam penelitian ini, pengambilan data menggunakan TextBlob untuk memproses data dalam tahap text
mining dan klasifikasi sentimen. Namun, TextBlob hanya dapat memproses data dalam bahasa Inggris.
Pengambilan data pada penelitian ini menggunakan bahasa Indonesia dan kemudian diterjemahkan
kembali ke bahasa Inggris sebelum dilakukan proses klasifikasi. Namun, hasil yang diperoleh dalam
penelitian ini masih belum maksimal.
DAFTAR PUSTAKA
Bao, J., Zheng, L., & Chen, S. (2017). Large-scale social media data analysis for disaster management.
IEEE Transactions on Engineering Management, 64(2), 180-193.
Castillo, C., Mendoza, M., & Poblete, B. (2011). Information credibility on Twitter. In Proceedings of the
20th International Conference on World Wide Web (pp. 675-684). ACM.
Imran, M., Elbassuoni, S. M., Castillo, C., Diaz, F., & Meier, P. (2013). Extracting information nuggets
from disaster-Related messages in social media. In Proceedings of the 10th International
ISCRAM Conference.
Olteanu, A., Castillo, C., Diaz, F., & Vieweg, S. (2015). CrisisLex: A lexicon for collecting and filtering
microblogged communications in crises. In Proceedings of the 8th International Conference on
Weblogs and Social Media.
Sakaki, T., Okazaki, M., & Matsuo, Y. (2010). Earthquake shakes Twitter users: Real-time event detection
by social sensors. In Proceedings of the 19th International Conference on World Wide Web (pp.
851-860). ACM.
Cheng, Z., Caverlee, J., & Lee, K. (2010). You are where you tweet: A content-based approach to geo-
locating Twitter users. In Proceedings of the 19th ACM International Conference on Information
and Knowledge Management (pp. 759-768). ACM.
Mislove, A., Lehmann, S., Ahn, Y. Y., Onnela, J. P., & Rosenquist, J. N. (2011). Understanding the
demographics of Twitter users. In Proceedings of the 5th International AAAI Conference on
Weblogs and Social Media.
Tumasjan, A., Sprenger, T. O., Sandner, P. G., & Welpe, I. M. (2010). Predicting elections with Twitter:
What 140 characters reveal about political sentiment. In Proceedings of the 4th International
AAAI Conference on Weblogs and Social Media.