Download as docx, pdf, or txt
Download as docx, pdf, or txt
You are on page 1of 9

Analisis Sentimen Twitter terhadap Bencana di Indonesia

Baihaqi Yogie Prasetyo1,

[Jakarta, Indonesia]
Universitas Budi Luhur 1,

e-mail: 1 2111601957@Student.budiluhur.ac.id,

ABSTRACT

This study aims to analyze Twitter user sentiment related to natural disasters. The data used are tweets containing
keywords related to natural disasters during a certain period. The method used in sentiment analysis is text analysis
using natural language processing techniques and machine learning algorithms. The tweets were classified into three
main sentiment categories: positive, negative and neutral. A performance evaluation of the method was also
conducted to measure the accuracy of the sentiment analysis results. The results of this sentiment analysis provide
insight into Twitter users' views and reactions to natural disasters. This analysis helps in understanding public
perceptions, empathy levels, and responses to specific natural disasters. In addition, factors that influence sentiment,
such as the extent of damage, relief efforts, and news or information circulating, are also explored in this study.This
research has significant potential benefits. The information obtained from sentiment analysis can be used by the
government, disaster management agencies, and the general public to take appropriate actions in mitigating,
recovering, and handling natural disasters. In addition, this research can also serve as a foundation for the
development of better social media sentiment analysis methods in the future.
Keywords: Sentiment analysis, social media, Twitter, natural disasters, natural language processing, machine
learning

ABSTRAK

Penelitian ini bertujuan untuk menganalisis sentimen pengguna Twitter terkait dengan bencana alam. Data yang
digunakan adalah tweet-tweet yang mengandung kata kunci terkait bencana alam selama periode tertentu. Metode
yang digunakan dalam analisis sentimen adalah analisis teks menggunakan teknik pemrosesan bahasa alami dan
algoritma pembelajaran mesin. Tweet-tweet diklasifikasikan ke dalam tiga kategori sentimen utama: positif, negatif,
dan netral. Evaluasi kinerja metode juga dilakukan untuk mengukur keakuratan hasil analisis sentimen. Hasil
analisis sentimen ini memberikan wawasan tentang pandangan dan reaksi pengguna Twitter terhadap bencana alam.
Analisis ini membantu dalam memahami persepsi publik, tingkat empati, dan respons terhadap bencana alam
tertentu. Selain itu, faktor-faktor yang mempengaruhi sentimen, seperti tingkat kerusakan, upaya penanggulangan,
dan berita atau informasi yang beredar, juga dieksplorasi dalam penelitian ini.Penelitian ini memiliki potensi
manfaat yang signifikan. Informasi yang diperoleh dari analisis sentimen dapat digunakan oleh pemerintah, lembaga
penanggulangan bencana, dan masyarakat umum untuk mengambil tindakan yang tepat dalam mitigasi, pemulihan,
dan penanganan bencana alam. Selain itu, penelitian ini juga dapat menjadi landasan untuk pengembangan metode
analisis sentimen media sosial yang lebih baik di masa depan..

Kata Kunci: Analisis sentimen, media sosial, Twitter, bencana alam, pemrosesan bahasa alami, pembelajaran
mesin.
1. PENDAHULUAN
Bencana adalah peristiwa atau rangkaian peristiwa yang mengancam dan mengganggu kehidupan dan penghidupan
masyarakat yang disebabkan, baik oleh faktor alam dan/atau faktor nonalam maupun faktor manusia sehingga
mengakibatkan timbulnya korban jiwa manusia, kerusakan lingkungan, kerugian harta benda, dan dampak
psikologis (BNPB, 2007). Menurut Undang-Undang Republik Indonesia Nomor 24 Tahun 2007 tentang
Penanggulangan Bencana Pasal 21 (Pemerintah Republik Indonesia, 2007, p. 12), Badan Penanggulangan Bencana
Daerah memiliki tugas usaha penanggulangan bencana yang mencakup pencegahan bencana, penanganan
darurat, rehabilitasi, serta rekonstruksi secara adil dan setara. Seperti diketahui bencana sudah menjadi hal yang
acap terjadi di seluruh wilayah Indonesia. Menurut data BNPB, ada 1441 bencana alam yang melanda Indonesia
terhitung dari 1 Januari hingga Juni 2021. Bencana yang sering terjadi diantaranya banjir, puting beliung, tanah
longsor, kebakaran hutan dan lahan, gempa bumi, gelombang pasang dan abrasi, kekeringan dan lain sebagainya.
Terlebih lagi pandemi Covid-19 yang masih melanda. BPBD pun juga berperan menjadi garda terdepan
pencegahan dan penanganan Covid-19. Twitter merupakan platform media sosial yang digunakan penggunanya
untuk berkomunikasi dan menyebarkan informasi berupa tweet. Menurut Kominfo, dari 245 juta penduduk
Indonesia, pengguna internet di Indonesia mencapai 55 juta orang. Ini menjadikan Indonesia sebagai negara
kelima terbesar pengguna Twitter.

Natural Processing Language (NLP) adalah cabang dari Artificial Intelligence yang berhubungan dengan interaksi
antara mesin dan manusia menggunakan bahasa natural. Dalam hal ini memanfaatkan salah satu library python
yaitu TextBlob untuk mengerjakan algoritma text mining. Salah satu metode dari text mining di bidang NLP adalah
dengan pendekatan analisis sentimen. Pendekatan analisis sentimen digunakan untuk menganalisa data berbentuk
opini publik sebagai pendukung pengambilan keputusan. Tugas analisis sentimen adalah mengelompokkan
kumpulan polaritas dari teks yang berada dalam dokumentasi, kalimat atau fitur entitas dengan tingkat aspek
yang bersifat positif, netral atau negatif. (Buntoro, 2017; Fridom Mailo & Lazuardi, 2019; Yasah, 2020).
Berdasarkan uraian di atas, maka penulis akan menerapkan analisis sentimen terhadap penanggulangan bencana,
yang dalam hal ini mengacu pada Badan Penanggulangan Bencana Daerah (BPBD), berdasarkan dari opini
publik dengan kategori positif, netral atau negatif dari media sosial Twitter, dengan menggunakan library Python.
Hasil dari analisis sentimen ini dapat digunakan oleh pengemban tugas penanggulangan bencana untuk
mengevaluasi penanganan bencana yang terjadi agar selanjutnya bisa lebih baik lagi

II. TINJAUAN PUSTAKA

2.1. Text Mining


Menurut Ronen Feldman dan James Sanger dalam bukunya "The Mining Handbook: Pendekatan
Lanjutan dalam Analisis Data Tidak Terstruktur" (Feldman & Sanger, 2007), text mining dapat secara luas
didefinisikan sebagai proses pengeksplorasian informasi di mana pengguna berinteraksi dengan
kumpulan dokumen menggunakan alat analisis yang merupakan komponen-komponen dari data mining,
salah satunya adalah kategorisasi. Text mining merupakan bidang penelitian yang relatif baru dan
memberikan solusi untuk memproses, mengorganisir, mengelompokkan, dan menganalisis teks yang
tidak terstruktur dalam jumlah besar. Salah satu bidang yang terkait dengan text mining adalah
Pemrosesan Bahasa Alami (Natural Language Processing, NLP), yang dalam penelitian ini
menggunakan library Python bernama TextBlob. Penelitian yang dilakukan oleh Fauziyyah (2020)
tentang analisis sentimen pandemi Covid-19 pada streaming Twitter dengan menggunakan text mining
python, menggunakan ekstraksi fitur dengan metode Bigram dan N-gram untuk menganalisis sentimen
berdasarkan opini, dan mengklasifikasikan perasaan individu seperti sedih, senang, atau panik dalam
menghadapi pandemi Covid-19 ke dalam level sentimen negatif, positif, atau netral. Namun, penelitian
tersebut masih menggunakan data streaming tweet dalam bahasa Inggris. Dalam penelitian ini, penulis
ingin mengembangkan penelitian yang menggunakan bahasa Indonesia dengan memanfaatkan fungsi
terjemahan dari TextBlob. Dalam text mining, terdapat tahapan pengambilan data, pra-pemrosesan
sebelum klasifikasi, dan pemrosesan data. Setelah data dibersihkan, data tersebut dapat divisualisasikan
(Negara et al., 2016).

2.2. Platform Twitter API


Media sosial Twitter menyediakan API (Application Programming Interface) yang memudahkan setiap
orang untuk mengambil data dari Twitter (Pintoko & L., 2018). Pengumpulan data dari Twitter digunakan
untuk memperoleh opini publik tentang penanggulangan bencana di Indonesia.

2.3. Python
Python adalah perangkat lunak open source yang terkenal karena bahasa pemrogramannya yang
dinamis. Dalam penelitian ini, digunakan Python versi 3.9. Terdapat beberapa library yang digunakan
dalam penulisan ini. Untuk menginstal library, dapat menggunakan perintah pip.

2.3.1. Tweepy
Tweepy merupakan library Python yang digunakan untuk mengakses Twitter API dan mengambil data
dari Twitter.

2.3.2. TextBlob
TextBlob merupakan library Python yang digunakan untuk memproses data teks. TextBlob menyediakan
API sederhana untuk tugas Pemrosesan Bahasa Alami (NLP), antara lain pemberian tag kata, ekstraksi
kata benda, analisis sentimen, klasifikasi, terjemahan, dan lainnya (Loria, 2020).

2.3.3. Pandas
Library pandas digunakan untuk manipulasi dan analisis data. Dalam kode ini, pandas digunakan untuk
membaca dan memanipulasi data dari file CSV yang diambil dari Twitter.

2.3.4. Node.js
Node.js adalah platform untuk menjalankan JavaScript di sisi server. Dalam kode ini, Node.js digunakan
untuk menginstal paket tweet-harvest yang digunakan untuk mengambil data dari Twitter.

2.3.5. tweet-harvest:
tweet-harvest adalah sebuah paket Node.js yang digunakan untuk mengambil data dari Twitter. Di kode
ini, tweet-harvest digunakan dengan perintah npx untuk melakukan crawling data Twitter dengan kata
kunci, batasan waktu, dan jumlah yang ditentukan. Hasilnya disimpan dalam file CSV.

2.3.6. pandas DataFrame:


DataFrame adalah struktur data yang disediakan oleh library pandas. Dalam kode ini, DataFrame
digunakan untuk menyimpan data yang telah diambil dari Twitter dalam format tabel yang terstruktur.

2.3.7. Display
Display adalah perintah untuk menampilkan DataFrame dengan menggunakan fungsi display().
2.3.8. len()
Fungsi len() digunakan untuk menghitung jumlah tweet dalam DataFrame.

2.3.9. CSV
CSV (Comma Separated Value) adalah library Python yang digunakan untuk menyimpan data dalam
format ".csv".

2.4. Jupyter Notebook


Jupyter Notebook adalah aplikasi open source yang digunakan untuk membuat dan berbagi dokumen
Python. Untuk menginstal Jupyter Notebook, dapat menggunakan perintah pip. Untuk mengakses Jupyter
Notebook, dapat mengetikkan "jupyter notebook" di Command Prompt.

III. Metode Penelitian

Pada penelitian ini, metode penelitian akan dilakukan seperti pada Gambar 1.

Pengambilan data

API

Crawling Data twitter

Pemrosesan Data

Cleaning Data Klasifikasi Sentimen


Menghitung Polarity
Hapus Mention

Positif Negatif Netral


Hapus Hashtag

Hapus retweet

Hapus Url Simpan dalam format CSV

Visualisasi data dalam bentuk pie chart dan


histogram

Simpan dalam Excel

Gambar 1. Diagram Alur


3.1 Pengumpulan Data
Penelitian ini menggunakan data tweet dari Twitter yang mengandung kata kunci terkait bencana alam.
Pengumpulan data dilakukan dengan menggunakan API Twitter yang memungkinkan akses terhadap
tweet-tweet yang diposting selama periode tertentu dan mengandung kata kunci yang ditentukan.

3.2 Pra-pemrosesan Data


Data tweet yang terkumpul kemudian dikenakan proses pra-pemrosesan untuk membersihkan dan
mempersiapkannya untuk analisis sentimen. Langkah-langkah pra-pemrosesan meliputi penghapusan
tautan, karakter khusus, dan kata-kata yang tidak relevan. Selain itu, teknik pemisahan kata
(tokenization) dan stemming juga diterapkan. File akan disimpan dalam bentuk .csv

3.3 Teknik Analisis Sentimen


Analisis sentimen dilakukan dengan menerapkan teknik pemrosesan bahasa alami dan algoritma
pembelajaran mesin. untuk selanjutnya dilakukan proses analysis.sentimen.polarity dengan hasil
positif, negatif, atau netral, yang disisipkan ke kolom sentimen. Hasil analisis disimpan dalam
sentiment_analysis.xlsx.

3.3. Visualisasi Data Data bersih kemudian ditampilkan dalam bentuk histogram, diagram lingkaran dan
word cloud.

IV. HASIL DAN PEMBAHASAN


Pada penelitian ini dilakukan analisis sentimen terhadap penanggulangan bencana. Data tweet diambil dan
diproses melalui dua program python yaitu Crawl_data_twitter.ipynb dan polaritas.ipynb. Pengambilan data
dilakukan pada 08 Juli 2023. Pada proses ambil data, seperti ditunjukkan pada Gambar 2, pengambilan data
dilakukan dengan kata kunci Bencana, berbahasa Indonesia (lang=“id”), dengan mode tweet extended. Data tweet
yang diambil berjumlah 200 data.

Gambar 2. Pengumpulan data

Setelah berhasil mengumpulkan tweet, langkah selanjutnya adalah memproses data tersebut. Pertama, dilakukan pra-
pemrosesan data untuk membersihkan data yang diambil. Pra-pemrosesan ini melibatkan langkah-langkah seperti
menghapus mentions (@), hashtag (#), retweet (RT), dan URL yang ada dalam tweet. Tujuan dari pra-pemrosesan
ini adalah untuk memperbaiki validitas data yang diambil, sehingga diharapkan data sentimen yang diperoleh sesuai
dengan hasil yang dibutuhkan. Selanjutnya, data tweet akan diubah ke dalam bahasa Inggris menggunakan perintah
translate(to="en")
Setelah proses penerjemahan, dilakukan analisis sentimen menggunakan metode analysis.sentiment.polarity. Jika
nilai polaritas lebih besar dari 0, maka sentimen tersebut dianggap positif. Jika nilai polaritas sama dengan 0, maka
sentimen dianggap netral. Sedangkan jika nilai polaritas lebih kecil dari 0, maka sentimen dianggap negatif.

Dari 204 tweet yang diambil, dan dilakukan analisis, twit terdiri dari 40 tweet positif, 129 tweet netral dan 35 tweet
negatif. Gambar 3. Jumlah masing-masing sentimen Apabila ditampilkan dalam bentuk persentase sejumlah 19,61
% tweet positif, 17.16 % tweet negatif dan 63,23 % tweet positif.

Gambar 3. Sentimen dalam bentuk persentase

Dengan memanfaatkan library Matplotlib, data tersebut ditampilkan dalam bentuk histogram, dengan masing-
masing kategori positif, netral dan negatif seperti pada Gambar 4.

Gambar 4. Histogram hasil analisis sentimen

Selain dalam bentuk histogram, hasil analisis sentimen juga ditampilkan dalam bentuk diagram lingkaran atau
pie chart seperti pada Gambar 5
Gambar 5. Pie Chart hasil analisis sentimen

V. KESIMPULAN DAN SARAN


5.1 Kesimpulan:
Dalam penelitian ini, dilakukan pengumpulan data pada tanggal 09 Juli 2023 dengan menggunakan kata
kunci "Bencana". Berdasarkan analisis sentimen, diperoleh hasil bahwa 19,61 % tweet positif, 17.16 %
tweet negatif dan 63,23 % tweet positif. Dengan demikian, dapat disimpulkan bahwa opini pengguna
Twitter tentang Bencana di Indonesia pada waktu tersebut cenderung netral. Namun, penelitian ini masih
memiliki kekurangan, yaitu terdapat kelompok kata yang seharusnya masuk dalam kategori tweet negatif
namun tergolong dalam kategori tweet netral, dan sebaliknya.

5.2 Saran:
Dalam penelitian ini, pengambilan data menggunakan TextBlob untuk memproses data dalam tahap text
mining dan klasifikasi sentimen. Namun, TextBlob hanya dapat memproses data dalam bahasa Inggris.
Pengambilan data pada penelitian ini menggunakan bahasa Indonesia dan kemudian diterjemahkan
kembali ke bahasa Inggris sebelum dilakukan proses klasifikasi. Namun, hasil yang diperoleh dalam
penelitian ini masih belum maksimal.

DAFTAR PUSTAKA
Bao, J., Zheng, L., & Chen, S. (2017). Large-scale social media data analysis for disaster management.
IEEE Transactions on Engineering Management, 64(2), 180-193.
Castillo, C., Mendoza, M., & Poblete, B. (2011). Information credibility on Twitter. In Proceedings of the
20th International Conference on World Wide Web (pp. 675-684). ACM.
Imran, M., Elbassuoni, S. M., Castillo, C., Diaz, F., & Meier, P. (2013). Extracting information nuggets
from disaster-Related messages in social media. In Proceedings of the 10th International
ISCRAM Conference.
Olteanu, A., Castillo, C., Diaz, F., & Vieweg, S. (2015). CrisisLex: A lexicon for collecting and filtering
microblogged communications in crises. In Proceedings of the 8th International Conference on
Weblogs and Social Media.
Sakaki, T., Okazaki, M., & Matsuo, Y. (2010). Earthquake shakes Twitter users: Real-time event detection
by social sensors. In Proceedings of the 19th International Conference on World Wide Web (pp.
851-860). ACM.
Cheng, Z., Caverlee, J., & Lee, K. (2010). You are where you tweet: A content-based approach to geo-
locating Twitter users. In Proceedings of the 19th ACM International Conference on Information
and Knowledge Management (pp. 759-768). ACM.
Mislove, A., Lehmann, S., Ahn, Y. Y., Onnela, J. P., & Rosenquist, J. N. (2011). Understanding the
demographics of Twitter users. In Proceedings of the 5th International AAAI Conference on
Weblogs and Social Media.
Tumasjan, A., Sprenger, T. O., Sandner, P. G., & Welpe, I. M. (2010). Predicting elections with Twitter:
What 140 characters reveal about political sentiment. In Proceedings of the 4th International
AAAI Conference on Weblogs and Social Media.

You might also like