Professional Documents
Culture Documents
Analisis Sentimen Twitter Terhadap Capres 2024 Dengan Pendekatan Text Mining Dan Algoritma Naïve Bayes Classifier
Analisis Sentimen Twitter Terhadap Capres 2024 Dengan Pendekatan Text Mining Dan Algoritma Naïve Bayes Classifier
Kompleks PT. Semen Indonesia (Persero) Tbk. Jl. Veteran, Kb Dalem, Sidomoro, Kabupaten
Gresik, Jawa Timur
naufal.kanugraha20@student.uisi.ac.id1, fajar.abimanyu20@student.uisi.ac.id2
Abstract
This research applies text mining and the Naïve Bayes Classifier algorithm to
analyze sentiment on Twitter regarding the 2024 presidential candidates. With
the advancement of digital information and the popularity of social media
platforms like Twitter, analyzing public sentiment has become crucial for
understanding public opinions and political dynamics. The study focuses on the
upcoming presidential election in Indonesia and aims to uncover valuable insights
into the public sentiment towards potential candidates. By collecting and
preprocessing 150 tweets related to the candidates, the research performs
sentiment analysis using the Naïve Bayes Classifier algorithm. The evaluation of
the model's performance is based on precision and recall metrics. The results
indicate an overall accuracy of 72%, with the Naïve Bayes Classifier effectively
categorizing tweets as positive or negative sentiments. The analysis of sentiment
offers valuable information for the candidates, campaign teams, and the general
public, aiding in campaign strategy development and understanding public
opinions. The research demonstrates the effectiveness of combining text mining
and the Naïve Bayes Classifier algorithm in analyzing public sentiment on Twitter,
contributing to the fields of politics, social media, and data science.
Abstrak
Penelitian ini menerapkan teknik text mining dan algoritma Naïve Bayes
Classifier untuk menganalisis sentimen di Twitter terkait calon presiden 2024.
Dengan kemajuan informasi digital dan popularitas platform media sosial seperti
Twitter, menganalisis sentimen publik menjadi penting untuk memahami
pendapat publik dan dinamika politik. Penelitian ini berfokus pada pemilihan
presiden yang akan datang di Indonesia dan bertujuan untuk mengungkap
wawasan berharga mengenai sentimen publik terhadap calon-calon potensial.
Dengan mengumpulkan dan memproses 150 twit terkait calon-calon tersebut,
penelitian ini melakukan analisis sentimen menggunakan algoritma Naïve Bayes
Classifier. Evaluasi kinerja model didasarkan pada metrik presisi dan recall. Hasil
penelitian menunjukkan akurasi keseluruhan sebesar 72%, dengan Naïve Bayes
Classifier secara efektif mengkategorikan twit sebagai sentimen positif atau
negatif. Analisis sentimen memberikan informasi berharga bagi calon-calon, tim
kampanye, dan masyarakat umum, membantu dalam pengembangan strategi
kampanye dan pemahaman pendapat publik. Penelitian ini menunjukkan
efektivitas penggabungan teknik text mining dan algoritma Naïve Bayes
1. PENDAHULUAN
Dalam era informasi digital yang semakin maju, media sosial telah menjadi platform
penting bagi masyarakat untuk berbagi pendapat, memperoleh informasi, dan
berpartisipasi dalam perdebatan politik. Twitter, sebagai salah satu media sosial yang
populer, menawarkan akses real-time terhadap jutaan percakapan publik. Oleh karena itu,
Twitter telah menjadi sumber data yang berharga untuk menganalisis sentimen publik
terkait berbagai topik, termasuk politik[1].
Pemilihan presiden (Pilpres) adalah salah satu peristiwa politik yang paling penting
dan mempengaruhi kehidupan publik dalam suatu negara. Di Indonesia, pilpres 2024
merupakan perhelatan politik yang dinanti-nantikan, di mana masyarakat akan memilih
calon presiden yang akan memimpin negara selama periode berikutnya. Namun, dalam
menghadapi Pilpres, penting untuk memahami dan menganalisis sentimen publik terkait
calon presiden yang berpotensi mempengaruhi persepsi masyarakat.
Analisis sentimen Twitter merupakan metode yang efektif untuk menggali
informasi tentang pendapat publik terkait suatu topik tertentu. Dalam analisis sentimen
Twitter, teks-teks yang berhubungan dengan topik tertentu dianalisis untuk menentukan
apakah sentimen yang terkandung di dalamnya positif, atau negatif. Dalam Pilpres 2024,
analisis sentimen Twitter dapat membantu untuk memahami dukungan dan pandangan
masyarakat terhadap calon presiden yang berpotensi memenangkan pemilihan.
Dalam penelitian ini, pendekatan text mining dan algoritma Naïve Bayes Classifier
digunakan untuk melakukan analisis sentimen terhadap calon Pilpres 2024 yang dibahas di
Twitter. Teks mining adalah proses penggalian informasi yang menggunakan teknik-teknik
pengolahan bahasa alami (natural language processing) untuk menganalisis dan menggali
makna dari teks. Algoritma Naïve Bayes Classifier adalah salah satu metode klasifikasi yang
populer dalam analisis sentimen, di mana teks-teks yang dianalisis diberi label sentimen
berdasarkan probabilitas kemunculan kata-kata dalam teks.
Penelitian ini diharapkan dapat memberikan wawasan yang berharga mengenai
sentimen publik terhadap calon Pilpres 2024 di Twitter. Hasil analisis sentimen dapat
memberikan gambaran tentang tingkat dukungan, kritik, atau ketidaksetujuan masyarakat
terhadap calon presiden tertentu. Informasi ini dapat berguna bagi calon presiden dan tim
kampanye mereka dalam merancang strategi kampanye yang efektif, serta bagi masyarakat
umum dan peneliti politik untuk memahami dinamika opini publik terkait Pilpres 2024.
Melalui kombinasi text mining dan algoritma Naïve Bayes Classifier, diharapkan
penelitian ini dapat memberikan kontribusi positif dalam memahami sentimen publik dan
meningkatkan pemahaman kita tentang pandangan masyarakat dalam konteks politik.
Dengan demikian, penelitian ini memiliki implikasi yang luas dalam bidang politik, media
sosial, dan ilmu data, serta dapat menjadi dasar untuk pengambilan keputusan yang lebih
baik dalam proses demokrasi yang berlangsung di Indonesia.
2. METODOLOGI PENELITIAN
2.1. Metode Pengumpulan Data
Beberapa metode digunakan dalam teknik pengumpulan data pada penelitian ini,
Metode tersebut meliputi:
1. Observasi
Analisa Sentimen Twitter Terhadap Capres … (Naufal Yuwan Kanugraha) | Halaman 2
Jurnal Teknik dan Sistem Komputer (JTIKOM)
Volume (Sesuaikan Edisi Terbitan)
ISSN: 2723-6382
Dibawah ini adalah penjelasan singkat terkait alur analisa sentimen pada gambar 1 :
1. Analisa Data
Setelah memperoleh data dari twitter sebanyak 150 tweet, selanjutnya data
tersebut dibagi menjadi dua yaitu data latih sebanyak 100 tweet dan data uji
sebanyak 50 tweet. dari 150 data latih, kemudian ditentukan nilai
sentimennya secara manual dan dihasilkan 71 tweet sentimen positif dan 79
tweet sentimen negatif.
2. Data Preprocessing
Data processing atau text processing berfungsi untuk mengubah data teks
yang tidak terstruktur atau menjadi data yang terstruktur. Secara umum
proses yang dilakukan dalam tahapan preprocessing adalah normalisasi,
tokenizing, dan stopword removal.
3. Penerapan Algoritma
Naive Bayes adalah metode yang cocok untuk klasifikasi biner
dan multiclass. Metode yang juga dikenal sebagai Naive Bayes Classifier ini
menerapkan teknik supervised klasifikasi objek di masa depan dengan
menetapkan label kelas ke instance/catatan menggunakan probabilitas
bersyarat.
4. Evaluasi Model
Pada evaluasi model kami menggunakan presisi dan recall, ini digunakan
dalam algoritma Naive Bayes Classifier untuk mengukur kinerja model
klasifikasi. Presisi mengukur sejauh mana model memberikan prediksi yang
benar untuk kelas positif, sementara recall mengukur sejauh mana model
berhasil mendeteksi semua data positif yang ada. Keduanya memberikan
informasi yang berbeda tentang kemampuan model dalam
mengklasifikasikan data, dan penting untuk mempertimbangkan
Pada gambar 3 diatas kami menunjukkan hasil preprocessing data pada tweet yang telah
kami kumpulkan, tabel diatas menunjukkan label positif atau negatif, data tweet, hasil
tokensisasi, hasil stopword, dan hasil stemming.
Pada gambar 4 diatas, dapat dilihat bahwa 5 kata yang paling muncul adalah “Ganjar”,
“Anies”, “Jokowi”, “Capres” dan “Presiden”.
Pada Pemodelan data menggunakan algoritma Naïve Bayes classifier, dari 150 data, 100 data
digunakan sebagai data latih dan 50 data sebagai data uji.
Berdasarkan hasil yang diperoleh, performa dari metode yang digunakan dalam
penelitian ini dapat dilihat dari nilai precision, recall, dan f1-score. Hasil dari dari pemodelan
dapat dilihat pada gambar 5 dibawah ini.
Dari hasil di atas, terlihat bahwa model ini memiliki performa yang kurang optimal
dalam mengklasifikasikan tweet dengan sentimen negatif (-1). Hal ini mungkin disebabkan
oleh jumlah sampel yang tidak seimbang antara tweet negatif dan positif dalam dataset, atau
juga bisa disebabkan oleh fitur yang digunakan dalam proses klasifikasi yang tidak mampu
membedakan dengan baik antara sentimen negatif dan positif.
Meski demikian, model ini mampu dengan baik dalam mengidentifikasi dan
mengklasifikasikan tweet dengan sentimen positif (1). Mungkin ini disebabkan oleh fitur
yang relevan dan informatif dalam tweet positif yang memudahkan model dalam
melakukan klasifikasi.
Oleh karena itu, penelitian lebih lanjut perlu dilakukan untuk meningkatkan kinerja
model, terutama dalam mengklasifikasikan sentimen negatif. Hal ini bisa mencakup teknik-
teknik seperti penyeimbangan dataset, pemilihan fitur yang lebih baik, atau penggunaan
model klasifikasi yang lebih kompleks.
4. SIMPULAN
Dari penelitian kami diatas, dapat disimpulkan beberapa hal berikut:
1. Dalam penelitian ini, dilakukan analisis sentimen terhadap 150 data tweet
terkait Capres 2024 menggunakan Text Mining dan Naïve Bayes Classifier.
Hasilnya menunjukkan model memiliki akurasi sebesar 72%.
2. Dengan hasil akurasi yang cukup tinggi yaitu 72% maka metode Naive
Bayes Classifier cukup efektif dalam melakukan klasifikasi data tweet
dengan sentimen negatif dan positif secara otomatis[2].
3. Analisa sentimen terbukti dapat digunakan dalam hal mengetahui
sentimen rakyat Indonesia khusunya pengguna Twitter terhadap para
calon presiden ditahun 2024, sehingga dapat membantu masyarakat awam
yan ingin mengetahui sentimen masyarakat Indonesia terhadap calon
presiden Indonesia[2].
DAFTAR PUSTAKA
[1] Buntoro, G. A. (2017). Analisis Sentimen Calon Gubernur DKI Jakarta 2017 Di
Twitter.
[2] Mahbubah, E. Z. (2019). ANALISA SENTIMEN TWITTER PADA PILPRES 2019
MENGGUNAKAN.
[3] Manalu, B. U. (2014). ANALISIS SENTIMEN PADA TWITTER MENGGUNAKAN TEXT
MINING.
[4] Sudiantoro, A. V., & Zuliarso, E. (2018). ANALISIS SENTIMEN TWITTER
MENGGUNAKAN TEXT MINING DENGAN.