Text
ANALISIS SENTIMEN DALAM KASUS KORUPSI PT. PERTAMINAMENGGUNAKAN METODE INDOBERT DAN RCNN
Abstrak
Penelitian ini bertujuan untuk mengevaluasi performa model hybrid IndoBERT RCNN dalam klasifikasi sentimen publik terhadap kasus korupsi PT. Pertamina, dengan menekankan pengaruh kombinasi hyperparameter terhadap akurasi model. Dataset yang digunakan terdiri atas 10.078 komentar dari YouTube yang dikumpulkan melalui YouTube Data API, kemudian diproses melalui tahap preprocessing, pelabelan otomatis menggunakan model RoBERTa berbahasa Indonesia, serta penyeimbangan distribusi kelas melalui undersampling dan augmentasi berbasis contextual embedding IndoBERT. Arsitektur model menggabungkan IndoBERT sebagai feature extractor dan RCNN sebagai classifier, serta diuji dengan berbagai kombinasi learning rate dan batch size. Hasil eksperimen menunjukkan bahwa konfigurasi optimal dicapai pada learning rate 2e 5 dan batch size 16, dengan akurasi 84% dan F1 score 83%. Meskipun model secara umum mampu mengklasifikasikan komentar negatif dengan sangat baik, akurasi pada kelas netral dan positif cenderung lebih rendah karena tumpang tindih fitur semantik dan ambiguitas dalam ekspresi komentar. Penelitian ini memberikan kontribusi spesifik dalam pengembangan analisis sentimen berbahasa Indonesia dengan: (1) mengintegrasikan arsitektur IndoBERT RCNN untuk isu sosial politik, (2) mengevaluasi kombinasi hyperparameter secara sistematis pada data opini publik tiga kelas, dan (3) memanfaatkan komentar YouTube sebagai sumber data informal yang relevan. Temuan ini berpotensi diterapkan dalam sistem pemantauan opini publik digital terhadap isu strategis nasional secara real time.
Kata kunci: Analisis sentimen, IndoBERT, RCNN, hyperparameter, korupsi, pembelajaran mendalam, YouTube, opini publik
Tidak tersedia versi lain