Text
PIPELINE NLP END-TO-END UNTUK PERINGKASAN ABSTRAKTIF DAN EKSTRAKSI ENTITAS BERITA BERBAHASA INDONESIA BERBASIS MODEL TRANSFORMER
ABSTRAK
Pertumbuhan informasi pada portal berita daring menimbulkan tantangan bagi pembaca untuk memahami inti konten secara cepat dan akurat. Penelitian ini mengusulkan dan mengimplementasikan alur kerja otomatis end-to-end yang menggabungkan tiga tahap utama: akuisisi data, peringkasan teks abstraktif, dan ekstraksi entitas bernama (Named Entity Recognition/NER). Model mT5 digunakan untuk menghasilkan ringkasan yang koheren dan ringkas, sedangkan model BERT diterapkan untuk mengidentifikasi entitas penting seperti tokoh, organisasi, dan lokasi. Alur kerja diuji menggunakan 100 artikel berita dari portal Egindo. Hasil eksperimen menunjukkan bahwa sistem mampu mereduksi panjang teks rata-rata sebesar 62,47% tanpa kehilangan esensi informasi, dengan skor ROUGE-1 F1 mencapai 0,473. Pada tugas NER, sistem menghasilkan Micro-F1 mendekati 0,70, lebih tinggi dibandingkan metode
tradisional seperti TextRank dan CRF. Temuan ini membuktikan bahwa integrasi model Transformer dalam alur kerja terstruktur mampu meningkatkan kualitas peringkasan dan akurasi NER secara signifikan. Penelitian ini memberikan kontribusi praktis berupa rancangan sistem NLP terintegrasi untuk bahasa Indonesia yang dapat digunakan pada
analisis media daring dan intelijen informasi. Kata Kunci : Ekstraksi Entitas, NLP Indonesia, Pipeline Otomatis, Peringkasan Abstraktif, Transformer
Tidak tersedia versi lain