Perbandingan Sent2vec TF-IDF Logistic Regression dan Word2vec CNN pada hasil Sentiment Analysis Youtube Comment

  • Aganda Maulan Dan Dyantono Universitas Negeri Surabaya
  • Ricky Eka Putra Universitas Negeri Surabaya

Abstract

Kebutuhan akan internet untuk masyarakat Indonesia sangatlah masif, sehingga membuat ketergantungan akan penggunaan internet sangat tinggi untuk kebutuhan sehari-hari masyrakat Indonesia. Sosial media merupakan salah satu alasan untuk berhubungan langsung dengan internet, karena terdapat banyak informasi dan juga hiburan yang ada pada sosial media. Youtube merupakan salah satu Platform yang memiliki peringkat teratas untuk penggunaan sosial media di negara Indonesia.

Covid-19 merupakan musibah yang sangat besar untuk umat manusia, begitu juga dengan negara Indonesia yang ikut terkena dampak Covid-19. Covid-19 memiliki dampak serius terhadap pendidikan yang ada di negara Indonesia, karena adanya pembatasan interaksi manusia secara langsung membuat Kementerian Pendidikan dan Kebudayaan (KEMENDIKBUD) mengambil keputusan untuk menerapkan pembelajaran secara tidak langsung atau disebut dengan Daring. Daring memiliki banyak opini dari masyarakat Indonesia, karena merupakan kebijakan baru untuk Pendidikan di negara Indonesia.

Adapun penelitian ini dilakukan untuk memperoleh data dari Scrapping Youtube Comment untuk melakukan Sentiment Analysis dari opini masyarakat tentang kebijakan pendidikan di era pandemi yang diambil KEMENDIKBUD, dan juga untuk melakukan perbandingan model Sent2vec TF-IDF Logistic Regression (LR) dengan Word2vec CBOW Convolutional Neural Network (CNN) pada hasil Sentiment Analysis tersebut. Pada penelitian ini memiliki tahapan pengumpulan data yang diperoleh dari Scrapping data menggunakan Google Spreadsheet pada Youtube Comment di Channel Youtube Deddy Corbuzier yang berjudul “Nadiem, Kalau Bodoh Satu Generasi Gimana Bro?-Nadiem Makarim-Deddy Corbuzier Podcast”, data Scrapping digunakan untuk melakukan Sentiment Analysis pada RStudio untuk mendapatkan penilaian pada data, data yang sudah dinilai akan digunakan untuk melakukan perbandingan model Sent2vec TF-IDF LR dengan Word2vec CBOW CNN pada Jupyter Notebook untuk mendapatkan nilai Accuracy, Precision, Recall, F1 Score, dan ROC pada masing-masing model sebagai acuan perbandingan antar model.

Dari hasil penelitian tersebut, mendapatkan kesimpulan untuk data Scrapping Youtube Comment mendapatkan 1 data dengan isi sebanyak 14.605 kalimat di dalamnya, pada Sentiment Analysis yang dilakukan mendapatkan hasil penilaian terhadap data yaitu 9.549 kalimat positif dan 5.056 kalimat negatif, untuk perbandingan model Word2vec CBOW CNN memiliki nilai lebih baik dari model Sent2vec TF-IDF LR dengan selisih hasil yaitu untuk Accuracy 4,09%, Precision 6,75%, Recall 0,06%, F1 Score 2,81%, dan ROC 0,2%.

Published
2023-07-10
Section
Articles
Abstract Views: 67
PDF Downloads: 92