Deteksi Validitas Berita Online Menggunakan Text Classification Berbasis Python
Keywords:
Text Classification , Berita Online , Validitas Informasi , Python, Machine Learning , hoaksAbstract
Perkembangan teknologi informasi yang pesat memudahkan masyarakat dalam mengakses berbagai berita secara online. Namun, kemudahan ini juga diiringi dengan meningkatnya penyebaran informasi palsu atau hoaks yang dapat menyesatkan publik. Oleh karena itu, diperlukan suatu sistem yang mampu mengidentifikasi dan memvalidasi keaslian berita secara otomatis. Penelitian ini bertujuan untuk membangun sistem deteksi validitas berita online menggunakan pendekatan klasifikasi teks berbasis Python. Metode yang digunakan dalam penelitian ini melibatkan proses pengumpulan data berita, pembersihan data (preprocessing), ekstraksi fitur menggunakan TF-IDF (Term Frequency-Inverse Document Frequency), dan klasifikasi menggunakan algoritma machine learning seperti Naive Bayes dan Support Vector Machine (SVM). Evaluasi dilakukan dengan mengukur akurasi, presisi, recall, dan f1-score dari masing-masing model. Hasil penelitian menunjukkan bahwa algoritma SVM memberikan performa yang lebih unggul dengan akurasi mencapai 92% dalam membedakan berita valid dan tidak valid. Sistem ini diharapkan dapat membantu masyarakat dalam menyaring informasi secara mandiri sebelum mempercayai dan menyebarkannya lebih lanjut.
Perkembangan teknologi informasi yang pesat memudahkan masyarakat dalam mengakses berbagai berita secara online. Namun, kemudahan ini juga diiringi dengan meningkatnya penyebaran informasi palsu atau hoaks yang dapat menyesatkan publik. Oleh karena itu, diperlukan suatu sistem yang mampu mengidentifikasi dan memvalidasi keaslian berita secara otomatis. Penelitian ini bertujuan untuk membangun sistem deteksi validitas berita online menggunakan pendekatan klasifikasi teks berbasis Python. Metode yang digunakan dalam penelitian ini melibatkan proses pengumpulan data berita, pembersihan data (preprocessing), ekstraksi fitur menggunakan TF-IDF (Term Frequency-Inverse Document Frequency), dan klasifikasi menggunakan algoritma machine learning seperti Naive Bayes dan Support Vector Machine (SVM). Evaluasi dilakukan dengan mengukur akurasi, presisi, recall, dan f1-score dari masing-masing model. Hasil penelitian menunjukkan bahwa algoritma SVM memberikan performa yang lebih unggul dengan akurasi mencapai 92% dalam membedakan berita valid dan tidak valid. Sistem ini diharapkan dapat membantu masyarakat dalam menyaring informasi secara mandiri sebelum mempercayai dan menyebarkannya lebih lanjut.