Welcome to Scribd!

0% found this document useful (0 votes)

6 views

Fake News Detection

Uploaded by

This document describes a study on developing a machine learning model to identify fake news based on content. It discusses preprocessing data from Kaggle, training Doc2Vec and various models including Naive Bayes, SVM, Neural Networks and LSTM. The LSTM model achieved the highest accuracy of 94.53%. Future work proposed improving performance by combining classifiers and checking additional factors like news sources and corroboration.

Copyright:

Available Formats

Download as PDF, TXT or read online from Scribd

Flag for inappropriate content

Assignments
Document6 pages
Assignments
Peter Chenza
No ratings yet
Fake News Detection: Muhammad Hassan Ur Rehman Sufyan Ahmed Huzaifa Shuja Taber Bin Zameer
Document21 pages
Fake News Detection: Muhammad Hassan Ur Rehman Sufyan Ahmed Huzaifa Shuja Taber Bin Zameer
taber bin zameer
No ratings yet
Distributed Data Mining in Wireless Sensor Networks Using Naive Bayes Classification
Document10 pages
Distributed Data Mining in Wireless Sensor Networks Using Naive Bayes Classification
ashish88bhardwaj_314
No ratings yet
Irjet V9i11154
Document4 pages
Irjet V9i11154
abhiram2003pgd
No ratings yet
Recognition of Text in Textual Images Using Deep Neural Network
Document13 pages
Recognition of Text in Textual Images Using Deep Neural Network
Rishi kesh
No ratings yet
Recognition of Text in Textual Images Using Deep Learning
Document14 pages
Recognition of Text in Textual Images Using Deep Learning
Rishi kesh
No ratings yet
Data Science Applications and Research Directions
Document38 pages
Data Science Applications and Research Directions
Robin Rohit
100% (1)
(CS3244) Final Poster Group 19
Document1 page
(CS3244) Final Poster Group 19
Anonymous qNZVXg
No ratings yet
Assignment 2, Machine Learning
Document5 pages
Assignment 2, Machine Learning
mariashoukat
No ratings yet
Paper 21-Application of Intelligent Data Mining Approach in Securing 5
Document1 page
Paper 21-Application of Intelligent Data Mining Approach in Securing 5
Shiva prasad
No ratings yet
Data Science - 240 Hrs
Document2 pages
Data Science - 240 Hrs
Ash talks
No ratings yet
AI Series - Deep Learning Using Keras V1
Document2 pages
AI Series - Deep Learning Using Keras V1
Mukram Khan
No ratings yet
Ocr System Based On Neural Network
Document2 pages
Ocr System Based On Neural Network
Khaled
No ratings yet
Comp Sci - IJCSE - Conditional Naive-Bayes - Pushpalatha - Aish
Document10 pages
Comp Sci - IJCSE - Conditional Naive-Bayes - Pushpalatha - Aish
iaset123
No ratings yet
Cloud
Document20 pages
Cloud
Dhavala Shree B Jain
No ratings yet
Image Caption Generator Using AI: Review - 1
Document9 pages
Image Caption Generator Using AI: Review - 1
Anish Jamedar
No ratings yet
(IJCST-V10I5P12) :mrs J Sarada, P Priya Bharathi
Document6 pages
(IJCST-V10I5P12) :mrs J Sarada, P Priya Bharathi
EighthSenseGroup
No ratings yet
Binary Classification Tutorial With The Keras Deep Learning Library
Document33 pages
Binary Classification Tutorial With The Keras Deep Learning Library
Shudu Tang
No ratings yet
Proposal
Document9 pages
Proposal
ibrex29
No ratings yet
Malware Detection Using Frequency Domain-Based Image Visualization and Deep Learning
Document10 pages
Malware Detection Using Frequency Domain-Based Image Visualization and Deep Learning
mrimamss
No ratings yet
Paper Survey - Training With Quantization Noise For Extreme Model Compression
Document25 pages
Paper Survey - Training With Quantization Noise For Extreme Model Compression
thisisveryunsafe
No ratings yet
MNIST Database
Document4 pages
MNIST Database
mcdonald212
No ratings yet
An Approach To Recognize Characters Using Neural Network in LPR System
Document4 pages
An Approach To Recognize Characters Using Neural Network in LPR System
Kamel Saif
No ratings yet
Deep Learning Based Large Scale Handwritten Devanagari Character Recognition
Document6 pages
Deep Learning Based Large Scale Handwritten Devanagari Character Recognition
kaustubhbajpai718
No ratings yet
Gacnn - Training Deep Convolutional Neural Networks With Genetic Algorithm
Document4 pages
Gacnn - Training Deep Convolutional Neural Networks With Genetic Algorithm
euler saxena
No ratings yet
Improving Neural Networks by Preventing Co-Adaptat
Document19 pages
Improving Neural Networks by Preventing Co-Adaptat
Oorja Singh
No ratings yet
Image Caption Generator: Review - 1
Document9 pages
Image Caption Generator: Review - 1
Anish Jamedar
No ratings yet
Sri Venkateswara College of Engineering: Handwritten Text Recognition Model
Document37 pages
Sri Venkateswara College of Engineering: Handwritten Text Recognition Model
Heteroyenous Hum
No ratings yet
Research Papers
Document16 pages
Research Papers
21131A4433 MUTHA RESHMIKA
No ratings yet
Backpropagation: Static Backpropagation Is A Network Designed To
Document2 pages
Backpropagation: Static Backpropagation Is A Network Designed To
bainade.karan
No ratings yet
Multi Image Cryptographic Based Two Factor Authentication in Banking Systems and Services
Document10 pages
Multi Image Cryptographic Based Two Factor Authentication in Banking Systems and Services
Deepak DK
No ratings yet
Project Report
Document4 pages
Project Report
Siddharth Girdhar
No ratings yet
House Price Prediction Analysis PDF
Document78 pages
House Price Prediction Analysis PDF
Shashank Chowdary
No ratings yet
Slides PyConfr Bordeaux Calcagno
Document46 pages
Slides PyConfr Bordeaux Calcagno
Facundo Calcagno
No ratings yet
Packt - Hands On - Neural.networks - With.tensorflow.2.0.2019
Document506 pages
Packt - Hands On - Neural.networks - With.tensorflow.2.0.2019
yohoyon
No ratings yet
Detecting Cross-Site Scripting (XSS) Using Machine Learning
Document4 pages
Detecting Cross-Site Scripting (XSS) Using Machine Learning
NoviTech
No ratings yet
Knowledge Transfer in CNN Networks For Image Classification
Document22 pages
Knowledge Transfer in CNN Networks For Image Classification
Abenezer bedilu
No ratings yet
CNN-RNN Based Handwritten Text Recognition: G.R. Hemanth, M. Jayasree, S. Keerthi Venii, P. Akshaya, and R. Saranya
Document7 pages
CNN-RNN Based Handwritten Text Recognition: G.R. Hemanth, M. Jayasree, S. Keerthi Venii, P. Akshaya, and R. Saranya
Prasanna Kumar
No ratings yet
Pengantar Datamining: Anto Satriyo Nugroho, DR - Eng
Document33 pages
Pengantar Datamining: Anto Satriyo Nugroho, DR - Eng
Rendy Dwi Anugrah Putra
No ratings yet
Handwritten Text Recognition Using Tensorflow 2.0: Computer Vision
Document37 pages
Handwritten Text Recognition Using Tensorflow 2.0: Computer Vision
Animesh Prasad
No ratings yet
Handwritten Character Recognition Using BP NN, LAMSTAR NN and SVM
Document72 pages
Handwritten Character Recognition Using BP NN, LAMSTAR NN and SVM
Suyash Singh
No ratings yet
CAPTCHA Solving With Neural Networks
Document1 page
CAPTCHA Solving With Neural Networks
Yoga
No ratings yet
Functions Alphabetical
Document6 pages
Functions Alphabetical
omravi
No ratings yet
1 s2.0 S0031320311004006 Main
Document8 pages
1 s2.0 S0031320311004006 Main
Onur Ozdemir
No ratings yet
Unit 2 DL
Document3 pages
Unit 2 DL
Ankit Mahapatra
No ratings yet
models (1)
Document46 pages
models (1)
Ganesh Tangudu
No ratings yet
Research Paper
Document9 pages
Research Paper
rudraksh
No ratings yet
Unit - 3 DL
Document17 pages
Unit - 3 DL
gdsc.pragati
No ratings yet
IJCRT2108289
Document4 pages
IJCRT2108289
projects all
No ratings yet
Ijsrcsamsv 7 I 3 P 174
Document5 pages
Ijsrcsamsv 7 I 3 P 174
Dr Ganapati Das
No ratings yet
T&P Analysis Using Ai: Team Members
Document15 pages
T&P Analysis Using Ai: Team Members
siddhant agarwal
No ratings yet
Enhanced Network Anomaly Detection Model Based On Supervised Learning Techniques With Qualitative Features Selection
Document14 pages
Enhanced Network Anomaly Detection Model Based On Supervised Learning Techniques With Qualitative Features Selection
Shahid Azeem
No ratings yet
Human Activity Recognition Using Deep Learning Employing Smartphone Data
Document16 pages
Human Activity Recognition Using Deep Learning Employing Smartphone Data
shubhashis
No ratings yet
Learning Progress Review: Team 8 - Ruby
Document44 pages
Learning Progress Review: Team 8 - Ruby
Fatimah Azzahra
No ratings yet
Deep Learning With Keras - Quick Guide
Document22 pages
Deep Learning With Keras - Quick Guide
p7bzsf42bh
No ratings yet
10 1016@j Eswa 2020 114348
Document27 pages
10 1016@j Eswa 2020 114348
minh
No ratings yet
Image Classification Using Small Convolutional Neural Network
Document5 pages
Image Classification Using Small Convolutional Neural Network
Kompruch Benjaputharak
No ratings yet
Evaluating DNN and Classical ML Algorithms For Nids
Document24 pages
Evaluating DNN and Classical ML Algorithms For Nids
rishi
No ratings yet
Aiml Neural Net
Document19 pages
Aiml Neural Net
akr28921
No ratings yet
Offline Handwritten Character Recognition Using MLPNN and PSO Algorithm
Document3 pages
Offline Handwritten Character Recognition Using MLPNN and PSO Algorithm
International Journal of Innovative Science and Research Technology
No ratings yet
DATA MINING and MACHINE LEARNING. CLASSIFICATION PREDICTIVE TECHNIQUES: NAIVE BAYES, NEAREST NEIGHBORS and NEURAL NETWORKS: Examples with MATLAB
From Everand
DATA MINING and MACHINE LEARNING. CLASSIFICATION PREDICTIVE TECHNIQUES: NAIVE BAYES, NEAREST NEIGHBORS and NEURAL NETWORKS: Examples with MATLAB
César Pérez López
No ratings yet
Ed Stat Module 1 Dotillos
Document3 pages
Ed Stat Module 1 Dotillos
Roxanne Tiffany Dotillos Sarino
No ratings yet
One Sample T Test - Additional Examples
Document7 pages
One Sample T Test - Additional Examples
Lobo Francine
No ratings yet
Big Data Exercieses
Document6 pages
Big Data Exercieses
Menna Elfouly
No ratings yet
Comparative Historical Analysis in Contemporary Political Science
Document11 pages
Comparative Historical Analysis in Contemporary Political Science
Compozer123
No ratings yet
Descriptive Statistics
Document27 pages
Descriptive Statistics
chan kyo
No ratings yet
Econ-607 - Unit2-W1-3
Document117 pages
Econ-607 - Unit2-W1-3
asaminew
No ratings yet
What Is A Two-Tailed Test?
Document21 pages
What Is A Two-Tailed Test?
Mohammad Shaniaz Islam
No ratings yet
Period Data Naive Forecasts Abs. Error Error Abs. % Error
Document3 pages
Period Data Naive Forecasts Abs. Error Error Abs. % Error
edrianclyde
No ratings yet
T.Y.B.Sc. (Computer Science) - 07.07.2021
Document46 pages
T.Y.B.Sc. (Computer Science) - 07.07.2021
Dhiraj Gawhane
No ratings yet
Lecture 9
Document24 pages
Lecture 9
Noman Shahzad
No ratings yet
Decision Tree Classifier-Introduction, ID3
Document34 pages
Decision Tree Classifier-Introduction, ID3
mehra.harshal25
No ratings yet
Fatigue and Corrosion
Document23 pages
Fatigue and Corrosion
Tom mide
No ratings yet
Explaining Psychological Statistics (PG 79 79)
Document1 page
Explaining Psychological Statistics (PG 79 79)
Julienne Barredo
No ratings yet
Aroma: (Book Review)
Document3 pages
Aroma: (Book Review)
groaninggg
No ratings yet
Stochastic Gradient Descent
Document23 pages
Stochastic Gradient Descent
jenna.amber000
No ratings yet
Statppt4 - Z, T, F & Chi-Square Test Formulas
Document42 pages
Statppt4 - Z, T, F & Chi-Square Test Formulas
pogggigigieigegn
No ratings yet
AL-UoS BABSFY S3 Numeracy and Data Analysis Assignment April - June 2020 For Sep 2019 - Intake
Document15 pages
AL-UoS BABSFY S3 Numeracy and Data Analysis Assignment April - June 2020 For Sep 2019 - Intake
ZERO TO VARIABLE
50% (2)
PR 2 - Q1 Melc 2 - Week 1-3
Document6 pages
PR 2 - Q1 Melc 2 - Week 1-3
John Rehl De Gracia
No ratings yet
Audit Manual For CMA Firms
Document123 pages
Audit Manual For CMA Firms
Sajid Ali
100% (1)
GPL Reference Guide For IBM SPSS Statistics
Document363 pages
GPL Reference Guide For IBM SPSS Statistics
pm_barnes
No ratings yet
Weibayestesting: Whatistheimpactifassumed Betaisincorrect?: Defining The Problem
Document6 pages
Weibayestesting: Whatistheimpactifassumed Betaisincorrect?: Defining The Problem
Alan Flawson
No ratings yet
Ece368h1s 01 - 22 - 2023
Document4 pages
Ece368h1s 01 - 22 - 2023
Jialun Lyu
No ratings yet
Chapter III Jayson
Document6 pages
Chapter III Jayson
Ned Tyrone Ramizares
No ratings yet
LiquidMetrixWhitepaper TradeTech
Document19 pages
LiquidMetrixWhitepaper TradeTech
tabbforum
No ratings yet
Customer Relationship Management and Hospital Service
Document17 pages
Customer Relationship Management and Hospital Service
Rina Annisa
No ratings yet
Experimental Psychology 2
Document16 pages
Experimental Psychology 2
Jirah Marcelino
No ratings yet
Advance Statistics Learner Module For Unit 1
Document46 pages
Advance Statistics Learner Module For Unit 1
EMILL ASUNCION
No ratings yet
Aps 6 2 Notes
Document4 pages
Aps 6 2 Notes
api-261956805
No ratings yet

Fake News Detection

Uploaded by

rajeshkumar32it

0% found this document useful (0 votes)

6 views21 pages

Original Description:

Original Title

Fake News Detection (1)

Copyright

Available Formats

PDF, TXT or read online from Scribd

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Report this Document

Copyright:

Available Formats

Download as PDF, TXT or read online from Scribd

Flag for inappropriate content

Download as pdf or txt

0% found this document useful (0 votes)

6 views21 pages

Fake News Detection

Uploaded by

rajeshkumar32it

Copyright:

Available Formats

Download as PDF, TXT or read online from Scribd

Flag for inappropriate content

Download as pdf or txt

Jump to Page

You are on page 1of 21

Search inside document

Fake News Detection

Motivation

⧫ Prevalence of fake news on social

media

⧫ Emerging research area in Natural

Language Processing

⧫ Basic countermeasures inflexible

and inefficient

⧫ Current progress in this area

Problem Statement

⧫ Develop a machine learning

program to identify fake/unreliable
news based on content acquired.
Data

⧫ Dataset source - Kaggle

⧫ ID, Title, Author, Text, Label

⧫ Label 1 - Unreliable

⧫ Label 0 - Reliable
Workflow
Data Preprocessing

➢ Perform various text cleaning steps

(remove all non-alphanumeric
characters, delete stopwords, delete
missing rows, etc.)
➢ For Doc2Vec, convert to
LabeledSentences(), comma
separated word format
Doc2Vec Model

⧫ Based on Word2Vec model

⧫ Preserves word order information

⧫ Extracts Word2Vec features and

adds an additional “document vector”
with information about the entire
document
Training a Model

⧫ Models used-

● Naive Bayes
● Support Vector Machine (SVM)
● Neural Network
● Long Short-Term Memory
(LSTM)
Naive Bayes

⧫ Classification technique based on Bayes’

theorem with an assumption of independence
among predictors

1. Convert data set into a frequency table

2. Create likelihood table by finding

probabilities

3. Use Naive Bayesian equation to calculate

posterior probability for each class
Support Vector Machine (SVM)

Prediction
Feature SVM with
Vector Radial Basis Function
kernel
Neural Network
Hidden Layers

Feature Prediction
Vector Output

300 300 300 300

Neural Network

TensorFlow Keras
Hidden Layer Structure Hidden Layer Structure
(300, 300) (256, 256, 80)
(300, 300, 300)
Learning rate:
Learning rate: 0.01
0.001
Training Steps:
Training Steps: 10000
20000
LSTM
Fully Connected Layer

Prediction
Encode Embed
Numeric Feature
Text LSTM
Truncate
Sequence Vector
Comparison of Models

Model Accuracy

Naive Bayes 72.94%

SVM 88.42%

Neural Network using TensorFlow 81.42%

Neural Network using Keras 92.62%

LSTM 94.53%
Confusion Matrices

Naive Bayes SVM

Confusion Matrices

Neural Network using TensorFlow Neural Network using Keras

Confusion Matrices

LSTM
Challenges Faced

⧫ Lack of clean data to directly work with

might have slowed down our progress

⧫ The loss to value of information in a real

scenario for news is very high

⧫ Content based classification is just a part

of the whole picture

⧫ Distinguish between click-bait and actual

fake news
Future Work

⧫ Assemble the classifiers to achieve better

performance - Adam Boost

⧫ Check the sources of the news

⧫ Search the news on the web to check the

content of the news
Data’s all, folks!
Thank You!

Thanks to Prof. Sang (“Peter”) Chin, Kieran Wang, Gavin Brown

and Ken Zhou for their guidance!
References