Welcome to Scribd!

Skip carousel

Codes - Basic

Uploaded by

pranav1931129

0% found this document useful (0 votes)

4 views3 pages

R codes

Original Title

Codes -Basic

Copyright

Available Formats

DOCX, PDF, TXT or read online from Scribd

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Report this Document

R codes

Copyright:

Available Formats

Download as DOCX, PDF, TXT or read online from Scribd

Flag for inappropriate content

Download as docx, pdf, or txt

0% found this document useful (0 votes)

4 views3 pages

Codes - Basic

Uploaded by

pranav1931129

R codes

Copyright:

Available Formats

Download as DOCX, PDF, TXT or read online from Scribd

Flag for inappropriate content

Download as docx, pdf, or txt

Jump to Page

You are on page 1of 3

Search inside document

install.

packages("quanteda")

install.packages("quanteda.textstats")

install.packages("quanteda.textplots")

install.packages("quanteda.textmodels")

install.packages("tidytext")

install.packages("topicmodels")

install.packages("tm")

install.packages("ggplot2")

install.packages("gdap")

require(readtext)

require(quanteda)

require(quanteda.textstats)

require(quanteda.textplots)

require(quanteda.textmodels)

require(dplyr)

require(tidytext)

require(topicmodels)

require(tm)

require(qdap)

require(ggplot2)

library(readtext)

library(quanteda.textstats)

#========Import text file======

x=readtext("*.txt")

#========Convert to Corpus========

corp=corpus(x)
corp

summary(corp)

textstat_summary(corp)

#Readability measures the complexity of the printed materials

# by measuring the number of words in the sentence and

# the number of letters or syllables per word

# The Flesch Reading Ease gives a text a score between 1 and 100,

# with 100 being the highest readability score.

# Scoring between 70 to 80 is equivalent to school grade level 8.

# Low the score-> Tougher the text

?textstat_readability

textstat_readability(corp)

#========Corpus to Token and text Cleaning========

t=tokens(corp)

t=tokens_tolower(t)

t=tokens(t,

remove_punct = T,

remove_symbols = T,

remove_numbers = T,

remove_url = T,

remove_separators = T)

t=tokens_remove(t, pattern = stopwords("english"))

t
#Clean corpus created by OCR/Scanner

t=tokens_select(t,

c("[\\d-]", "[[:punct:]]", "^.{1,2}$"),

selection = "remove",

valuetype = "regex",

verbose = TRUE

#Custom stopwords

#Create your own stopwords to remove

mywords=c("can","go","even","think",

"soon","will","now","soon")

t=tokens_remove(t,

pattern = mywords)

Text Mining Code
Document3 pages
Text Mining Code
yashsethea
No ratings yet
Glove
Document10 pages
Glove
tareqeee15
100% (1)
Basic CustomIC Tool Setup
Document9 pages
Basic CustomIC Tool Setup
Thanh Nguyen Quoc
No ratings yet
C Make Lists
Document10 pages
C Make Lists
Halia
100% (1)
Writing Efficient R Code
Document5 pages
Writing Efficient R Code
Octavio Flores
No ratings yet
Ece4750 Cheat Sheet
Document2 pages
Ece4750 Cheat Sheet
WangAlex
No ratings yet
C Make Lists
Document3 pages
C Make Lists
Doddy Indrawan
No ratings yet
Practica 1 % de Ventas
Document1 page
Practica 1 % de Ventas
melisa Zapata franco
No ratings yet
Pyspark-1 6 1
Document32 pages
Pyspark-1 6 1
Matthew Reach
No ratings yet
Package Inpdfr': R Topics Documented
Document29 pages
Package Inpdfr': R Topics Documented
ahrounish
No ratings yet
Lab Digital Assignment 6 Data Visualization: Name: Samar Abbas Naqvi Registration Number: 19BCE0456
Document11 pages
Lab Digital Assignment 6 Data Visualization: Name: Samar Abbas Naqvi Registration Number: 19BCE0456
SAMAR ABBAS NAQVI 19BCE0456
No ratings yet
Acadr 14
Document7 pages
Acadr 14
unlimitedwwe
No ratings yet
6500b66e-f4f8-4a2e-873b-620459ca9799
Document2 pages
6500b66e-f4f8-4a2e-873b-620459ca9799
I yr IT 10-Cherisha S
No ratings yet
R Code NB
Document3 pages
R Code NB
brahmesh_sm
No ratings yet
C Make Lists
Document11 pages
C Make Lists
daspeperka
No ratings yet
Diary Topic
Document5 pages
Diary Topic
Rifki Edo
No ratings yet
An Implementation of RSA and ElGamal PKCs Using Java BigInteger Class
Document20 pages
An Implementation of RSA and ElGamal PKCs Using Java BigInteger Class
Venkat
No ratings yet
Tinn R
Document11 pages
Tinn R
N Karina Resentia
No ratings yet
Weather
Document7 pages
Weather
Rabia
No ratings yet
C Make Lists
Document1 page
C Make Lists
Rafi ToonVlogs
No ratings yet
CMake Lists
Document16 pages
CMake Lists
Ernesto L Garcia
No ratings yet
ESTIVEN - HURTADO.SANTOS - Analytics, De, Data, No, Estructurada - Machine, Learning - ESTIVEN - HURTADO.SANTOS - Ipynb - Colaboratory
Document5 pages
ESTIVEN - HURTADO.SANTOS - Analytics, De, Data, No, Estructurada - Machine, Learning - ESTIVEN - HURTADO.SANTOS - Ipynb - Colaboratory
Estiven Hurtado Santos
No ratings yet
How To Create A ROS Package (In Python) in ?? Easy Steps: Workspace Setup
Document15 pages
How To Create A ROS Package (In Python) in ?? Easy Steps: Workspace Setup
Jose De Jesus Moya
No ratings yet
Tesseract
Document6 pages
Tesseract
Ben Allen
No ratings yet
Source Code Python Jemmy
Document7 pages
Source Code Python Jemmy
Fadilah Riczky
No ratings yet
J AGS Tutor Ial
Document4 pages
J AGS Tutor Ial
Demis Andrade
No ratings yet
C Make Lists
Document6 pages
C Make Lists
Melissa Hagan
No ratings yet
CMake Lists
Document7 pages
CMake Lists
sipo sipo
No ratings yet
R语言基础入门指令 (tips)
Document14 pages
R语言基础入门指令 (tips)
s2000152
No ratings yet
Econ589multivariateGarch R
Document4 pages
Econ589multivariateGarch R
JasonClark
No ratings yet
LRT Main
Document4 pages
LRT Main
senthil
No ratings yet
Sjcam Make
Document3 pages
Sjcam Make
jackdsa22
No ratings yet
CP Presentation
Document15 pages
CP Presentation
sanjoni.jain
No ratings yet
Lab Distributed Big Data Analytics: Worksheet-3: Spark Graphx and Spark SQL Operations
Document5 pages
Lab Distributed Big Data Analytics: Worksheet-3: Spark Graphx and Spark SQL Operations
benben08
No ratings yet
R Cheatsheet Devtools
Document2 pages
R Cheatsheet Devtools
arekbee
100% (1)
Text Mining Package and Datacleaning: #Cleaning The Text or Text Transformation
Document6 pages
Text Mining Package and Datacleaning: #Cleaning The Text or Text Transformation
Arush sambyal
No ratings yet
Thurinnurea (Python)
Document2 pages
Thurinnurea (Python)
migueldias20192
No ratings yet
CMake Lists
Document4 pages
CMake Lists
engelo89
No ratings yet
Aman DA 111
Document14 pages
Aman DA 111
Adarsh yadav
No ratings yet
Module II Notes - 1
Document6 pages
Module II Notes - 1
ashokadarsh.97
No ratings yet
Fit Dist Package
Document2 pages
Fit Dist Package
Fernando Samano
No ratings yet
12 CodigoNetbeans
Document5 pages
12 CodigoNetbeans
Miguel Angel
No ratings yet
Datasets
Document40 pages
Datasets
Asmatullah Khan
No ratings yet
Mrtglib
Document4 pages
Mrtglib
Paul Becan
No ratings yet
C Make Lists
Document34 pages
C Make Lists
Leo Quiroz
No ratings yet
Text Mining KNN
Document2 pages
Text Mining KNN
vedavarshni
No ratings yet
ASTW RA03 PracticalManual
Document18 pages
ASTW RA03 PracticalManual
Diksha Nasa
No ratings yet
Practical-1: Aim: Hadoop Configuration and Single Node Cluster Setup and Perform File Management Task in
Document61 pages
Practical-1: Aim: Hadoop Configuration and Single Node Cluster Setup and Perform File Management Task in
Parth
No ratings yet
Lisp Align Text in Autocad
Document26 pages
Lisp Align Text in Autocad
Aasdas
No ratings yet
Package Tesseract': July 25, 2019
Document5 pages
Package Tesseract': July 25, 2019
John Jack
No ratings yet
Python Project
Document2 pages
Python Project
bebshnnsjs
No ratings yet
Exercise 1
Document11 pages
Exercise 1
mustafa gökçen
No ratings yet
CMake Lists
Document7 pages
CMake Lists
Cecilion Meta
No ratings yet
NCDF 4
Document35 pages
NCDF 4
ይቴ ስንሻዉ
No ratings yet
CMakeLists Edgfbd
Document3 pages
CMakeLists Edgfbd
dorrian
No ratings yet
Assignment 2-033
Document13 pages
Assignment 2-033
DHARSHANA C P
No ratings yet
R Programming
Document9 pages
R Programming
ouahib.chafiai1
No ratings yet
Aped For Fake News
Document6 pages
Aped For Fake News
Bless Co
No ratings yet
CMake Lists
Document3 pages
CMake Lists
k.c.lover 8
No ratings yet
The Project Gutenberg RST Manual
From Everand
The Project Gutenberg RST Manual
Marcello Perathoner
No ratings yet
Data Visualisation
Document4 pages
Data Visualisation
pranav1931129
No ratings yet
Sample Paper
Document4 pages
Sample Paper
pranav1931129
No ratings yet
Eco Apple
Document13 pages
Eco Apple
pranav1931129
No ratings yet
Corporate Finance - Assignment1
Document16 pages
Corporate Finance - Assignment1
pranav1931129
No ratings yet
Turtle
Document1 page
Turtle
pranav1931129
No ratings yet
Answer 3
Document3 pages
Answer 3
pranav1931129
No ratings yet
Answer 2
Document2 pages
Answer 2
pranav1931129
No ratings yet