Welcome to Scribd!

Digital Assignment-1: Name: Bejugam Shiva Suprith REG NO: 18BCE0427 Faculty: Natarajan P SLOT: L45+L46

Uploaded by

0% found this document useful (0 votes)

9 views4 pages

This document contains code to perform two natural language processing tasks on a given text: 1) Tokenize the text and calculate word frequencies, and 2) Remove stop words and perform stemming. For the first task, the code tokenizes the words, counts the frequency of each unique word, and prints the results. For the second task, the code filters out stop words, applies a PorterStemmer to the remaining words, and prints the stemmed words. The code is written by a student named Bejugam Shiva Suprith for their digital assignment.

Original Description:

Original Title

18BCE0427_VL2020210104958_AST01 (1)

Copyright

Available Formats

PDF, TXT or read online from Scribd

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Report this Document

Copyright:

Available Formats

Download as PDF, TXT or read online from Scribd

Flag for inappropriate content

Download as pdf or txt

0% found this document useful (0 votes)

9 views4 pages

Digital Assignment-1: Name: Bejugam Shiva Suprith REG NO: 18BCE0427 Faculty: Natarajan P SLOT: L45+L46

Uploaded by

shiva

Copyright:

Available Formats

Download as PDF, TXT or read online from Scribd

Flag for inappropriate content

Download as pdf or txt

Jump to Page

You are on page 1of 4

Search inside document

DIGITAL ASSIGNMENT-1

NAME: BEJUGAM SHIVA SUPRITH

REG NO: 18BCE0427

FACULTY: NATARAJAN P

SLOT: L45+L46
1. Write a program to Tokenize the given document or data and compute the frequency of
words?

CODE:

#18BCE0427

import nltk

data= 'Web Mining is the process of Data Mining techniques to automatically discover and
extract information from Web documents and services. The main purpose of web mining is
discovering useful information from the World-Wide Web and its usage patterns.'

#tokenising the given data

from nltk.tokenize import word_tokenize

word=word_tokenize(data)

print(word_tokenize(data))

#calculating word frequency

word_count={}

for i in wordt:

if i in word_count:

word_count[i]=word_count[i]+1

else:

word_count[i]=1
print(word_count)

OUTPUT:

2. Write a program to remove the stop word and to do Stemming?

CODE:

from nltk.corpus import stopwords

stopwords=set(stopwords.words('english'))

print(stopwords)

ﬁltered_words=[]

for i in word:

if i not in stopwords:

ﬁltered_words.append(i)

print(ﬁltered_words)
##stemming

from nltk.stem import PorterStemmer

ps=PorterStemmer()

stemmed_words=[]

for i in ﬁltered_words:

stemmed_words.append(ps.stem(i))

print(stemmed_words)

OUTPUT:

Wm-Cse3024: Lab L29+30
Document5 pages
Wm-Cse3024: Lab L29+30
blind stark
No ratings yet
Wm-Cse3024: Lab L29+30
Document5 pages
Wm-Cse3024: Lab L29+30
blind stark
No ratings yet
Ass 2
Document3 pages
Ass 2
ﭐﭠﮯﮚ ﻐﯿﺂﺒﮛ
No ratings yet
Python + MongoDB
Document12 pages
Python + MongoDB
rocioburgos00
No ratings yet
715 - Sanket Dalvi - 1 To 5
Document94 pages
715 - Sanket Dalvi - 1 To 5
Sanket Dalvi
No ratings yet
Compute PI Value PROJECT
Document13 pages
Compute PI Value PROJECT
Kapil Sidhpuria
No ratings yet
Practical CN
Document14 pages
Practical CN
mehtanish.20.ce
No ratings yet
Mak P 1
Document11 pages
Mak P 1
mnatsu0432
No ratings yet
Electronic Shop Management Project
Document28 pages
Electronic Shop Management Project
dragon drakster
No ratings yet
Analyzing Real-Time Data With Spark
Document7 pages
Analyzing Real-Time Data With Spark
EmmanuelDasi
No ratings yet
Contact Managment
Document17 pages
Contact Managment
Aagash Pranav
No ratings yet
WS1.2 Stamaria
Document4 pages
WS1.2 Stamaria
Jian Karlo
No ratings yet
Banking Management
Document17 pages
Banking Management
Nishita Yadav
100% (1)
Lesson9 Linq 2019
Document48 pages
Lesson9 Linq 2019
Zain Alabeeden Alareji
No ratings yet
Informatics Practicals
Document45 pages
Informatics Practicals
Freddy Francis
No ratings yet
Cs Practical
Document37 pages
Cs Practical
GUNJAN KUMAR
No ratings yet
Python Project Code Word For Cbse 12th Grocery Management
Document36 pages
Python Project Code Word For Cbse 12th Grocery Management
Vanisha Pathak
100% (1)
Important
Document12 pages
Important
Joseph
No ratings yet
Shania Shivika Lal
Document15 pages
Shania Shivika Lal
Rainald Avish chand
No ratings yet
Algorithm-Lab Updated
Document125 pages
Algorithm-Lab Updated
jansisce
No ratings yet
Data Structure File1
Document66 pages
Data Structure File1
Rakhi Soni
No ratings yet
Telecom Billing System: Pragallath P.S
Document16 pages
Telecom Billing System: Pragallath P.S
Pragallath PS
No ratings yet
Computer 1
Document74 pages
Computer 1
Tanvir Mohd
No ratings yet
Practical File Format - OOPC
Document25 pages
Practical File Format - OOPC
Malav Patel
No ratings yet
Ass 2
Document3 pages
Ass 2
Andriansyah
No ratings yet
Wa0017.
Document16 pages
Wa0017.
VERGE
No ratings yet
Project On . Ban King
Document18 pages
Project On . Ban King
Deepak Singh
No ratings yet
CNLab Manual
Document39 pages
CNLab Manual
kakumanuanitha0308
No ratings yet
Interface With ZKTeco
Document5 pages
Interface With ZKTeco
Anwar Ay
No ratings yet
CS Parking Word-1
Document21 pages
CS Parking Word-1
sharveshaa.12123psgps2023
No ratings yet
OOP Microproject
Document18 pages
OOP Microproject
Atharva
No ratings yet
Practical File 2
Document71 pages
Practical File 2
YASH MAKADIYA
No ratings yet
Lab Guide 12
Document4 pages
Lab Guide 12
ERDEM ATİLA
No ratings yet
Banking Management
Document17 pages
Banking Management
prem yadav
No ratings yet
ITK Programming For Help Function - Global PLM
Document4 pages
ITK Programming For Help Function - Global PLM
Eddie Sengola
No ratings yet
Vivekananda Institute of Professional Studies
Document107 pages
Vivekananda Institute of Professional Studies
vawok
No ratings yet
084 Himanshu Tandon JAVA
Document107 pages
084 Himanshu Tandon JAVA
vawok
No ratings yet
Updatged Cs Proj
Document20 pages
Updatged Cs Proj
krishoreraj23
No ratings yet
1 Course No: CSE 2206 Course Title: Sessional Based On CSE 2205
Document21 pages
1 Course No: CSE 2206 Course Title: Sessional Based On CSE 2205
Not
No ratings yet
CS Project Report Bankmanagementarpit, Dorjay, Namgail
Document23 pages
CS Project Report Bankmanagementarpit, Dorjay, Namgail
Arun Sharma
No ratings yet
Getting Data Using APIs
Document14 pages
Getting Data Using APIs
Mahmoud Yaseen
No ratings yet
Vineet
Document39 pages
Vineet
Vineet Yadav
No ratings yet
Index: Galgotias University
Document9 pages
Index: Galgotias University
nikhil kaushik
No ratings yet
DAA Practical File
Document27 pages
DAA Practical File
dietwithdubey
No ratings yet
Purpose of Study Data Structure and Algorithm: Write Optimized and Scalable Code
Document9 pages
Purpose of Study Data Structure and Algorithm: Write Optimized and Scalable Code
Khawar Khalil
No ratings yet
STM
Document72 pages
STM
Kiran Reddy
No ratings yet
PRACTICAL File Compiler Design
Document36 pages
PRACTICAL File Compiler Design
vishal
No ratings yet
Information Retrieval Journal
Document33 pages
Information Retrieval Journal
crazzy demon
No ratings yet
Practical File OF Computer Science (On C++ Programing)
Document22 pages
Practical File OF Computer Science (On C++ Programing)
Manwinder Singh Gill
No ratings yet
19-5E8 Tushara Priya
Document23 pages
19-5E8 Tushara Priya
19-5E8 Tushara Priya
No ratings yet
Fa20BEE086 Assignment Computing
Document14 pages
Fa20BEE086 Assignment Computing
shahrukh khan
No ratings yet
National Institute of Electronics and Information Technology
Document25 pages
National Institute of Electronics and Information Technology
kaushal.mdb85
0% (1)
Banking Management
Document16 pages
Banking Management
umarjaveedp
No ratings yet
Python Record Final
Document81 pages
Python Record Final
Bgmi 1
No ratings yet
MSC Computer Science 1st Sem Lab Record
Document98 pages
MSC Computer Science 1st Sem Lab Record
KishorJacob
No ratings yet
Dsa Files
Document38 pages
Dsa Files
niketangoyal3
No ratings yet
4.database Cosmetics
Document21 pages
4.database Cosmetics
Yash 906
100% (1)
A. D. Patel Institute of Technology: Mobile Computing and Wireless Communication (2170710)
Document38 pages
A. D. Patel Institute of Technology: Mobile Computing and Wireless Communication (2170710)
jerry tom
No ratings yet
Creating ASP.NET Core Web Applications: Proven Approaches to Application Design and Development
From Everand
Creating ASP.NET Core Web Applications: Proven Approaches to Application Design and Development
Dirk Strauss
No ratings yet
Web App Development and Real-Time Web Analytics with Python: Develop and Integrate Machine Learning Algorithms into Web Apps
From Everand
Web App Development and Real-Time Web Analytics with Python: Develop and Integrate Machine Learning Algorithms into Web Apps
Tshepo Chris Nokeri
No ratings yet
Digital Assignment-1
Document6 pages
Digital Assignment-1
shiva
No ratings yet
Digital Assignment-6: Name: Bejugam Shiva Suprith REG NO: 18BCE0427 Faculty: Narayanamoorthi M SLOT: L59+L60
Document14 pages
Digital Assignment-6: Name: Bejugam Shiva Suprith REG NO: 18BCE0427 Faculty: Narayanamoorthi M SLOT: L59+L60
shiva
No ratings yet
Digital Assignment-2
Document6 pages
Digital Assignment-2
shiva
No ratings yet
Digital Assignment-6: Name: Bejugam Shiva Suprith REG NO: 18BCE0427 Faculty: Natarajan P SLOT: L49+L50
Document2 pages
Digital Assignment-6: Name: Bejugam Shiva Suprith REG NO: 18BCE0427 Faculty: Natarajan P SLOT: L49+L50
shiva
No ratings yet
Digital Assignment-3: Q1) Write A Program For Encoding The Data?
Document5 pages
Digital Assignment-3: Q1) Write A Program For Encoding The Data?
shiva
No ratings yet
18bce0427 VL2020210104958 Ast06
Document2 pages
18bce0427 VL2020210104958 Ast06
shiva
No ratings yet
First Come First Serve: Name:N.V.R.Raghavendra
Document8 pages
First Come First Serve: Name:N.V.R.Raghavendra
shiva
No ratings yet
18bce0427 VL2020210104958 Ast04
Document2 pages
18bce0427 VL2020210104958 Ast04
shiva
No ratings yet
Digital Assignment - 3
Document11 pages
Digital Assignment - 3
shiva
No ratings yet
Digital Assignment-2: Name: Bejugam Shiva Suprith REG NO: 18BCE0427 Faculty: Narayamoorthy Slot: C1
Document7 pages
Digital Assignment-2: Name: Bejugam Shiva Suprith REG NO: 18BCE0427 Faculty: Narayamoorthy Slot: C1
shiva
No ratings yet
Digital Assignment-3: Name: Bejugam Shiva Suprith REG NO: 18BCE0427 Faculty: Vijaya Kumar SLOT: L51+L52
Document12 pages
Digital Assignment-3: Name: Bejugam Shiva Suprith REG NO: 18BCE0427 Faculty: Vijaya Kumar SLOT: L51+L52
shiva
No ratings yet
18bce0427 VL2019201000524 Da
Document5 pages
18bce0427 VL2019201000524 Da
shiva
No ratings yet