Welcome to Scribd!

Exercise 2

Uploaded by

0% found this document useful (0 votes)

110 views3 pages

The document loads a corpus from NLTK and splits it into training and test data. It then explores the performance of various n-gram taggers on this data, including unigram, bigram, and trigram taggers. It also trains an averaged perceptron tagger using different numbers of iterations and evaluates the results. Finally, it trains three conditional random field models using different custom feature functions.

Original Description:

Original Title

Exercise-2.docx

Copyright

Available Formats

DOCX, PDF, TXT or read online from Scribd

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Report this Document

Copyright:

Available Formats

Download as DOCX, PDF, TXT or read online from Scribd

Flag for inappropriate content

Download as docx, pdf, or txt

0% found this document useful (0 votes)

110 views3 pages

Exercise 2

Uploaded by

joseph

Copyright:

Available Formats

Download as DOCX, PDF, TXT or read online from Scribd

Flag for inappropriate content

Download as docx, pdf, or txt

Jump to Page

You are on page 1of 3

Search inside document

Exercise 2:

Load the Browns corpus from NLTK (nltk.corpus.brown) with fiction category (pass the category
to the loader functions). From the corpus, load the tagged and untagged sentences. Make sure
that the tags are using the universal tag set.

To evaluate the taggers, divide the tagged sentence into 75-25 split for training tagging
algorithms and testing them. Report both the accuracy on the training data and testing data.
from nltk.corpus import brown
brown_fiction_tagged = brown.tagged_sents(categories='fiction', tagset='universal')

brown_train = brown_fiction_tagged[75:]
brown_test = brown_fiction_tagged[:25]

from nltk.tag import untag

test_sent = untag(brown_test[0])
print("Tagged: ", brown_test[0])
print("Untagged: ", test_sent)

from nltk import DefaultTagger

print('Accuracy on the training data: %4.1f%%' % (100.0 *
DefaultTagger('NUM').evaluate(brown_train)))
print('Accuracy on the testing data: %4.1f%%' % (100.0 *
DefaultTagger('NUM').evaluate(brown_test)))

Submit the notebook that performs the tasks below.

1. Explore the performance of N-Gram taggers on the corpus.

a. Unigram Tagger
from nltk.corpus import brown
from nltk import UnigramTagger
brown_fiction_tagged = brown.tagged_sents(categories='fiction',
tagset='universal')
brown_train = brown_fiction_tagged[75:]
brown_test = brown_fiction_tagged[:25]
t0=UnigramTagger(brown_train)
print('Accuracy: %4.1f%%' % ( 100.0 * t0.evaluate(brown_test)))
b. Unigram Tagger with a verb backoff
from nltk.corpus import brown
from nltk import DefaultTagger
from nltk import UnigramTagger
brown_fiction_tagged = brown.tagged_sents(categories='fiction',
tagset='universal')
brown_train = brown_fiction_tagged[75:]
brown_test = brown_fiction_tagged[:25]
t0=DefaultTagger('VB')
t1=UnigramTagger(brown_train, backoff=t0)
print('Accuracy: %4.1f%%' % ( 100.0 * t1.evaluate(brown_test)))
c. Trigram Tagger with Unigram Tagger and adjective backoff
from nltk.corpus import brown
from nltk import DefaultTagger
from nltk import UnigramTagger
from nltk import TrigramTagger
brown_fiction_tagged = brown.tagged_sents(categories='fiction',
tagset='universal')
brown_train = brown_fiction_tagged[75:]
brown_test = brown_fiction_tagged[:25]
t0=DefaultTagger('JJ')
t1=UnigramTagger(brown_train)
t2=TrigramTagger(brown_train, backoff=t0)
print('Accuracy: %4.1f%%' % ( 100.0 * t2.evaluate(brown_test)))
d. Trigram Tagger with a Bigram Tagger backoff
from nltk.corpus import brown
from nltk import BigramTagger
from nltk import TrigramTagger
brown_fiction_tagged = brown.tagged_sents(categories='fiction',
tagset='universal')
brown_train = brown_fiction_tagged[75:]
brown_test = brown_fiction_tagged[:25]
t0=BigramTagger(brown_train)
t1=TrigramTagger(brown_train, backoff=t0)
print('Accuracy: %4.1f%%' % ( 100.0 * t1.evaluate(brown_test)))
2. Train an Average Perceptron Tagger with different iterations. Compare the results of
using different iterations.
a. 1 iteration
import nltk
from nltk.corpus import brown
brown_fiction_tagged = brown.tagged_sents(categories='fiction',
tagset='universal')

brown_train = brown_fiction_tagged[75:]
brown_test = brown_fiction_tagged[:25]
from nltk.tag import untag
test_sent = untag(brown_test[0])

perceptron_trained = nltk.perceptron.PerceptronTagger(load=False)
perceptron_trained.train(brown_train, nr_iter=1)

print(perceptron_trained.evaluate(brown_train))
print(perceptron_trained.evaluate(brown_test))
b. 5 iteration
perceptron_trained.train(brown_train, nr_iter=5)
c. 10 iteration
perceptron_trained.train(brown_train, nr_iter=10)
3. Train a 3 Conditional Random Field using a different custom feature function. The
feature function must contain the features below. Model A should use features a-c.
Model B should use features a-e and Model C should use all the features.
a. Previous, Current, and Next Word
b. 1-3 Character Prefix
c. 1-3 Character Suffix
d. Capitalize
e. Word contains a number
f. Word is first in the sentence
g. Word is last in the sentence

Pet Identity Published Paper
Document9 pages
Pet Identity Published Paper
toysdreat
No ratings yet
Wolves in The Walls Creative Literacy Year 6
Document11 pages
Wolves in The Walls Creative Literacy Year 6
Adrian Jordan
91% (11)
Outcomes-Based Teaching and Learning Plan For Dbms 2: Libid, Binangonan, Rizal
Document4 pages
Outcomes-Based Teaching and Learning Plan For Dbms 2: Libid, Binangonan, Rizal
Eugene A. Estacio
No ratings yet
Cpe 133 PDF
Document9 pages
Cpe 133 PDF
jumar
No ratings yet
Syllabus m24-1 Ee, Ece. Cpe
Document8 pages
Syllabus m24-1 Ee, Ece. Cpe
garyart111
No ratings yet
JEDI Slides-Intro1-Chapter07-Java Arrays
Document23 pages
JEDI Slides-Intro1-Chapter07-Java Arrays
DANIELLE MARCELLANA
100% (1)
Ama Research Guidelines 2019
Document13 pages
Ama Research Guidelines 2019
meca jane
No ratings yet
Score Sheet in Thesis/Capstone Oral Defense: AMA University
Document1 page
Score Sheet in Thesis/Capstone Oral Defense: AMA University
Rafael Aquino
100% (1)
CIT BS Information Technology Prospectus 2007-2008
Document3 pages
CIT BS Information Technology Prospectus 2007-2008
Rhea Soriano Calvo
No ratings yet
Java Decision Making Statements
Document21 pages
Java Decision Making Statements
Joshua N Paul
No ratings yet
01 Student Manuscript Format
Document14 pages
01 Student Manuscript Format
Michelle Pasno
No ratings yet
C++ FQ Prelims
Document3 pages
C++ FQ Prelims
Rhexel Reyes
No ratings yet
Uae Questionnaire
Document3 pages
Uae Questionnaire
evah
No ratings yet
TVL Comprog11-Q3-M4
Document13 pages
TVL Comprog11-Q3-M4
d3462810
No ratings yet
BSIT Capstone Project Manuscript Standard Formatting
Document2 pages
BSIT Capstone Project Manuscript Standard Formatting
joesua
No ratings yet
Programming 1 Reviewer
Document9 pages
Programming 1 Reviewer
Monica May
No ratings yet
Capstone Project Documentation - Chapter Two - Sample Template
Document3 pages
Capstone Project Documentation - Chapter Two - Sample Template
Jerico De Vera Tamondong
No ratings yet
Third Quarter Exam Computer Programming (Java)
Document5 pages
Third Quarter Exam Computer Programming (Java)
kent
No ratings yet
ICT Programming G11 Dec 06 2019
Document2 pages
ICT Programming G11 Dec 06 2019
Jerome Manaig Suelto
No ratings yet
Learning Activity Sheet Java (LAS) - 5
Document9 pages
Learning Activity Sheet Java (LAS) - 5
lemuel sardual
No ratings yet
Title Proposal - Legend of Tamala
Document3 pages
Title Proposal - Legend of Tamala
Regji Indon
No ratings yet
Writing A Laboratory
Document18 pages
Writing A Laboratory
heeueu
No ratings yet
Computer Systems Servicing
Document8 pages
Computer Systems Servicing
Sergio B. Goco Jr.
No ratings yet
Quiz 005 - Attempt Review PDF
Document3 pages
Quiz 005 - Attempt Review PDF
katherine anne ortiz
No ratings yet
Soft Eng Chapter 1 and 2
Document18 pages
Soft Eng Chapter 1 and 2
Jomar
No ratings yet
Quiz 001 - Attempt Review PDF
Document3 pages
Quiz 001 - Attempt Review PDF
Peter Eclevia
No ratings yet
Hci Prelim Exam
Document2 pages
Hci Prelim Exam
Kristine Lily Ontog- Francisco
No ratings yet
COC 1 - Assemble and Disassemble
Document21 pages
COC 1 - Assemble and Disassemble
John Rhino Estomagulang Santos
No ratings yet
Itc P1
Document19 pages
Itc P1
rayden22
No ratings yet
Summative Test Emtech Lesson 3&4
Document1 page
Summative Test Emtech Lesson 3&4
Paul Ryan Villanueva
No ratings yet
PracRes Defense Form
Document2 pages
PracRes Defense Form
Jhon Paul Balanlay
No ratings yet
Cpe 422 - Microprocessors Systems
Document6 pages
Cpe 422 - Microprocessors Systems
James CE
No ratings yet
Sia102 Midterm Lab Activity 2
Document4 pages
Sia102 Midterm Lab Activity 2
Vida, John Paul
No ratings yet
COT Thesis and Capstone Project Procedures and Guidelines 2023
Document7 pages
COT Thesis and Capstone Project Procedures and Guidelines 2023
patricia gunio
No ratings yet
Name of Learner: - Subject Teacher: - Section: - Date
Document3 pages
Name of Learner: - Subject Teacher: - Section: - Date
Lynji Pedrosa
No ratings yet
Q2 PR-2-Week-5-6-Data Analysis
Document11 pages
Q2 PR-2-Week-5-6-Data Analysis
macristinaisabel.tallador
No ratings yet
Mobile Computing Lab Manual Updated On 20th March 2018
Document96 pages
Mobile Computing Lab Manual Updated On 20th March 2018
Niviya Dahiya
100% (1)
Office Productivity Tools 2
Document10 pages
Office Productivity Tools 2
sirhc_gabemid02
No ratings yet
2nd Summative-Test-Java-11-for 2nd Quarter
Document4 pages
2nd Summative-Test-Java-11-for 2nd Quarter
Mike John Maximo
No ratings yet
CpE 421-Operating System Engg
Document7 pages
CpE 421-Operating System Engg
James CE
100% (1)
Application Lifecycle MGT - FQuiz 2
Document4 pages
Application Lifecycle MGT - FQuiz 2
JaniceRemateNoble
No ratings yet
Quarter 1 - Apply Quality Printing
Document126 pages
Quarter 1 - Apply Quality Printing
GlezelBayubay
No ratings yet
Capstone Project Documentation Chapter 1 Sample Template
Document4 pages
Capstone Project Documentation Chapter 1 Sample Template
kevin felix caluag
No ratings yet
Technical Drawing 8 (Quarter 2 - Week 2)
Document4 pages
Technical Drawing 8 (Quarter 2 - Week 2)
cha
No ratings yet
UGRD-IT6200 Introduction To Human Computer Interaction / Human Computer Interaction Final Quiz 1 Grade 20.00 Out of 20.00 (100%)
Document14 pages
UGRD-IT6200 Introduction To Human Computer Interaction / Human Computer Interaction Final Quiz 1 Grade 20.00 Out of 20.00 (100%)
Louenna
No ratings yet
Senior High School (SHS) Work Immersion: Work Immersion Program of Activities (Skills Indicator and Training Plan)
Document2 pages
Senior High School (SHS) Work Immersion: Work Immersion Program of Activities (Skills Indicator and Training Plan)
Alfie Lariosa
100% (1)
Introduction To C#
Document46 pages
Introduction To C#
bnsamy
No ratings yet
Thesis
Document4 pages
Thesis
Baltazar Mhark
100% (2)
DIRECTION: Write The Letter of The Correct Answer On The Space Before Each Number
Document7 pages
DIRECTION: Write The Letter of The Correct Answer On The Space Before Each Number
Donna Elaine Ordoñez
No ratings yet
Excel Chapter Quiz
Document2 pages
Excel Chapter Quiz
Mark Joeseph Lontok
0% (1)
HDL. London: Pearson Education.: Course Syllabus
Document2 pages
HDL. London: Pearson Education.: Course Syllabus
djun033
No ratings yet
E-Tech 1ST Periodical Examination Sy 2022-2023
Document10 pages
E-Tech 1ST Periodical Examination Sy 2022-2023
maverick arquillo
No ratings yet
Salon de Samuel Online Reservation System 1. Background of Study
Document8 pages
Salon de Samuel Online Reservation System 1. Background of Study
abel
No ratings yet
Web-Based Procurement System
Document29 pages
Web-Based Procurement System
Mish Lei Franxh
100% (1)
1st Empowerment Technologies
Document2 pages
1st Empowerment Technologies
felix delfuso
No ratings yet
Techniques in Selecting and Organizing Information
Document25 pages
Techniques in Selecting and Organizing Information
Margie Tirado Javier
No ratings yet
TVL - CSS12 - Q2 - M2
Document10 pages
TVL - CSS12 - Q2 - M2
fast6
No ratings yet
Integrative Programming and Technology 1
Document4 pages
Integrative Programming and Technology 1
julius obregon
No ratings yet
2 Computer Programming Module 7
Document6 pages
2 Computer Programming Module 7
joel lacay
No ratings yet
AIML Record 56
Document28 pages
AIML Record 56
saisatwik bikumandla
No ratings yet
20MIS1025 - DecisionTree - Ipynb - Colaboratory
Document4 pages
20MIS1025 - DecisionTree - Ipynb - Colaboratory
Sandip Das
No ratings yet
Modifying Comparatives and Superlatives
Document3 pages
Modifying Comparatives and Superlatives
floruz
No ratings yet
Hello Secondary 3 The First Part
Document22 pages
Hello Secondary 3 The First Part
Ahmed
No ratings yet
English Expressions by Tanvir Hossain 400
Document109 pages
English Expressions by Tanvir Hossain 400
asdasd
No ratings yet
BuiNguyenHoang Lab W02
Document6 pages
BuiNguyenHoang Lab W02
Bùi Nguyên Hoàng
No ratings yet
CFE 105a - Knowing More - Indeigenous Peoples in The Philippines
Document4 pages
CFE 105a - Knowing More - Indeigenous Peoples in The Philippines
Irvin Ongyaco
No ratings yet
Irregular Verbs
Document1 page
Irregular Verbs
dima telesov
No ratings yet
English 4 - Q1 - Week 2
Document11 pages
English 4 - Q1 - Week 2
cathylee pablo
No ratings yet
Discussion Director
Document7 pages
Discussion Director
api-208979338
No ratings yet
Spark 4 Second Period
Document36 pages
Spark 4 Second Period
isli
No ratings yet
Dli 2
Document235 pages
Dli 2
Măriuca Măry
100% (1)
Neni Noviani
Document109 pages
Neni Noviani
Khansa Sweet7
No ratings yet
Lesson Plan KSSR - English Language Reading LINUS
Document2 pages
Lesson Plan KSSR - English Language Reading LINUS
reza.first
No ratings yet
Perpormance Task in Oral Comm
Document4 pages
Perpormance Task in Oral Comm
AN NE
No ratings yet
Malayalam Syllabus
Document3 pages
Malayalam Syllabus
Jishnu Asok
No ratings yet
(Official) AVTC5 - Unit 2 - Maps
Document20 pages
(Official) AVTC5 - Unit 2 - Maps
nhattuan1888
No ratings yet
Monthly Reading Progress Chart: Grade 2-Maalaga
Document2 pages
Monthly Reading Progress Chart: Grade 2-Maalaga
yesha mayvinz
No ratings yet
Diccionario Histórico de Telas y Tejidos. Castellano - Catalán
Document3 pages
Diccionario Histórico de Telas y Tejidos. Castellano - Catalán
juan carlos
No ratings yet
Gregg Shorthand
Document4 pages
Gregg Shorthand
Rosemarie Herrera
100% (1)
ACCESSIBLE Year 7 Student Booklet
Document30 pages
ACCESSIBLE Year 7 Student Booklet
Hamsika Ethrouthu
No ratings yet
Writing Project 2 2T
Document6 pages
Writing Project 2 2T
GABRIELA WARA SUXO CHOQUE
No ratings yet
IPA by Selina, A Vietnamese English Teacher
Document4 pages
IPA by Selina, A Vietnamese English Teacher
yenvutmu
No ratings yet
397-Article Text-1120-1-10-20171130
Document10 pages
397-Article Text-1120-1-10-20171130
Naniek Kohdrata
No ratings yet
Qualities of A Good Essay: An Assessment of The Writings of Nigerian Undergraduates
Document7 pages
Qualities of A Good Essay: An Assessment of The Writings of Nigerian Undergraduates
researchparks
No ratings yet
Biblical Idioms
Document3 pages
Biblical Idioms
Sophie
No ratings yet
DLP in English 3 (w2)
Document6 pages
DLP in English 3 (w2)
Rochelle May Canlas
100% (2)
SB P 11EX 7-8 (Plural) PPT PRACTICE: Write The Plural Forms SB P 11 Ex 10 A: Sts First Complete On Their Own and Then Check Their Answers
Document35 pages
SB P 11EX 7-8 (Plural) PPT PRACTICE: Write The Plural Forms SB P 11 Ex 10 A: Sts First Complete On Their Own and Then Check Their Answers
J Dave Elguera
No ratings yet
Answer Key: Cumulative Test
Document2 pages
Answer Key: Cumulative Test
Teodora Mitrovic
No ratings yet
Solution To Guide # 1 English Solar Arias Luisa Fernanda Jorge C 11A
Document7 pages
Solution To Guide # 1 English Solar Arias Luisa Fernanda Jorge C 11A
Camilo
No ratings yet
Degrees of Comparison Worksheets
Document6 pages
Degrees of Comparison Worksheets
Merlina Aryanti
No ratings yet