Welcome to Scribd!

Deep Learning in Speech Processing: Potentials and Challenges

Uploaded by

0% found this document useful (0 votes)

24 views4 pages

Deep learning has the potential to address challenges in speech recognition by deriving robust features directly from waveforms and learning long-range dependencies automatically. However, challenges remain in developing a basic theory to explain pre-training methods, integrating generative and discriminative models, representing sequences, discovering linguistic hierarchies, and combining supervised and unsupervised learning at scale.

Original Description:

Original Title

null

Copyright

Available Formats

PPTX, PDF, TXT or read online from Scribd

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Report this Document

Copyright:

Attribution Non-Commercial (BY-NC)

Available Formats

Download as PPTX, PDF, TXT or read online from Scribd

Flag for inappropriate content

Download as pptx, pdf, or txt

0% found this document useful (0 votes)

24 views4 pages

Deep Learning in Speech Processing: Potentials and Challenges

Uploaded by

api-25914596

Copyright:

Attribution Non-Commercial (BY-NC)

Available Formats

Download as PPTX, PDF, TXT or read online from Scribd

Flag for inappropriate content

Download as pptx, pdf, or txt

Jump to Page

You are on page 1of 4

Search inside document

Deep Learning in Speech Processing:

Potentials and Challenges

Dong Yu
Microsoft Research
Why Speech Recognition is Hard
 Sequential multi-class problem
 Variability
 Articulation differences
 Environment differences
 Variability
 Within each frame
 Along the whole sequence
 Variability
 Mapping between different layers
 Across different dialog contexts
11/04/2021 2 Dong Yu
Potentials of Deep Learning
 Derive robust and discriminative features
 Directly from waveforms and/or spectrums
 With many layers’ of transformations
 Compact with regard to the number of parameters
 Sparseness with regard to the number of active features
 Distributed with regard to the information storage
 Learn and incorporate long-range dependencies
 At different levels: semantic, syntactic, pronunciation
 Discovered automatically
 Learn to know when the context is important and when is
not
11/04/2021 3 Dong Yu
Challenges
 Basic theory
 Why greedy layer-wise pre-training helps?
 Is there better way to pre-train the models?
 Basic model
 How to integrate generative and discriminative abilities?
 How to represent sequential patterns ?
 How to discover the linguistic hierarchy?
 How to combine the supervised, unsupervised, and lightly-
supervised learning?
 Special considerations
 Is it robust to mismatched test conditions?
 Can we scale the learning process up to > 2000 hours of speech?
11/04/2021 4 Dong Yu

Teaching Listening, Revised Edition
From Everand
Teaching Listening, Revised Edition
Ekaterina Nemtchinova
No ratings yet
Mini Lesson Plan 3 Modeled Talk
Document4 pages
Mini Lesson Plan 3 Modeled Talk
api-352816488
No ratings yet
Share Sir 7 Steps Ell
Document8 pages
Share Sir 7 Steps Ell
Nikos Stathopoulos
No ratings yet
TEFL Speaking
Document24 pages
TEFL Speaking
palupi ningtyas
No ratings yet
IB Biology Y2: Evolution and Biodiversity
Document6 pages
IB Biology Y2: Evolution and Biodiversity
charbel Abou Maroun
No ratings yet
ORALCOMM S1 Q1 Jan.09
Document3 pages
ORALCOMM S1 Q1 Jan.09
AIVAN POQUIZ
No ratings yet
Mini Lesson Plan
Document9 pages
Mini Lesson Plan
api-347962298
No ratings yet
Reading Principles and Teaching
Document10 pages
Reading Principles and Teaching
Ervina Selviyana
No ratings yet
Oral Communication Teaching Guide 4 TEAC
Document6 pages
Oral Communication Teaching Guide 4 TEAC
Chanelyn Mabanta
100% (1)
8A Lesson Plan - Reading Skills - Static, Dynamic Charchter
Document4 pages
8A Lesson Plan - Reading Skills - Static, Dynamic Charchter
Rahma Munir
No ratings yet
The Science of Reading The Science of Instruction: Meets
Document23 pages
The Science of Reading The Science of Instruction: Meets
bekbek
100% (1)
10 Reflection Lesson Plan 10 English
Document2 pages
10 Reflection Lesson Plan 10 English
sci Pantallano
100% (1)
MGMT 252-Logic - Critical Thinking-Razi Allah Lone
Document4 pages
MGMT 252-Logic - Critical Thinking-Razi Allah Lone
nabiha
No ratings yet
Nation 2021
Document9 pages
Nation 2021
casandra garza
No ratings yet
Detailed Lesson Plan (DLP) Format: Learning Competency/ies: Code: EN8LC-Ia-5.1
Document4 pages
Detailed Lesson Plan (DLP) Format: Learning Competency/ies: Code: EN8LC-Ia-5.1
Cherlyn Arias Ibañez
No ratings yet
Quarter 1-Week 1-Day 3.revised
Document5 pages
Quarter 1-Week 1-Day 3.revised
Jigz Famulagan
No ratings yet
English 9 and 10
Document5 pages
English 9 and 10
karen estrada
No ratings yet
Schools Division of Toledo City: Detailed Lesson Plan (DLP)
Document3 pages
Schools Division of Toledo City: Detailed Lesson Plan (DLP)
Sheryl D. Delima
No ratings yet
MODULE 1 - Macroskills
Document8 pages
MODULE 1 - Macroskills
Ize Pentecostes
No ratings yet
Ni Putu Purnama Dewi - 3173702 - Assignsubmission - File - GROUP 5-CURRENT RESEARCH
Document28 pages
Ni Putu Purnama Dewi - 3173702 - Assignsubmission - File - GROUP 5-CURRENT RESEARCH
purnama dewi
No ratings yet
Detailed Lesson Plan (DLP) Format: Learning Competency/ies: Code: EN8LC-Ia-5.1
Document4 pages
Detailed Lesson Plan (DLP) Format: Learning Competency/ies: Code: EN8LC-Ia-5.1
Cherlyn Arias Ibañez
No ratings yet
Week 11 Occ DLL 18 - 19
Document5 pages
Week 11 Occ DLL 18 - 19
Valerie Cruz - Ocampo
No ratings yet
Developing Improvisation:: How Preservice Secondary English Language Arts Teachers Developed Pedagogical Genres
Document13 pages
Developing Improvisation:: How Preservice Secondary English Language Arts Teachers Developed Pedagogical Genres
sherrymi
No ratings yet
DLP On Biases
Document8 pages
DLP On Biases
Rachel Ann Carin
No ratings yet
Oral Communication Lesson Plan 2
Document5 pages
Oral Communication Lesson Plan 2
Queen Mae Sayman
No ratings yet
Co 4 New Format 2023 2024
Document12 pages
Co 4 New Format 2023 2024
Doreen Graziel Abadia Sabulao
No ratings yet
A Detailed Lesson in EAPP
Document7 pages
A Detailed Lesson in EAPP
Abbegail Pearl Domingo
No ratings yet
Elt Methodology. Year 4. Session 23 - Veselovska Iryna
Document25 pages
Elt Methodology. Year 4. Session 23 - Veselovska Iryna
Іра Веселовська
No ratings yet
PLC Agenda and Inquiry Actions
Document7 pages
PLC Agenda and Inquiry Actions
api-564338617
No ratings yet
Syllabus Oral Communication
Document11 pages
Syllabus Oral Communication
Aseret Miho
No ratings yet
G8 ENG Unit Learning Plan 3rdQ
Document6 pages
G8 ENG Unit Learning Plan 3rdQ
arjhay
No ratings yet
Text Complexity
Document46 pages
Text Complexity
Laiza May Adlao Lampad
No ratings yet
FSW School of Education Lesson Plan Template
Document3 pages
FSW School of Education Lesson Plan Template
api-404792374
100% (1)
Bible Lesson Plan
Document4 pages
Bible Lesson Plan
api-354551047
No ratings yet
G6 LP 4
Document4 pages
G6 LP 4
Angelou Leanillo
No ratings yet
Go To Page
Document4 pages
Go To Page
api-482430210
No ratings yet
Mini Lesson Plan
Document9 pages
Mini Lesson Plan
api-347962298
No ratings yet
Detailed Lesson Plan (DLP) Format: Learning Competency/ies: Code: EN7WC-I-h-2.2
Document2 pages
Detailed Lesson Plan (DLP) Format: Learning Competency/ies: Code: EN7WC-I-h-2.2
Jailah Rodrigo
No ratings yet
PurComm Course Syllabus 5th Version
Document6 pages
PurComm Course Syllabus 5th Version
ferdinand calvo
No ratings yet
Preparing Students For Success in Module 2
Document12 pages
Preparing Students For Success in Module 2
madison77taylor7
No ratings yet
WK 4 Linguistic Cognitive Demand Assignment
Document4 pages
WK 4 Linguistic Cognitive Demand Assignment
miloortizbernal
No ratings yet
Co 4 New Format 2023 2024
Document10 pages
Co 4 New Format 2023 2024
Doreen Graziel Abadia Sabulao
No ratings yet
Activity-Based Lesson (GROUP/PAIR Task: (Based On Your Capsule Research Proposal)
Document9 pages
Activity-Based Lesson (GROUP/PAIR Task: (Based On Your Capsule Research Proposal)
Lois Razon
No ratings yet
RPS Sociolinguistics
Document7 pages
RPS Sociolinguistics
REGINA CAHYANI
No ratings yet
Esol Differentiation Instructions
Document11 pages
Esol Differentiation Instructions
Sokolova Olga
No ratings yet
SYLLABUS in INTRODUCTION TO LINGUISTICS
Document8 pages
SYLLABUS in INTRODUCTION TO LINGUISTICS
Dom Celestino Martin
100% (1)
Report 4
Document5 pages
Report 4
api-550609829
No ratings yet
Ingles Fase Individual
Document8 pages
Ingles Fase Individual
WILSON ARLEY
No ratings yet
How To Teach Speaking
Document41 pages
How To Teach Speaking
Sandry Marce
100% (1)
Final Unit Plan
Document10 pages
Final Unit Plan
api-462892684
No ratings yet
Contact Session 2-Listening
Document5 pages
Contact Session 2-Listening
olga
No ratings yet
2Q Planificación Microcurricular 8th
Document2 pages
2Q Planificación Microcurricular 8th
Abigail Sisalema Bastidas
No ratings yet
OC Types of Communicative Strategy
Document2 pages
OC Types of Communicative Strategy
Zeen Dee
100% (2)
Science of Reading
Document33 pages
Science of Reading
CAMILLE GRACILLA
No ratings yet
Scaffolding Strategies For ELLs PDF
Document31 pages
Scaffolding Strategies For ELLs PDF
Aman Gaur
100% (1)
1 Bgu Formato de Compactacion Curricular. 2020
Document2 pages
1 Bgu Formato de Compactacion Curricular. 2020
Edison Francisco
No ratings yet
EMZ 7e's Lesson Plan
Document5 pages
EMZ 7e's Lesson Plan
Emily Tatunay Espejo
No ratings yet
The Skill in Eap and Eop
Document16 pages
The Skill in Eap and Eop
Prilia Dwiher Fitriana
67% (3)
Republic of The Philippines
Document5 pages
Republic of The Philippines
Sai Rill
100% (1)
FS3 Learning Task 5
Document10 pages
FS3 Learning Task 5
Tabios Erica
No ratings yet
Exponential Family Harmoniums With An Application To Information Retrieval
Document8 pages
Exponential Family Harmoniums With An Application To Information Retrieval
api-25914596
No ratings yet
Automatic Musical Pattern Feature Extraction Using Convolutional Neural Network
Document5 pages
Automatic Musical Pattern Feature Extraction Using Convolutional Neural Network
api-25914596
No ratings yet
L D G M: Earning EEP Enerative Odels
Document84 pages
L D G M: Earning EEP Enerative Odels
api-25914596
No ratings yet
Learning Deep Architectures For AI - Yoshua Bengio
Document130 pages
Learning Deep Architectures For AI - Yoshua Bengio
John Jairo Silva
No ratings yet
Robust Speech Recognition Using Articulatory Information: Der Technischen Fakult at Der Universit at Bielefeld
Document148 pages
Robust Speech Recognition Using Articulatory Information: Der Technischen Fakult at Der Universit at Bielefeld
api-25914596
No ratings yet
Learn From Reviewers: Outline
Document8 pages
Learn From Reviewers: Outline
api-25914596
No ratings yet
Reducing The Dimensionality of Data With Neural Networks: Reports
Document4 pages
Reducing The Dimensionality of Data With Neural Networks: Reports
api-25914596
No ratings yet
Combining Anns To Improve Phone Recognition: Brian
Document4 pages
Combining Anns To Improve Phone Recognition: Brian
api-25914596
No ratings yet
Linear Dynamic Models For Automatic Speech Recognition
Document335 pages
Linear Dynamic Models For Automatic Speech Recognition
api-25914596
No ratings yet
Investigations Into Tandem Acoustic Modeling For The Aurora Task
Document4 pages
Investigations Into Tandem Acoustic Modeling For The Aurora Task
api-25914596
No ratings yet
Investigations Into Tandem Acoustic Modeling For The Aurora Task
Document1 page
Investigations Into Tandem Acoustic Modeling For The Aurora Task
api-25914596
No ratings yet
Tandem Connectionist Feature Extraction For Conventional HMM Systems
Document1 page
Tandem Connectionist Feature Extraction For Conventional HMM Systems
api-25914596
No ratings yet
Learning Structured Models For Phone Recognition
Document9 pages
Learning Structured Models For Phone Recognition
api-25914596
No ratings yet
Phone Recognition Using Restricted Boltzmann Machines: Department of Computer Science, University of Toronto
Document4 pages
Phone Recognition Using Restricted Boltzmann Machines: Department of Computer Science, University of Toronto
api-25914596
No ratings yet
Automatic Speech Recognition
Document2 pages
Automatic Speech Recognition
api-25914596
No ratings yet
Hidden Conditional Random Fields For Phone Recognition: Yun-Hsuan Sung and Dan Jurafsky
Document6 pages
Hidden Conditional Random Fields For Phone Recognition: Yun-Hsuan Sung and Dan Jurafsky
api-25914596
No ratings yet
Computing Arc Posteriors in A Word Lattice
Document4 pages
Computing Arc Posteriors in A Word Lattice
api-25914596
No ratings yet
DSR Front End
Document3 pages
DSR Front End
api-25914596
No ratings yet