Download as docx, pdf, or txt
Download as docx, pdf, or txt
You are on page 1of 4

HÁLÓ LÉTREHOZÁSA

A számsor_felismerő/tesztelés/szám_nyelvtan_1 fájl alapján hozzuk létre


a tanító nyelvtani hálónkat.

Ehhez a HParse függvényt kell alkalmaznunk:

Parancs: HParse -T 0002 szám_nyelvtan_1 szám_nyelvtani_háló_1

A függvény futtatásának eredménye a szám_nyelvtani_háló_1 fájl, ami 30


csomópontot és 54 összeköttetést tartalmaz. Ezt a fájlt fogjuk felhasználni
a HMM modellek betanításához.

HÁLÓ TESZTELÉSE

Ahhoz, hogy tesztelni tudjuk létrejött modellünket, a HSGen függvénnyel mintákat


kell generálnunk. A függvényben megadhatjuk a generált minták számát (ebben az
esetben 100 mintát fogunk létrehozni).

Parancs: HSGen -l -n 100 szám_nyelvtani_háló_1 szám_szótár >


szám_teszt_1

A függvény eredménye a számt_tesz_1 fájl. Nyissuk meg a fájlt és nézzük meg


milyen minták generálódtak.

Láthatjuk, hogy ezzel a nyelvtannal létrejönnek nem értelmezhető kifejezések is.

FELADAT
A leírás alapján, hozzuk létre
a számsor_felismerő/tesztelés/szám_nyelvtan_2 nyelvtani hálóját és
teszteljük azt, majd hasonlítsuk össze a két generált mintahalmazt, hogy
megértsük mekkora különbséget jelent a jól definiált nyelvtan.

KÖVETKEZŐ LÉPÉS
 

Az egyes szavak szótárban szereplő alakjaik alapján hozzuk létre minden


egyes hangfájl címke (label) fájlját. A fájlok neveinek meg kell egyeznie a
hangfájlok nevével.

A label fájlok foglalják magukba az adott hangfájl tartalmát az


előre definiált nyelvtani formában.

A label fájlokat tárolhatjuk együtt a hangfájlokkal vagy külön mappában.


Ha a tanítás során nem adjuk meg külön paraméterben a label fájlok
helyét, akkor automatikusan a hivatkozott hangfájl mappájában fogja
keresni a tanítónk.

CÍMKE FÁJL
 

A hanganyagainkhoz tartozó label fájljainkat
a számsor_felismerő/tanítás/label mappában találjuk. A mi esetünkben
csak néhány label fájlra van szükségünk, mivel minden egyes bemondótól
ugyanazt a bemondást rögzítették az beszédadatbázis készítői, így a label
fájlok tartalma és száma személyenként egyforma.

Léteznek azonban olyan adatbázisok is, amik több száz olyan hangmintát
tartalmaznak, amiknek a tartalma egyenként eltérő. Ilyen esetekben
hatalmas munka lenne kézzel elkészíteni a címkefájlokat, így érdemes
inkább energiánkat a létrehozás leprogramozására fordítani, mert az sem
garantált, hogy a tesztelések és a betanítás során nem e lesz szükségünk
módosítani a leíró fájlokat.

CÍMKE FÁJL TARTALMA

Nyissuk meg az adatbázisunkhoz tartozó egyik label fájlt. Láthatjuk, hogy


a hangfájl szöveges átiratát tartalmazza a szótárban definiált formában
szünettel az elején és a végén.

A label fájl tartalmazhatja az egyes egységek hangfájlon belüli időzítését


is. A időzítést 100 ns egységekben adhatjuk meg. Ehhez persze
szükségünk van a az adott hangfájl szegmentálására, vagy saját
magunknak kell elvégeznünk a szegmentálást, ami hatalmas munkát
jelent.

Például:

0000000 2200000 _tvEn

2200000 3600000 hA:rom

3600000 4300000 EzEr


MASTER LABEL FILE

A tanításhoz szükségünk van egy Master Label file (MLF) fájlra is, ami
magába foglalja az összes label fájl tartalmát és neveit, elérésük
útvonalával együtt. A HTK kézikönyv ajánlása szerint
érdemes .mlf kiterjesztéssel létrehozni.

Az MLF első sora magát a Master Label File-t azonosítja -> #!MLF!#

A tanító MLF fájlunkat a számsor_felismerő/tanítás/ mappában
találjuk szám_tanító.mlf néven.

Ha megnyitjuk az MLF fájlunkat, láthatjuk, hogy szintaktikája nagyon


egyszerű és jól programozható, ha egyszer olyan betanítást akarnánk
elvégezni, ahol nagyságrendekkel nagyobb adatbázist kell alkalmaznunk
ráadásul a felismerési egység hang alapú, egy egyszerű script
segítségével létrehozhatjuk.

MASTER LABEL FILE ÁLTALÁNOS FELÉPÍTÉSE


 

#!MLF!#

"*/fájl_név_1.lab"

fájl_név_1.lab fájl tartalma

"*/ fájl_név_2.lab"

fájl_név_2.lab fájl tartalma

.
"*/fájl_név_3.lab"

fájl_név_3.lab fájl tartalma

"*/fájl_név_n.lab"

fájl_név_n.lab fájl tartalma

FELADAT
Hozzuk létre a korábban rögzített 10 bemondásunkhoz a label fájlokat és
az MLF fájlt a bemutatott módon.

Ezekre a tesztelés során lesz szükségünk.

Például a 352.wav általunk létrehozott hangfájlhoz tartozó címkefájl:

sil

hA:rom

sA:z

_tvEn

kEt:_:

sil

You might also like