14 OpenMP (2) v2

OpenMP
Odredbe (klauzule)
Direktive za sinhronizaciju
Odredbe (klauzule)
To opcije kojima se na jednostavn i moan nain
moe upravljati ponaanjem konstrukcije na koju

su primenjene.
Shared
private
lastprivate
firstprivate
default
nowait
schedule
if
num_threads
ordered
reduction
copyin
copyprivate
Odredba shared
Koristi se da definie koje e promenljive biti
zajednike (deljive) za tim niti u paralelnom

regionu.
To ukazuje da postoji samo jedna jedinstvena instanca
promenljive i da je svaka nit moe itati ili

modifikovati.
Sintaksa
shared (lista_promenljivih)
Sve promenljive navedene u listi e biti deljive (zajednike)
Primer
Sve niti mogu da itaju i upisuju u vektor a.

Unutar paralelne petlje svaka nit e pristupiti postojeoj vrednosti
elementa a[i] i izraunati novu vrednost.

Nakon okonanja paralelnog regiona sve nove vrednosti elemenata
vektora a e biti zapamene u glavnoj memoriji gde im master nit
moe pristupiti.
Kao posledica deljenja pristupa istoj promenljivoj, moe se

desiti da se aurira ista memorijskaj lokacija ili da jedna nit
pokuava da proita sadraj lokacije dok druga pokuava da
upie u nju.
Zbog toga je potrerbno voditi rauna da ne doe do ovakvih situacija i
da se pristup deljivim promenljivim odvija kako se zahteva

algoritmom.
Odredba private
Omoguava da se definie koje e promenljive
biti privatne za svaku nit u timu

Sintaksa
private (lista_promenljivih)
Svaka promenljiva u listi se replicira tako da svaka nit u timu
ima ekskluzivno pravo pristupa svojoj kopiji promenljive.
Promene koje uini jedna nit nisu vidljive drugoj niti.
U OpenMP, promenljive koje su deklarisane lokalno unutar
strukturnog bloka ili rutine (funkcije) koja se poziva u okviru
paralelnog regiona, su privatne po definiciji (by default)
Po definiciji, indeksna promenljiva u for petlji je privatna za
svaku nit, tj. svaka nit ima svoju kopiju indeksne promenljive
Vrednosti privatnih promenljivih nisu definisane na ulasku i
izlasku iz paralelnog regiona, ak i ako je promenljiva bila
definisana pre ulaska u paralelni region.
Primer
U ovom primeru i
iterativna (indeksna)
promenljiva i i a su
privatne.
Da je promenljiva a bila
deklarisana kao deljiva

(shared) vie niti bi
pokualo da aurira istu
promenljivu razliitim
vrednostima na
nekontrolisani nain.
Konana vrednost bi
zavisila od toga koja nit
je poslednja upisala
vrednost
Mogui izlaz iz gornjeg programa za n=5 i tri niti bi

moga biti
Odredba lastprivate
ta ako je promenljiva a iz prethodnog primera
potrebna nakon okonanja paraelnog regiona?

Privatnim promenljivima se ne moe pristupati nakon
okonanja paralelnog regiona (petlje ili sekcije).
Odredba lastprivate (lista_promenljivih)

obezbeuje da vrednost promeljivih navedenih u listi
budu definisane nakon izlaska iz paralelnog regiona.
Poslednja vrednost (lastprivate) kod sekvencijalnog
izvrenja je nedvosmislena.
Meutim, kod paralelnog izvrenja je potrebno objasniti ta
znai poslednja vrednost.
U sluaju da se radi o paralelnoj for petlji, promenljiva e
nakon okonanja paralelne petlje imati vrednost koju bi imala
nakon poslednje iteracije sekvencijalne petlje.
Ako se odredba lastprivate koristi sa section direktivom

onda promenljiva dobija vrednost koju ima na kraju u
leksikografski poslednjoj section konstrukciji.
Primer
Izlaz iz programa za n=5 bi mogao da izgleda ovako
Odredba firstprivate
Privatne promenljive paralelnog regiona nisu
inicijalizovane na ulasku u paralelni region.

Odredbom
firstprivate (lista_promenljivih)
se promenljive navedene u listi promenljivih deklariu kao
privatne, ali se inicijalizuju na vrednost promenljive sa istim
imenom koja se nalazi van paralelnog regiona.
Inicijalizaciju obavlja polazna (master) nit pre izvrenja
paralelne konstrukcije
Primer
incr = 0;
#pragma omp parallel for firstprivate (incr)
for (i = 0; i <= MAX; i++)
{
if ((i%2)==0) incr++;
A[i] = incr;
}
Svaka nit dobija svoju
kopiju promenljive incr
inicijalizovanu na 0
Primer
Razlika izmeu private i firstprivate odredbe
A = 1, B = 1, C = 1
#pragma omp parallel private(B) firstprivate(C)
Da li su A,B,C lokalne za svaku nit ili su deljive unutar
paralelnog regiona?
Koje su inicijalne vrednosti ovih promenljivih na poetku i
kraju paralelnog regiona?
Unitar paralelnog regiona ...
A je deljiva za sve niti i njena vrednost na ulasku u paralelni region
je 1.
B i C su lokalne promenljive za svaku nit.
vrednost promenljive B na ulasku u paralelni region nije definisana
Inicijalna vrednost promenljive C u paralelnom regionu je 1
Nakon izlaska iz paralelnog regiona...
B i C e se vratiti na vrednosti pre ulaska u paralelni region, tj. imae
vrednost 1
A e imati vrednost koju je dobio unutar paralelnog regiona (ili 1 ako
joj vrednost nije promenjena u paralelnom regionu)
Odredba default
Koristi se da dodeli promenljivima podrazumevani

atribut deljenja. .
Sintaksa u C/C++
default (none | shared)
default(private) nije dostupna u C/C++, ali jeste u FORTRANu, i
deklarie sve promenljive kao privatne
Ova odredba se koristi da definie atribut deljenja za veinu
promenljivih u paralelnoj konstrukciji, a samo izuzetci se

eksplicitno navode u okviru drugih odrdbi (private,
firstprivate ili lastprivate).
Npr
#pragma omp for default (shared) private (a,b,c)
deklarie da su sve promenljive deljive izuzev promenljivih
a, b i c.
Ako se koristi default (none) onda programer mora za svaku
promenljivu koja se koristi u paralelnoj konstrukciji da
navede atribut deljenja.
Odredba nowait
Ova odredba omoguava programeru da fino podesi
performanse.
Kod svih direktiva za podelu posla postoji implicitna barijera
koja uslovljava da sve niti iz tima moraju da se sinhronizuju na

kraju tj. da saekaju da sve niti okonaju sa izvrenjem
paralelne konstrukcije.
Ovom odredbom se to pravilo ponitava.
Ako se ova odredba koristi, kada nit doe do kraja konstrukcije odmah
nastavlja dalje sa izvrenjem, tj. ne eka se da sve niti okonaju.
Ipak, barijera na kraju paralelnog regiona se ne
moe ponititi
Kada nit okona posao u paralelnoj for
petlji moe da nastavi dalje bez ekanja
na ostale niti.
Primer
Treba biti oprezan sa korienjem ove odredbe!
ako bi postavili nowait odredbu uz prvu
paralelnu for petlju, moglo bi se doi u situaciju

da vrednost a[i] nije izraunata a da je potrebna
za b[i].
Odredba schedule
Ova odredba se moe koristiti samo sa
paralelnom for direktivom.
Koristi se da se upravlja nainom rasporeivanja
(distribucije) iteracija petlje izmeu niti to moe imati

znaajnog uticaja na performanse programa
Sintaksa
schedule (kind [, chunk size]).
Odredba schedule definie kako se iteracije petlje
dodeljuju nitima u timu.

Granularnost distribucije je chunk (pare) kontinualnog,
nepraznog podskupa iterativnog prostora.
Parametar chunk_size ne mora biti konstanta;
bilo koji celobrojni izraz sa pozitivnom vrednou moe biti
iskorien za definisanje chunk_size.
Postoje etiri naina distribucije:
static, dynamic, guded, runtime
Distribucija static.
Najjednostavnija distribucija je static.
Iteracije se dodeljuju nitima u blokovima veliine
chunk_size.
Blokovi se dodeljuju nitima statiki kruno (na round
robin nain) po redosledu brojeva niti.
Poslednji blok koji se dodeljuje niti moe biti manji, tj.
imati manji broj iteracija.
Ako nije definisan parametar chunk_size, iterativni
prostor se deli na blokove priblino jednake veliine.
npr ako imamo 200 iteracija i 4 niti, svakoj niti e biti
dodeljeno po 50 iteracija petlje (nit 0 iteracije 0-49, nit 1
iteracije 50-99, itd)
Svakoj niti se dodeljuje bar jedan blok.
Distribucija dynamic
Iteracije se dodeljuju nitima po zahtevu niti.
Nit izvrava blok iteracija ija je veliina definisana
vrednou parametra chunk_size, zatim zahteva
sledei blok sve dok ima blokova koji treba da se
obrade.
Poslednji blok moe imati manje iteracija od
chunk_size.
Ako nije definisan chunk_size, podrazumevana
veliina bloka je 1.
broj paralelnih niti moe da varira od jednog do
drugog paralelnog regiona
broj niti koji se definie promenljivom okruenja predstavlja
gornju granicu, tj. broj niti u paralelnom regionu moe biti i

manji
Distribucija guided.
To je varijacija distribucije dynamic.
Iteracije se dodeljuju nitima po zahtevu niti.
Nit izvrava blok iteracija ija je veliina definisana
parametrom chunk_size.
Kada okona izvrenje bloka, nit zahteva sledei blok, itd.
Ako parametar chunk_size ima vrednost 1, tada je veliina
svakog bloka proporcionalna broju neizvrenih
(nedodeljenih) iteracija podeljena sa ukupnim brojem niti,
dok se ne doe do veliine 1.
Veliina bloka se smanjuje eksponencijalno do veliine chunk_size.
Ako parametar hunk_size ima vrednost k (k >1),
veliina bloka se odreuje na isti nain sa ogranienjem

da blok ne moe imati manje od k iteracija (sa
izuzetkom poslednjeg bloka koji moe biti manji).
Ako parametar chunk_size nije naveden podrazumeva
se vrednost 1.
Distribucija runtime.
Ako je ova distribucija odabrana, odluka o nainu
dodeljivanja iteracija petlje nitima donosi se u toku

izvrenja programa.
Nain distribucije kao i veliina bloka (chunk_size) se
definiu preko OMP_SCHEDULE promenljive okruenja
(environment variable).
____________
Ako nije navedena odredba schedule,
podrazumevana distribucija je zavsina od

implementacije.
Dva najee koriena naina distribucije iteracija
petlje po nitima su statiko i dinamiko.
Primer distribucije static, dynamic i guided
za static distribuciju nije navedena vrednost chunk_size pa je iterativni prostor od

500 iteracija podeljen na 4 niti od po 125 iteracija
dynamic i guided koriste chunk_size=5
kod dynamic prvoj niti se dodeljuje 125 iteracija, drugoj (500-125)/4, itd dok se ne
dodje do veliine chunk_size=5
Sinhronizacione direktive u
Ove direktive omoguavaju da se sinhronizuje
OpenMP
pristup deljivim promenljivim od strane vie niti.
Algoritam moe zahtevati da se orkestrira (upravlja)
redosledom pristupa deljivim promenljivim da bi se

obezbedilo da vie niti ne pristupa jednovremeno
deljivoj promenljivoj radi upisa.
Za sinhronizaciju su na raspolaganju sledee
direktive
barrier
ordered
critical
atomic
master
biblioteke funkcje lock
Barrier direktiva
Barijera je taka u izvrenju programa u kojoj niti ekaju
jedna drugu tako da ni jedna nit ne moe da produi sa

izvrenjem dok sve niti iz tima niti ne stignu u barijeru.
Mnoge OMP direktive u sebi ve sadre implicitno barijere, tj.
kompajler automatski umee barijere na kraj direktive tako da

sve niti tu ekaju dok se ne obavi ceo posao specificiran
direktivom (npr. for petljom).
Zbog toga esto nije neophodno da programer eksplicitno
ubacuje barijere u program.
Meutim ako je to potrebno OMP to omoguava.
Sintaksa u C/C++
#pragma omp barrier
Dve stvari o kojima se mora voditi rauna kod korienja barrier

direktive :
Do svake barijere moraju stii sve niti ili ni jedna nit
redosled barijera na koje nailaze niti mora biti isti za sve niti u timu
Bez ovih ogranienja moglo bi se desiti da se napie program gde neke

niti ekaju beskonano dugo (zauvek) da ostale niti stignu u barijeru
Primer1- Barrier sinhronizacija
Barijere se najee koriste da bi se izbegle trke podacima.

Ubacivanje barijere izmeu upisa i itanja deljive promenljive garantuje da se pristup
obavlja u korektnom redosledu, npr. da se upis okonao pre nego to neka
druga nit trai da proita deljivu promenljivu
Primer2 barrier sinhronizacije
Direktiva ordered
Omoguava da se strukturni blok u okviru
paralelne petlje izvri sekvencijalno.
Sintaksa direktive u C/C++

#pragma omp ordered
strukturni blok
Kod van ovog bloka se izvrava paralelno.
Kada nit koja izvrava prvu iteraciju petlje naie na ordered
direktivu, ona ulazi u strukturni blok bez ekanja.
Da bi neka nit koja izvrva neku drugu iteraciju petlje
izvrila naredbe koje se nalaze u strukturnom bloku mora
da saeka da sve niti koje izvravaju prethodne iteracije
okonaju izvrenje strukturnog bloka u okviru ordered
konstrukcije
Ako se koristi ova direktiva onda se mora iskoristiti i
klauzula (odredba) ordered uz paralelni region u kojem se
koristi direktiva ordered.
Korienje klauzule informie kompajler da se koristi
konstrukcija ordered
Odredba ordered
Ova odredba nema nikakve argumente i
podrana je samo sa petljama.
Ova odredba mora da se iskoristi ako se koristi
direktiva ordered paralelnom regionu

svrha ove odredbe je da informie kompajler o prisustvu
ordered direktive.
Primer
ordered direktiva se se koristi da bi se obezbedilo da se elementi

vektora a, a[i], tampaju po redu i=0,1,2,...,n-1.
Auriranja elemenata vektora a se mogu obavljati u bilo kom redosledu
Mogui izlaz iz programa za n=9 i 4 niti
Direktiva critical
Omoguava da niti pristupaju kritinoj sekciji
uzajamno iskljuivo.
Kritinoj sekciji se opciono moe dati ime.
Ovo ime je globalno i mora biti jedinstveno.
U protivnom bi ponaanje programa bilo nepredvidivo.
Kada neka nit naie na konstrukciju critical ona
eka da druga nit okona pristup kritinoj

sekciji pre nego to ona ue u kritinu sekciju.
Sintaksa
#pragma omp critical [(ime)]
strukturni blok
Primer
Sekvencijalna petlja
U okviru for petlje vri se sumiranje elemenata
vektora a.
Ova operacija se moe paralelizovati tako to e svaka
nit nezavisno izvriti sumiranje podskupa elemenata

vektora a i zapamtiti rezultat u privatnoj promenljivoj.
Kada sve niti okonaju sumiranje, one dodaju
izraunatu vrednost deljivoj promenljivoj (sum) da bi
se dobila ukupna suma
primer korienje direktive critical
Ubaena je imenovana kritina sekcija update_sum u kojoj se

pristupa deljivoj promenljivoj sum i tampa vrednost identifikatora
niti (TID), lokalne sume (sumLocal) i vrednosti trenutno dobijene
sume sum nakon dodavanja lokalne sume.
nakon izlaska iz paralelnog regiona tampa se vrednost dobijene
sume (sum)
Mogui izlaz iz programa ako se koriste tri niti
direktiva atomic
Takoe omoguava da vie niti aurira deljivu promenljivu bez

interferencije.
Za razliku od ostalih konstrukcija, ona se primenjuje samo na jednu naredbu
dodeljivanja koja neposredno sledi iza konstrukcije atomic. Sintaksa u C/C++

#pragma omp atomic
naredba
Atomic direktiva omoguava efikasno auriranje deljivih promenljivih od

strane vie niti na hardverskoj platformi koja podrava atomine
operacije.
Razlog zato se ova konstrukcija primenjuje samo na jednu naredbu je to
atomine operacije realizovane u hardveru tite auriranja jedne memorijske

lokacije (one koja se nalazi na levoj strani naredbe dodeljivanja).
Naime, ako hardver prua podrku da se itanje, modifikacija i upis u memorijsku
lokaciju obave kao jedna nedeljiva (atomina) operacija, onda konstrukcija atomic
nalae kompajleru da iskoristi takvu instrukciju
Direktiva master
definie blok naredbi koji e izvriti samo
master nit. Slina je single direktivi.

Sintaksa
#pragma omp master
strukturni blok
Ova direktiva nema implicitnu barijeru na
ulasku ili nakon okonanja strukturnog bloka.

Zbog toga, ako je neophodno, treba eksplicitno ubaciti
barrier konstrukciju da bi se postigla eljena

sinhronizacija.
Npr. ako se master konstrukcija koristi da inicijalizuje
podatke, mora se voditi rauna da se inicijalizacija okona
pre nego to ostale niti u timu krenu da koriste podatke.
Primer korienja master direktive
primer izlaza za n=9
runtime funkcije za sinhronizaciju

pored navedenih direktiva OpenMP ima i skup
run time funkcija koje su po nainu rada sline

semaforima
Opti oblik ovih funkcija je
void omp_func_lock (omp_lock_t *lck)
pri emu func moe biti init, destroy, set, unset, test,
ili init_nest, destroy_nest, set_nest, test_nest

Ove funkcije kao argument imaju promenljivu posebne
namene, lock promenljivu kojoj se moe pristupati
samo preko ovih funkcija.
Postoje dva tipa brava (locks):
simple locks i
nestable locks (analogno binarnim i brojnim semaforima).
Simple lock promenljive se deklariu kao promenljive tipa
omp_lock_t, a nestable kao omp_nest_lock_t.
Primer
omp_lock_t lck;
omp_init_lock(&lck);
#pragma omp parallel private (tmp, id)
{
id = omp_get_thread_num();
ekaj
ekajovde
ovdeda
dadoe
doe
tmp = do_lots_of_work(id);
na
nared
red
omp_set_lock(&lck);
printf(%d %d, id, tmp);
omp_unset_lock(&lck);
oslobodi
oslobodilock
locktako
takoda
da
}
sledea nit moe da
sledea nit moe da
pristupi
pristupi

14 OpenMP (2) v2

Uploaded by

Document Information

Original Title

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

14 OpenMP (2) v2

Uploaded by

Copyright:

Available Formats

OpenMP

moe upravljati ponaanjem konstrukcije na koju

zajednike (deljive) za tim niti u paralelnom

promenljive i da je svaka nit moe itati ili

Sve niti mogu da itaju i upisuju u vektor a.

elementa a[i] i izraunati novu vrednost.

Kao posledica deljenja pristupa istoj promenljivoj, moe se

da se pristup deljivim promenljivim odvija kako se zahteva

biti privatne za svaku nit u timu

deklarisana kao deljiva

Mogui izlaz iz gornjeg programa za n=5 i tri niti bi

potrebna nakon okonanja paraelnog regiona?

okonanja paralelnog regiona (petlje ili sekcije).

Odredba lastprivate (lista_promenljivih)

Ako se odredba lastprivate koristi sa section direktivom

Izlaz iz programa za n=5 bi mogao da izgleda ovako

inicijalizovane na ulasku u paralelni region.

Koristi se da dodeli promenljivima podrazumevani

Ova odredba se koristi da definie atribut deljenja za veinu

promenljivih u paralelnoj konstrukciji, a samo izuzetci se

koja uslovljava da sve niti iz tima moraju da se sinhronizuju na

Ipak, barijera na kraju paralelnog regiona se ne

ako bi postavili nowait odredbu uz prvu

paralelnu for petlju, moglo bi se doi u situaciju

paralelnom for direktivom.

Koristi se da se upravlja nainom rasporeivanja

(distribucije) iteracija petlje izmeu niti to moe imati

dodeljuju nitima u timu.

gornju granicu, tj. broj niti u paralelnom regionu moe biti i

Ako parametar hunk_size ima vrednost k (k >1),

veliina bloka se odreuje na isti nain sa ogranienjem

dodeljivanja iteracija petlje nitima donosi se u toku

Ako nije navedena odredba schedule,

podrazumevana distribucija je zavsina od

petlje po nitima su statiko i dinamiko.

Primer distribucije static, dynamic i guided

za static distribuciju nije navedena vrednost chunk_size pa je iterativni prostor od

redosledom pristupa deljivim promenljivim da bi se

Za sinhronizaciju su na raspolaganju sledee

jedna drugu tako da ni jedna nit ne moe da produi sa

kompajler automatski umee barijere na kraj direktive tako da

Dve stvari o kojima se mora voditi rauna kod korienja barrier

Bez ovih ogranienja moglo bi se desiti da se napie program gde neke

Primer1- Barrier sinhronizacija

Barijere se najee koriste da bi se izbegle trke podacima.

Primer2 barrier sinhronizacije

paralelne petlje izvri sekvencijalno.

Sintaksa direktive u C/C++

direktiva ordered paralelnom regionu

ordered direktiva se se koristi da bi se obezbedilo da se elementi

Mogui izlaz iz programa za n=9 i 4 niti

Kada neka nit naie na konstrukciju critical ona

eka da druga nit okona pristup kritinoj

U okviru for petlje vri se sumiranje elemenata

nit nezavisno izvriti sumiranje podskupa elemenata

primer korienje direktive critical

Ubaena je imenovana kritina sekcija update_sum u kojoj se

Mogui izlaz iz programa ako se koriste tri niti

Takoe omoguava da vie niti aurira deljivu promenljivu bez

dodeljivanja koja neposredno sledi iza konstrukcije atomic. Sintaksa u C/C++

Atomic direktiva omoguava efikasno auriranje deljivih promenljivih od

atomine operacije realizovane u hardveru tite auriranja jedne memorijske

master nit. Slina je single direktivi.