Professional Documents
Culture Documents
Cuprins: Prezentarea Instumentelor de Analiza - Data Analysis
Cuprins: Prezentarea Instumentelor de Analiza - Data Analysis
Cuprins
1 PREZENTAREA INSTUMENTELOR DE ANALIZA – DATA ANALYSIS ............................. 2
1.1 ANOVA ....................................................................................................................................... 2
1.1.1 Anova: Single Factor ............................................................................................................ 2
1.1.2 Anova: Two-Factor with Replication ................................................................................... 2
1.1.3 Anova: Two-Factor Without Replication ............................................................................. 2
1.2 Correlation .................................................................................................................................... 3
1.3 Covariance .................................................................................................................................... 3
1.4 Descriptive Statistics .................................................................................................................... 3
1.5 Exponential Smoothing ................................................................................................................ 5
1.6 F-Test Two-Sample for Variances ............................................................................................... 5
1.7 Fourier Analysis ........................................................................................................................... 5
1.8 Histogram ..................................................................................................................................... 5
1.9 Moving Average ........................................................................................................................... 5
1.10 Random Number Generation ........................................................................................................ 6
1.11 Rank and Percentile ...................................................................................................................... 6
1.12 Regression .................................................................................................................................... 6
1.12.1 Opţiunea Regression............................................................................................................. 6
1.12.2 Funcţia Linest din Excel ....................................................................................................... 9
1.13 Sampling..................................................................................................................................... 10
1.14 t-Test........................................................................................................................................... 10
1.15 t-Test: Paired Two Sample For Means ....................................................................................... 10
1.16 t-Test: Two-Sample Assuming Equal Variances........................................................................ 10
1.17 t-Test: Two-Sample Assuming Unequal Variances ................................................................... 11
1.18 z-Test .......................................................................................................................................... 11
2 REPREZENTARI GRAFICE ......................................................................................................... 12
2.1 Crearea unei histograme o diagramă Pareto ............................................................................... 12
2.2 Configurarea compartimentelor.................................................................................................. 13
2.3 Formulele folosite pentru a crea histograme în Excel 2016 ....................................................... 14
Pag. 1 din 14
PREZENTAREA INSTUMENTELOR DE ANALIZA – DATA ANALYSIS
Pag. 2 din 14
PREZENTAREA INSTUMENTELOR DE ANALIZA – DATA ANALYSIS
însă că există o singură observație pentru fiecare pereche (de exemplu, fiecare pereche {fertilizator,
temperatură} din exemplul precedent).
1.2 Correlation
Funcțiile de foaie de lucru CORREL și PEARSON calculează ambele coeficientul de corelație
dintre două variabile de măsurare, când măsurarea fiecărei variabile este observată pentru fiecare
dintre N subiecți. (Orice observație lipsă pentru oricare dintre subiecți provoacă ignorarea acelui
subiect în analiză.) Instrumentul de analiză a corelației este util mai ales când există mai mult de
două variabile de măsurare pentru fiecare dintre N subiecți. Acesta furnizează un tabel cu rezultate,
o matrice de corelații, arătând valoarea funcției CORREL (sau PEARSON) aplicată fiecărei
perechi posibile de variabile de măsurare.
Coeficientul de corelație, la fel ca cel de covarianță, este o măsură a gradului de variație comun al
celor două variabile de măsurare. Spre deosebire de covarianță, coeficientul de corelație este
măsurat pe o scară, astfel că valoarea sa este independentă de unitatea în care se exprimă
variabilele. (De exemplu, dacă cele două variabile de măsurare sunt masa și înălțimea, valoarea
coeficientului este neschimbată chiar dacă masa se măsoară în kilograme sau livre.) Valoarea
oricărui coeficient de corelație trebuie să fie între -1 și +1 inclusiv.
Se poate utiliza instrumentul de analiză a corelației pentru a examina fiecare pereche de variabile
de măsurare și a determina dacă cele două variabile de măsurare tind să se mute împreună, adică,
dacă valorile mari ale unei variabile tind să poată fi asociate cu valorile mari ale celeilalte variabile
(corelație pozitivă), dacă valorile mici ale unei variabile tind să poată fi asociate cu valorile mici
ale celeilalte variabile (corelație negativă) sau dacă valorile celor două variabile tind să fie
necorelate (corelație aproape zero).
1.3 Covariance
Instrumentele Correlation și Covariance pot fi utilizate ambele în aceleași condiții, când aveți N
diferite variabile de măsurare observate pe un set de indivizi. Instrumentele Correlation și
Covariance dau fiecare un tabel de rezultate, o matrice, care afișează coeficientul de corelație sau,
respectiv, de covarianță dintre fiecare pereche de variabile de măsurare. Deosebirea constă în aceea
că, în timp ce coeficientul de corelație este măsurat pe o scară de la -1 la +1 inclusiv, covarianța
corespunzătoare nu este măsurată pe o scară. Atât coeficientul de corelație, cât și cel de covarianță,
sunt măsuri ale gradului de variație comun pentru cele două variabile.
Instrumentul Covariance calculează valoarea funcției COVARIANCE.P a foii de calcul pentru
fiecare pereche de variabile de măsurare. (Utilizarea directă a funcției COVAR în locul
instrumentului Covariance este o alternativă rezonabilă când există numai două variabile de
măsurare, adică N=2.) Intrarea pe diagonala tabelului cu rezultate al instrumentului Covariance
din rândul i, coloana i este covarianța variabilei de măsurare i cu ea însăși. Aceasta este exact
varianța populației pentru acea variabilă, calculată cu funcția VAR.P a foii de lucru.
Se poate utiliza instrumentul de covarianță pentru a examina fiecare pereche de variabile de
măsurare și a determina dacă cele două variabile de măsurare tind să se mute împreună, aceasta
însemnând, dacă valorile mari ale unei variabile tind să poată fi asociate cu valorile mari ale
celeilalte variabile (covarianță pozitivă), dacă valorile mici ale unei variabile tind să poată fi
asociate cu valorile mici ale celeilalte variabile (covarianță negativă) sau dacă valorile celor două
variabile tind să fie necorelate (covarianță aproape zero).
Pag. 3 din 14
PREZENTAREA INSTUMENTELOR DE ANALIZA – DATA ANALYSIS
Exemplu
Statistica discriptivă
Yi X1i X2i
Pag. 4 din 14
PREZENTAREA INSTUMENTELOR DE ANALIZA – DATA ANALYSIS
1.8 Histogram
Instrumentul de analiză Histogram calculează frecvențe individuale și cumulative pentru o zonă
de celule de date. Acest instrument generează datele pentru numărul de apariții ale unei valori în
setul de date.
De exemplu, într-o clasă de 20 de studenți, se poate determina distribuția punctajelor în categorii
notate cu litere. Un tabel de tip histogramă prezintă limitele categoriilor și numărul de puncte între
limita inferioară și limita curentă. Punctajul cel mai frecvent reprezintă modul datelor.
Sfat : În Excel 2016, acum puteţi crea o histogramă sau o diagramă Pareto .
Pag. 5 din 14
PREZENTAREA INSTUMENTELOR DE ANALIZA – DATA ANALYSIS
acest instrument pentru prognozarea vânzărilor, a inventarului sau alte tendințe. Fiecare valoare
prognozată se bazează pe formula următoare.
unde:
N este numărul de perioade anterioare de inclus în media mobilă
A j este valoarea actuală la timpul j
F j este valoarea prognozată la timpul j
1.12 Regression
Instrumentul de analiză Regression execută analiza de regresie liniară prin utilizarea metodei
„pătratelor mici" pentru a găsi o linie care corespunde unui set de observații. Aveți posibilitatea să
analizați modul în care o singură variabilă dependentă este afectată de valorile uneia sau a mai
multor variabile independente. De exemplu, aveți posibilitatea să analizați modul în care
performanțele unui atlet sunt afectate de factori cum ar fi vârsta, înălțimea și greutatea. Aveți
posibilitatea să repartizați părți din măsurarea performanței fiecărui factor, pe baza unui set de date
de performanță, apoi să utilizați rezultatele pentru a prezice performanța unui atlet nou, netestat.
Instrumentul Regression utilizează funcția de foaie de lucru LINEST.
Opţiunea Regression din pachetul de analiză statistică Data analysis permite realizarea
foarte rapidă a calculelor pentru analiza de regresie.Fereastra de introducere a datelor şi de
selectare a opţiunilor de calcul, cele pentru valorile reziduale şi cele de reprezentare grafică
pentru analiza de regresie este prezentată în Figura 1. După cum se observă, cerinţele se
referă la următoarele elemente:
Pag. 6 din 14
PREZENTAREA INSTUMENTELOR DE ANALIZA – DATA ANALYSIS
Regression Statistics
Multiple R 0,99955 ← Coeficientul de corelaţie
R Square 0,99910 ← Coeficientul de determinare
Adjusted R Square 0,99888 ← Coeficientul de determinare ajustat
Standard Error 7,89019 ← Eroarea standard
Observations 6 ← Numărul de valori din eşantion
ANOVA
df SS MS F Significance F
Regression 1 276834,313 276834,313 4446,774446 3,02977E-07
Residual 4 249,0203327 62,25508318
Total 5 277083,3333
↑ Sursele ↑ Gradele de ↑ Suma ↑ Mediile ↑ Valoarea ↑ Valoarea
de variaţie libertate pătratelor pătratice testului F probabilităţii
Pag. 7 din 14
PREZENTAREA INSTUMENTELOR DE ANALIZA – DATA ANALYSIS
Pentru reprezentările grafice ale opţiunii Regression se pot selecta următoarele elemente:
Reprezentarea grafică a valorilor reziduale şi a variabilei independente;
Reprezentarea grafică a diagramei de dispersie şi a valorilor de predicţie;
Reprezentarea grafică a testului de normalitate.
Pentru opţiunile grafice din Regression am utilizat date, pentru care am aplicat testele de
normalitate a valorilor reziduale. Cele trei diagrame ale opţiunii Regression sunt prezentate
în Figura 3 (a), (b) şi (c).
10
0
0 20 40 60 80 100 120
-10
-20
-30
Firme (X)
400
Vanzari (Y)
300
Vanzari (Y)
200
Predicted
100
Vanzari (Y)
0
0 50 100 150
Firme (X)
Pag. 8 din 14
PREZENTAREA INSTUMENTELOR DE ANALIZA – DATA ANALYSIS
Vanzari (Y)
300
250
200
150
100
50
0
0 20 40 60 80 100
Sample Percentile
4,95601 202,943
0,07432 7,14632
0,9991 7,89019
4446,77 4
276834 249,02
Pag. 9 din 14
PREZENTAREA INSTUMENTELOR DE ANALIZA – DATA ANALYSIS
1.13 Sampling
Instrumentul de analiză Sampling creează un eșantion dintr-o populație prin tratarea zona de intrare
ca pe o populație. Când populația este prea mare pentru a o procesa sau pentru a o înscrie într-o
diagramă, aveți posibilitatea să utilizați un eșantion reprezentativ. Aveți de asemenea posibilitatea
să creați un eșantion care să conțină numai valori dintr-o anumită parte a unui ciclu în cazul în care
considerați că datele de intrare sunt periodice. De exemplu, dacă zona de intrare conține cifre de
vânzări trimestriale, eșantionarea cu un coeficient periodic de patru va plasa valorile din același
trimestru în zona de ieșire.
1.14 t-Test
Instrumentele de analiză t-Test pentru două eșantioane testează egalitatea mediilor populațiilor de
bază pentru fiecare dintre eșantioane. Cele trei instrumente folosesc ipoteze diferite: varianțele
populațiilor sunt egale, varianțele populațiilor nu sunt egale și cele două eșantioane reprezintă
observațiile înainte și după tratament asupra acelorași subiecți.
Pentru toate cele trei instrumente de mai jos, o valoare a statisticii t, t, este calculată și prezentată
ca " t Stat" în tabelul cu rezultate. În funcție de date, această valoare, t, poate fi negativă, pozitivă
sau egală cu zero. Presupunând că mediile populațiilor de bază sunt egale, dacă t < 0, " P(T <= t)
unilateral" dă probabilitatea ca o valoare a statisticii t observată să fie mai negativă decât t. Dacă t
>=0, " P(T <= t) unilateral" dă probabilitatea ca o valoare a statisticii t observată să fie mai pozitivă
decât t. " t unilateral critic" dă valoarea limită pentru care probabilitatea observării unei unei valori
a statisticii t mai mare sau egală cu " t unilateral critic" să fie Alfa.
" P(T <= t) bilateral" dă probabilitatea ca o valoare a statisticii t observată să fie mai mare în
valoare absolută decât t. " P bilateral critic" dă valoarea limită pentru care probabilitatea unei
statistici t observate mai mari în valoare absolută decât " P bilateral critic" să fie Alfa.
Pag. 10 din 14
PREZENTAREA INSTUMENTELOR DE ANALIZA – DATA ANALYSIS
Acest instrument de analiză execută un test t pe două eșantioane de studenți. Acest test t presupune
că cele două seturi de date provin din distribuții cu aceleași varianțe. I se spune test t
homoscedastic. Aveți posibilitatea să utilizați acest test t pentru a determina dacă este probabil ca
cele două eșantioane să provină din distribuții cu medii egale ale populațiilor.
Următoarea formulă se utilizează pentru a calcula gradele de libertate, df. Deoarece rezultatul
calculului nu este, în general, un număr întreg, valoarea lui df este rotunjită la cel mai apropiat
întreg pentru a obține o valoare critică din tabelul t. Funcția de foaie de lucru Excel T.TEST
utilizează valoarea calculată df fără rotunjire, deoarece este posibil să calculeze o valoare pentru
T.TEST cu un df neîntreg. Datorită acestor abordări de determinare a gradelor de libertate,
rezultatele T.TEST și ale instrumentului t-Test vor fi diferite în cazul Varianțe inegale.
1.18 z-Test
Instrumentul z-Test: Two Sample for Means execută un test z pe două eșantioane pentru medii cu
varianțe cunoscute. Acest instrument este utilizat pentru a testa ipoteza nulului, că nu este nicio
diferență între două medii ale unor populații, în comparație cu ipotezele alternative, fie cea
unilaterală fie cea bilaterală. Dacă varianțele nu sunt cunoscute, atunci se va utiliza funcția de foaie
de lucru Z.TEST.
Când utilizați instrumentul z-Test, trebuie acordați atenție interpretării rezultatelor. " P(Z <= z)
unilateral" este de fapt P(Z >= ABS(z)), probabilitatea unei valori z mai depărtate de 0 în aceeași
direcție ca valoarea z observată, când nu sunt diferențe între mediile populațiilor. " P(Z <= z)
bilateral" este de fapt P(Z >= ABS(z) sau Z <= -ABS(z)), probabilitatea unei valori z mai depărtate
de 0 în oricare direcție față de valoarea observată z, când nu sunt diferențe între mediile
populațiilor. Rezultatul bilateral este tocmai rezultatul unilateral multiplicat cu 2. Testul z poate să
se utilizeze, de asemenea, pentru cazul când ipoteza nulă este că există o valoare specifică diferită
Pag. 11 din 14
PREZENTAREA INSTUMENTELOR DE ANALIZA – DATA ANALYSIS
de zero pentru diferența dintre mediile a două populații. De exemplu, aveți posibilitatea să utilizați
acest text pentru a determina diferențele dintre performanțele a două modele de automobile.
2 REPREZENTARI GRAFICE
2.1 Crearea unei histograme o diagramă Pareto
O histogramă sau o diagramă Pareto (histogramă sortată)
este o diagramă coloană care afișează date de frecvență.
Iată un exemplu tipic:
1. Selectați datele. De obicei, selectați o coloană care conține text (categorii) și una care
conține numere. O diagramă Pareto grupează apoi aceleași categorii și adună numerele
corespunzătoare.
Pag. 12 din 14
PREZENTAREA INSTUMENTELOR DE ANALIZA – DATA ANALYSIS
Pag. 13 din 14
PREZENTAREA INSTUMENTELOR DE ANALIZA – DATA ANALYSIS
Compartiment de depășire Bifați caseta pentru a crea un compartiment pentru toate valorile
care depășesc numărul din caseta corespunzătoare. Pentru a modifica această valoare,
introduceți un număr zecimal în casetă.
Compartiment de subdepășire Bifați caseta pentru a crea un compartiment pentru toate valorile
mai mici sau egale cu numărul din caseta corespunzătoare. Pentru a modifica această
valoare, introduceți un număr zecimal în casetă.
Regula de referință normală a lui Scott încearcă să minimizeze varianța diagramei Pareto,
comparativ cu setul de date, date fiind date normal distribuite.
Compartiment de depășire
Compartiment de subdepășire
Pag. 14 din 14