Download as docx, pdf, or txt
Download as docx, pdf, or txt
You are on page 1of 14

PREZENTAREA INSTUMENTELOR DE ANALIZA – DATA ANALYSIS

Cuprins
1 PREZENTAREA INSTUMENTELOR DE ANALIZA – DATA ANALYSIS ............................. 2
1.1 ANOVA ....................................................................................................................................... 2
1.1.1 Anova: Single Factor ............................................................................................................ 2
1.1.2 Anova: Two-Factor with Replication ................................................................................... 2
1.1.3 Anova: Two-Factor Without Replication ............................................................................. 2
1.2 Correlation .................................................................................................................................... 3
1.3 Covariance .................................................................................................................................... 3
1.4 Descriptive Statistics .................................................................................................................... 3
1.5 Exponential Smoothing ................................................................................................................ 5
1.6 F-Test Two-Sample for Variances ............................................................................................... 5
1.7 Fourier Analysis ........................................................................................................................... 5
1.8 Histogram ..................................................................................................................................... 5
1.9 Moving Average ........................................................................................................................... 5
1.10 Random Number Generation ........................................................................................................ 6
1.11 Rank and Percentile ...................................................................................................................... 6
1.12 Regression .................................................................................................................................... 6
1.12.1 Opţiunea Regression............................................................................................................. 6
1.12.2 Funcţia Linest din Excel ....................................................................................................... 9
1.13 Sampling..................................................................................................................................... 10
1.14 t-Test........................................................................................................................................... 10
1.15 t-Test: Paired Two Sample For Means ....................................................................................... 10
1.16 t-Test: Two-Sample Assuming Equal Variances........................................................................ 10
1.17 t-Test: Two-Sample Assuming Unequal Variances ................................................................... 11
1.18 z-Test .......................................................................................................................................... 11
2 REPREZENTARI GRAFICE ......................................................................................................... 12
2.1 Crearea unei histograme o diagramă Pareto ............................................................................... 12
2.2 Configurarea compartimentelor.................................................................................................. 13
2.3 Formulele folosite pentru a crea histograme în Excel 2016 ....................................................... 14

Pag. 1 din 14
PREZENTAREA INSTUMENTELOR DE ANALIZA – DATA ANALYSIS

1 PREZENTAREA INSTUMENTELOR DE ANALIZA – DATA ANALYSIS


1.1 Anova
Instrumentele de analiză Anova furnizează diferite tipuri de analiză de varianță. Instrumentul de
utilizat depinde de numărul factorilor și de numărul eșantioanelor pe care le aveți din cadrul
populațiilor pe care le testați.
ANOVA
df SS MS F Significance F
Regression 1 276834,313 276834,313 4446,774446 3,02977E-07
Residual 4 249,0203327 62,25508318
Total 5 277083,3333
↑ Sursele ↑ Gradele de ↑ Suma ↑ Mediile ↑ Valoarea ↑ Valoarea
de variaţie libertate pătratelor pătratice testului F probabilităţii

Coefficients Standard Error t Stat P-value Lower 95% Upper 95%


Intercept 202,9427 7,1463 28,3982 9,14967E-06 183,1013 222,7841
Producţie 4,9560 0,0743 66,6841 3,02977E-07 4,7497 5,1624
↑Variabila ↑Coeficienţii ↑ Eroarea ↑ Statistica
↑ Valoarea p ↑LII ↑LIS
de regresie de regresie standard t

1.1.1 Anova: Single Factor


Acest instrument efectuează o analiză simplă de varianță asupra datelor pentru două sau mai multe
eșantioane. Analiza furnizează o testare a ipotezei că fiecare eșantion este derivat din aceeași
distribuție de probabilitate de bază față de ipoteza că distribuția de probabilitate de bază nu este
aceeași pentru toate eșantioanele. Dacă există doar două eșantioane, aveți posibilitatea să utilizați
funcția de foaie de lucru T.TEST. Cu mai mult de două eșantioane, nu există o generalizare
convenabilă pentru funcția T.TEST, ci se poate utiliza numai modelul Single Factor Anova.

1.1.2 Anova: Two-Factor with Replication


Acest instrument de analiză este util când datele pot fi clasificate după două dimensiuni diferite.
De exemplu, într-un experiment pentru măsurarea înălțimii plantelor, plantele pot fi tratate cu
diferiți fertilizatori (de exemplu: A, B, C) și pot fi ținute la diferite temperaturi (de exemplu: joasă,
înaltă). Pentru fiecare dintre cele 6 perechi posibile {fertilizator, temperatură} există un număr
egal de observații ale înălțimii plantelor. Utilizând instrumentul Anova se poate testa:
 Dacă înălțimea plantelor pentru diferite tipuri de fertilizator
derivă din aceeași populație de bază. Temperaturile sunt ignorate
în această analiză.
 Dacă înălțimea plantelor pentru diferite niveluri de temperatură
derivă din aceeași populație de bază. Tipurile de fertilizator sunt
ignorate în această analiză.
Ținând seama de efectele diferențelor dintre tipurile de fertilizatori din
prima etapă și diferențele de temperatură din etapa a doua, cele șase
eșantioane reprezentând toate perechile de valori {fertilizator, temperatură} derivă din aceeași
populație. Ipoteza alternativă este aceea că există efecte datorate unei anumite perechi {fertilizator,
temperatură} în plus față de diferențele bazate numai pe fertilizator sau numai pe temperatură.

1.1.3 Anova: Two-Factor Without Replication


Acest instrument de analiză este util când datele sunt clasificate după două dimensiuni diferite, ca
în cazul instrumentului Two-Factor case With Replication. Pentru acest instrument se presupune

Pag. 2 din 14
PREZENTAREA INSTUMENTELOR DE ANALIZA – DATA ANALYSIS

însă că există o singură observație pentru fiecare pereche (de exemplu, fiecare pereche {fertilizator,
temperatură} din exemplul precedent).

1.2 Correlation
Funcțiile de foaie de lucru CORREL și PEARSON calculează ambele coeficientul de corelație
dintre două variabile de măsurare, când măsurarea fiecărei variabile este observată pentru fiecare
dintre N subiecți. (Orice observație lipsă pentru oricare dintre subiecți provoacă ignorarea acelui
subiect în analiză.) Instrumentul de analiză a corelației este util mai ales când există mai mult de
două variabile de măsurare pentru fiecare dintre N subiecți. Acesta furnizează un tabel cu rezultate,
o matrice de corelații, arătând valoarea funcției CORREL (sau PEARSON) aplicată fiecărei
perechi posibile de variabile de măsurare.
Coeficientul de corelație, la fel ca cel de covarianță, este o măsură a gradului de variație comun al
celor două variabile de măsurare. Spre deosebire de covarianță, coeficientul de corelație este
măsurat pe o scară, astfel că valoarea sa este independentă de unitatea în care se exprimă
variabilele. (De exemplu, dacă cele două variabile de măsurare sunt masa și înălțimea, valoarea
coeficientului este neschimbată chiar dacă masa se măsoară în kilograme sau livre.) Valoarea
oricărui coeficient de corelație trebuie să fie între -1 și +1 inclusiv.
Se poate utiliza instrumentul de analiză a corelației pentru a examina fiecare pereche de variabile
de măsurare și a determina dacă cele două variabile de măsurare tind să se mute împreună, adică,
dacă valorile mari ale unei variabile tind să poată fi asociate cu valorile mari ale celeilalte variabile
(corelație pozitivă), dacă valorile mici ale unei variabile tind să poată fi asociate cu valorile mici
ale celeilalte variabile (corelație negativă) sau dacă valorile celor două variabile tind să fie
necorelate (corelație aproape zero).

1.3 Covariance
Instrumentele Correlation și Covariance pot fi utilizate ambele în aceleași condiții, când aveți N
diferite variabile de măsurare observate pe un set de indivizi. Instrumentele Correlation și
Covariance dau fiecare un tabel de rezultate, o matrice, care afișează coeficientul de corelație sau,
respectiv, de covarianță dintre fiecare pereche de variabile de măsurare. Deosebirea constă în aceea
că, în timp ce coeficientul de corelație este măsurat pe o scară de la -1 la +1 inclusiv, covarianța
corespunzătoare nu este măsurată pe o scară. Atât coeficientul de corelație, cât și cel de covarianță,
sunt măsuri ale gradului de variație comun pentru cele două variabile.
Instrumentul Covariance calculează valoarea funcției COVARIANCE.P a foii de calcul pentru
fiecare pereche de variabile de măsurare. (Utilizarea directă a funcției COVAR în locul
instrumentului Covariance este o alternativă rezonabilă când există numai două variabile de
măsurare, adică N=2.) Intrarea pe diagonala tabelului cu rezultate al instrumentului Covariance
din rândul i, coloana i este covarianța variabilei de măsurare i cu ea însăși. Aceasta este exact
varianța populației pentru acea variabilă, calculată cu funcția VAR.P a foii de lucru.
Se poate utiliza instrumentul de covarianță pentru a examina fiecare pereche de variabile de
măsurare și a determina dacă cele două variabile de măsurare tind să se mute împreună, aceasta
însemnând, dacă valorile mari ale unei variabile tind să poată fi asociate cu valorile mari ale
celeilalte variabile (covarianță pozitivă), dacă valorile mici ale unei variabile tind să poată fi
asociate cu valorile mici ale celeilalte variabile (covarianță negativă) sau dacă valorile celor două
variabile tind să fie necorelate (covarianță aproape zero).

1.4 Descriptive Statistics


Instrumentul de analiză Descriptive Statistics generează un raport de statistici univariabile pentru
datele din zona de intrare, furnizând informații despre tendința centrală și variabilitatea datelor.

Pag. 3 din 14
PREZENTAREA INSTUMENTELOR DE ANALIZA – DATA ANALYSIS

Exemplu

Magazin Vanzari Pret Publicitate


i Yi X1i X2i
1 36600 11,38 1300
2 35900 12,98 2900
3 31200 11,26 800
4 33700 12,44 700
5 44650 10,04 1500
6 35150 12,82 1300
7 36600 11,7 1800
8 43050 10,82 2400
9 40500 12,48 700
10 38200 12,4 3000
11 38300 10,96 2800
12 41100 12,28 2700

Statistica discriptivă
Yi X1i X2i

Mean 37912,5 Mean 11,80 Mean 1825


Standard Error 1124,13 Standard Error 0,26 Standard Error 258,52
Median 37400 Median 11,99 Median 1650
Mode 36600 Mode #N/A Mode 1300
Standard Deviation 3894,12 Standard Deviation 0,91 Standard Deviation 895,57
Sample Variance 15164147,7 Sample Variance 0,83 Sample Variance 802045,45
Kurtosis -0,38 Kurtosis -0,68 Kurtosis -1,75
Skewness 0,15 Skewness -0,51 Skewness 0,06
Range 13450 Range 2,94 Range 2300
Minimum 31200 Minimum 10,04 Minimum 700
Maximum 44650 Maximum 12,98 Maximum 3000
Sum 454950 Sum 141,56 Sum 21900
Count 12 Count 12 Count 12
Largest(1) 44650 Largest(1) 12,98 Largest(1) 3000
Smallest(1) 31200 Smallest(1) 10,04 Smallest(1) 700
Confidence Confidence Confidence
Level(95,0%) 2474,20 Level(95,0%) 0,58 Level(95,0%) 569,02

Indicatorul Statistica Funcții Excel Descriere


Mean  =AVERAGE Media
Standard Error se= = STDEV /SQRT(n) Eroarea standard (medie)
Median Med = =MEDIAN Mediana
Mode Mod = =MODE Moda
Standard Deviation  =STDEV Abaterea standard
Sample Variance  =VAR Varianta (Dispersia)
Kurtosis SKEW = =SKEW Coeficient asimetrie
Skewness KURT = =KURT Coeficient aplatizare
Range r= = Max-Min Amplitudinea
Minimum Min = =Min Minim
Maximum Max = =Max Maxim
Sum  =SUM Suma
Count n= =COUNT Efectiv eșantion
Largest(1) =Min maxim
Smallest(1) =Max minim
Confidence Level (95,0%) P Nivelul de semnificație

Pag. 4 din 14
PREZENTAREA INSTUMENTELOR DE ANALIZA – DATA ANALYSIS

1.5 Exponential Smoothing


Acest instrument de analiză și formula aferentă acestuia estimează o valoare care este bazată pe
prognoza din perioada anterioară, ajustată cu eroarea din acea prognoză anterioară. Instrumentul
utilizează constanta de netezire a , mărimea ce determină cât de puternic răspunde prognoza la
erorile din prognoza anterioară.
Notă : Valori de la 0,2 la 0,3 sunt constante de netezire rezonabilă. Aceste valori indică faptul că
prognoza curentă ar trebui ajustată cu 20 până la 30 procente pentru eroarea din prognoza
anterioară. Constante mai mari produc un răspuns mai rapid, dar pot produce proiecții nesigure.
Constante mai mici pot determina o întârziere mai mare a valorilor prognozate.

1.6 F-Test Two-Sample for Variances


Instrumentul de analiză F-Test Two-Sample for Variances efectuează un test F pe două eșantioane
pentru a compara varianțele a două populații.
De exemplu, se poate utiliza instrumentul F-Test pe eșantioane de timpi realizate de două echipe
într-un concurs de înot. Instrumentul furnizează rezultatul testării cu ipoteză nulă conform căreia
cele două eșantioane provin din distribuții cu varianță egală față de ipoteza alternativă că varianțele
nu sunt egale în distribuțiile de bază.
Instrumentul calculează valoarea f a unei statistici F (sau proporție F). O valoare f apropiată de 1
este dovadă a varianțelor egale ale populațiilor de bază. În tabelul cu rezultate, dacă f < 1 " P(F <=
f) unilateral" dă probabilitatea observării unei valori a statisticii F mai mică decât f când varianțele
populațiilor sunt egale și " F unilateral critic" dă valoarea critică mai mică decât 1 pentru nivelul
de semnificație ales, Alfa. Dacă f > 1, " P(F <= f) unilateral" dă probabilitatea observării unei
valori a statisticii F mai mare decât f când varianțele populațiilor sunt egale și " F unilateral critic"
dă valoarea critică mai mare decât 1 pentru Alfa.

1.7 Fourier Analysis


Instrumentul Fourier Analysis rezolvă probleme în sisteme
liniare și analizează periodic datele utilizând metoda Fast
Fourier Transform (FFT) pentru transformarea datelor. Acest
instrument suportă de asemenea transformări inverse, în care
inversa datelor transformate returnează datele inițiale.

1.8 Histogram
Instrumentul de analiză Histogram calculează frecvențe individuale și cumulative pentru o zonă
de celule de date. Acest instrument generează datele pentru numărul de apariții ale unei valori în
setul de date.
De exemplu, într-o clasă de 20 de studenți, se poate determina distribuția punctajelor în categorii
notate cu litere. Un tabel de tip histogramă prezintă limitele categoriilor și numărul de puncte între
limita inferioară și limita curentă. Punctajul cel mai frecvent reprezintă modul datelor.
Sfat : În Excel 2016, acum puteţi crea o histogramă sau o diagramă Pareto .

1.9 Moving Average


Instrumentul de analiză Moving Average proiectează valorile în perioada de prognoză pe baza
valorii medii a variabilei după un anumit număr de perioade anterioare. O medie mobilă furnizează
informații de tendință pe care o simplă medie a tuturor datelor istorice nu le-ar furniza. Utilizați

Pag. 5 din 14
PREZENTAREA INSTUMENTELOR DE ANALIZA – DATA ANALYSIS

acest instrument pentru prognozarea vânzărilor, a inventarului sau alte tendințe. Fiecare valoare
prognozată se bazează pe formula următoare.

unde:
 N este numărul de perioade anterioare de inclus în media mobilă
 A j este valoarea actuală la timpul j
 F j este valoarea prognozată la timpul j

1.10 Random Number Generation


Instrumentul de analiză Random Number Generation umple un interval cu numere independente
aleatoare derivate din una dintre mai multe distribuții. Aveți posibilitatea să caracterizați subiectele
unei populații cu o distribuție de probabilitate. De exemplu, se poate utiliza o distribuție normală
pentru a caracteriza populația înălțimii indivizilor sau se poate utiliza o distribuție Bernoulli a două
posibile consecințe pentru a caracteriza populația rezultatelor experimentului cu banul.

1.11 Rank and Percentile


Instrumentul de analiză Rank and Percentile produce un tabel care conține rangul ordinal și
procentual al fiecărei valori dintr-un set de date. Aveți posibilitatea să analizați poziția relativă a
valorilor dintr-un set de date. Acest instrument utilizează funcțiile foii de lucru RANK.EQ și
PERCENTRANK.INC. Dacă doriți să țineți cont de valorile legate, utilizați funcția RANK.EQ,
care tratează valorile legate ca având același rang sau utilizați funcția RANK.AVG, care
returnează rangul mediu al valorilor legate.

1.12 Regression
Instrumentul de analiză Regression execută analiza de regresie liniară prin utilizarea metodei
„pătratelor mici" pentru a găsi o linie care corespunde unui set de observații. Aveți posibilitatea să
analizați modul în care o singură variabilă dependentă este afectată de valorile uneia sau a mai
multor variabile independente. De exemplu, aveți posibilitatea să analizați modul în care
performanțele unui atlet sunt afectate de factori cum ar fi vârsta, înălțimea și greutatea. Aveți
posibilitatea să repartizați părți din măsurarea performanței fiecărui factor, pe baza unui set de date
de performanță, apoi să utilizați rezultatele pentru a prezice performanța unui atlet nou, netestat.
Instrumentul Regression utilizează funcția de foaie de lucru LINEST.

1.12.1 Opţiunea Regression

Opţiunea Regression din pachetul de analiză statistică Data analysis permite realizarea
foarte rapidă a calculelor pentru analiza de regresie.Fereastra de introducere a datelor şi de
selectare a opţiunilor de calcul, cele pentru valorile reziduale şi cele de reprezentare grafică
pentru analiza de regresie este prezentată în Figura 1. După cum se observă, cerinţele se
referă la următoarele elemente:

Pag. 6 din 14
PREZENTAREA INSTUMENTELOR DE ANALIZA – DATA ANALYSIS

 Zona datelor de intrare;


 Zona de afişare a rezultatelor;
 Opţiunile asupra valorilor
reziduale şi a ipotezei
normalităţii.

Figura 1: Fereastra de introducere a


datelor şi de selectare a cerinţelor pentru
opţiunea Regression
Rezultatele calculate sunt prezentate în
Figura 2. Semnificaţia valorilor afişate
este explicată fie în partea dreaptă a
tabelelor da date (fiind marcate cu
simbolul ←), fie sub tabelele de date (fiind
marcate cu simbolul ←). Se poate observa
că valorile calculate sunt similare cu cele
calculate în aplicaţiile anterioare.
SUMMARY OUTPUT

Regression Statistics
Multiple R 0,99955 ← Coeficientul de corelaţie
R Square 0,99910 ← Coeficientul de determinare
Adjusted R Square 0,99888 ← Coeficientul de determinare ajustat
Standard Error 7,89019 ← Eroarea standard
Observations 6 ← Numărul de valori din eşantion

ANOVA
df SS MS F Significance F
Regression 1 276834,313 276834,313 4446,774446 3,02977E-07
Residual 4 249,0203327 62,25508318
Total 5 277083,3333
↑ Sursele ↑ Gradele de ↑ Suma ↑ Mediile ↑ Valoarea ↑ Valoarea
de variaţie libertate pătratelor pătratice testului F probabilităţii

Coefficients Standard Error t Stat P-value Lower 95% Upper 95%


Intercept 202,9427 7,1463 28,3982 9,14967E-06 183,1013 222,7841
Producţie 4,9560 0,0743 66,6841 3,02977E-07 4,7497 5,1624
↑Variabila ↑Coeficienţii ↑ Eroarea ↑ Statistica
↑ Valoarea p ↑LII ↑LIS
de regresie de regresie standard t

RESIDUAL OUTPUT PROBABILITY OUTPUT

Predicted Standard Cheltuieli


Observation Residuals Percentile
Cheltuieli totale Residuals totale
1 351,623 -1,623 -0,230 8,333 350
2 475,523 -5,523 -0,783 25,000 470
3 500,303 9,697 1,374 41,667 510
4 624,203 -4,203 -0,596 58,333 620
5 872,004 7,996 1,133 75,000 880
6 946,344 -6,344 -0,899 91,667 940
↑Indexul ↑ Valorile ↑ Valorile ↑ Valorile
↑ Valorile ↑Percentilele
valorilor reziduale pi Yi
observate
Ŷi reziduale
standardizate
Figura 2: Rezultatele calculate afişate pentru opţiunea Regression

Pag. 7 din 14
PREZENTAREA INSTUMENTELOR DE ANALIZA – DATA ANALYSIS

Pentru reprezentările grafice ale opţiunii Regression se pot selecta următoarele elemente:
 Reprezentarea grafică a valorilor reziduale şi a variabilei independente;
 Reprezentarea grafică a diagramei de dispersie şi a valorilor de predicţie;
 Reprezentarea grafică a testului de normalitate.
Pentru opţiunile grafice din Regression am utilizat date, pentru care am aplicat testele de
normalitate a valorilor reziduale. Cele trei diagrame ale opţiunii Regression sunt prezentate
în Figura 3 (a), (b) şi (c).

Firme (X) Residual Plot


40
30
20
Residuals

10
0
0 20 40 60 80 100 120
-10
-20
-30
Firme (X)

Figura 3(a): Reprezentarea grafică a valorilor reziduale şi a variabilei independente


în opţiunea Regression

Firme (X) Line Fit Plot


500

400
Vanzari (Y)

300
Vanzari (Y)
200
Predicted
100
Vanzari (Y)
0
0 50 100 150
Firme (X)

Figura 3(b): Reprezentarea grafică a diagramei de dispersie şi a valorilor de


predicţie în opţiunea Regression

Pag. 8 din 14
PREZENTAREA INSTUMENTELOR DE ANALIZA – DATA ANALYSIS

Normal Probability Plot


450
400
350

Vanzari (Y)
300
250
200
150
100
50
0
0 20 40 60 80 100
Sample Percentile

Figura 3(c): Reprezentarea grafică a testului de normalitate


în opţiunea Regression
1.12.2 Funcţia Linest din Excel
Funcţia statistic LINEST permite calcularea parametrilor modelului de regresie liniară.
Fereastra de definire a argumentelor pentru funcţia statistică LINEST este prezentată în
Figura 4.

Figura 4.Fereastra de introducere a datelor pentru funcţia LINEST

Funcţia LINEST afişează o serie de parametri ai modelului de regresie astfel:

Coeficientul unghiular → 1 0 ← Coeficientul de intersecţie


Eroarea standard a lui 1 → s 1 s 0 ← Eroarea standard a lui 0
Coeficientul de determinare→ R2 sY ← Eroarea standard a lui Y
Valoarea statisticii F→ F df ← Gradele de libertate
Suma pătratelor regresiei→ SSR SSE ← Suma pătratelor erorilor
Rezultatele afişate de funcţia LINEST pentru anumite date sunt prezentate în Figura 5.

4,95601 202,943
0,07432 7,14632
0,9991 7,89019
4446,77 4
276834 249,02

Figura 5 Rezultatele afişate de funcţia LINEST

Pag. 9 din 14
PREZENTAREA INSTUMENTELOR DE ANALIZA – DATA ANALYSIS

Pentru modelul de regresie liniar unifactorial, cu o singură variabilă X, coeficienţii de


regresie pot fi obţinuţi şi cu următoarele relaţii care utilizează funcţia INDEX din Excel:

 Coeficientul unghiular 1:


1 = INDEX(LINEST(known_y's;known_x's),1)

 Coeficientul unghiular 0:


0 = INDEX(LINEST(known_y's,known_x's),2)

1.13 Sampling
Instrumentul de analiză Sampling creează un eșantion dintr-o populație prin tratarea zona de intrare
ca pe o populație. Când populația este prea mare pentru a o procesa sau pentru a o înscrie într-o
diagramă, aveți posibilitatea să utilizați un eșantion reprezentativ. Aveți de asemenea posibilitatea
să creați un eșantion care să conțină numai valori dintr-o anumită parte a unui ciclu în cazul în care
considerați că datele de intrare sunt periodice. De exemplu, dacă zona de intrare conține cifre de
vânzări trimestriale, eșantionarea cu un coeficient periodic de patru va plasa valorile din același
trimestru în zona de ieșire.

1.14 t-Test
Instrumentele de analiză t-Test pentru două eșantioane testează egalitatea mediilor populațiilor de
bază pentru fiecare dintre eșantioane. Cele trei instrumente folosesc ipoteze diferite: varianțele
populațiilor sunt egale, varianțele populațiilor nu sunt egale și cele două eșantioane reprezintă
observațiile înainte și după tratament asupra acelorași subiecți.
Pentru toate cele trei instrumente de mai jos, o valoare a statisticii t, t, este calculată și prezentată
ca " t Stat" în tabelul cu rezultate. În funcție de date, această valoare, t, poate fi negativă, pozitivă
sau egală cu zero. Presupunând că mediile populațiilor de bază sunt egale, dacă t < 0, " P(T <= t)
unilateral" dă probabilitatea ca o valoare a statisticii t observată să fie mai negativă decât t. Dacă t
>=0, " P(T <= t) unilateral" dă probabilitatea ca o valoare a statisticii t observată să fie mai pozitivă
decât t. " t unilateral critic" dă valoarea limită pentru care probabilitatea observării unei unei valori
a statisticii t mai mare sau egală cu " t unilateral critic" să fie Alfa.
" P(T <= t) bilateral" dă probabilitatea ca o valoare a statisticii t observată să fie mai mare în
valoare absolută decât t. " P bilateral critic" dă valoarea limită pentru care probabilitatea unei
statistici t observate mai mari în valoare absolută decât " P bilateral critic" să fie Alfa.

1.15 t-Test: Paired Two Sample For Means


Utilizați testul pereche atunci când există o corespondență naturală a observațiilor din eșantioane,
cum ar fi atunci când un grup eșantion este testat de două ori, înainte și după un experiment. Acest
instrument de analiză și formula sa efectuează un T-test al lui Student cu două eșantioane pereche
pentru a determina dacă este probabil ca observațiile făcute înainte și după un experiment să
provină din distribuții cu medii egale ale populațiilor. Această formă de test t nu presupune că
varianțele celor două populații sunt egale.
Notă : Printre rezultatele care sunt generate de acest instrument se află varianța centralizată, o
măsură de acumulare a împrăștierii datelor legate de medie, derivată din formula următoare.

1.16 t-Test: Two-Sample Assuming Equal Variances

Pag. 10 din 14
PREZENTAREA INSTUMENTELOR DE ANALIZA – DATA ANALYSIS

Acest instrument de analiză execută un test t pe două eșantioane de studenți. Acest test t presupune
că cele două seturi de date provin din distribuții cu aceleași varianțe. I se spune test t
homoscedastic. Aveți posibilitatea să utilizați acest test t pentru a determina dacă este probabil ca
cele două eșantioane să provină din distribuții cu medii egale ale populațiilor.

1.17 t-Test: Two-Sample Assuming Unequal Variances


Acest instrument de analiză execută un test t al lui Student pe două eșantioane.
Acest test t presupune că cele două seturi de date provin din distribuții cu
varianțe inegale; I se spune test t heteroscedastic . Ca și în cazul varianțelor
egale de mai sus, aveți posibilitatea să utilizați acest test t pentru a determina
dacă este probabil ca cele două eșantioane să provină din distribuții cu medii
egale ale populațiilor. Utilizați acest test atunci când sunt subiecți distincți în
cele două eșantioane. Utilizați testul Paired descris în următorul exemplu atunci
când există un singur set de subiecți și cele două eșantioane reprezintă
măsurători ale subiecților înainte și după un experiment.
Următoarea formulă este utilizată pentru a determina valoarea statistică a
testului t .

Următoarea formulă se utilizează pentru a calcula gradele de libertate, df. Deoarece rezultatul
calculului nu este, în general, un număr întreg, valoarea lui df este rotunjită la cel mai apropiat
întreg pentru a obține o valoare critică din tabelul t. Funcția de foaie de lucru Excel T.TEST
utilizează valoarea calculată df fără rotunjire, deoarece este posibil să calculeze o valoare pentru
T.TEST cu un df neîntreg. Datorită acestor abordări de determinare a gradelor de libertate,
rezultatele T.TEST și ale instrumentului t-Test vor fi diferite în cazul Varianțe inegale.

1.18 z-Test
Instrumentul z-Test: Two Sample for Means execută un test z pe două eșantioane pentru medii cu
varianțe cunoscute. Acest instrument este utilizat pentru a testa ipoteza nulului, că nu este nicio
diferență între două medii ale unor populații, în comparație cu ipotezele alternative, fie cea
unilaterală fie cea bilaterală. Dacă varianțele nu sunt cunoscute, atunci se va utiliza funcția de foaie
de lucru Z.TEST.
Când utilizați instrumentul z-Test, trebuie acordați atenție interpretării rezultatelor. " P(Z <= z)
unilateral" este de fapt P(Z >= ABS(z)), probabilitatea unei valori z mai depărtate de 0 în aceeași
direcție ca valoarea z observată, când nu sunt diferențe între mediile populațiilor. " P(Z <= z)
bilateral" este de fapt P(Z >= ABS(z) sau Z <= -ABS(z)), probabilitatea unei valori z mai depărtate
de 0 în oricare direcție față de valoarea observată z, când nu sunt diferențe între mediile
populațiilor. Rezultatul bilateral este tocmai rezultatul unilateral multiplicat cu 2. Testul z poate să
se utilizeze, de asemenea, pentru cazul când ipoteza nulă este că există o valoare specifică diferită

Pag. 11 din 14
PREZENTAREA INSTUMENTELOR DE ANALIZA – DATA ANALYSIS

de zero pentru diferența dintre mediile a două populații. De exemplu, aveți posibilitatea să utilizați
acest text pentru a determina diferențele dintre performanțele a două modele de automobile.

2 REPREZENTARI GRAFICE
2.1 Crearea unei histograme o diagramă Pareto
O histogramă sau o diagramă Pareto (histogramă sortată)
este o diagramă coloană care afișează date de frecvență.
Iată un exemplu tipic:

Pentru a crea o histogramă în Excel, vă oferim două tipuri


de date — datele pe care doriţi să analizaţi şi numere bin
care reprezintă intervalele care doriţi pentru a măsura
frecvenţa.

Etapele realizării unei histograme


1. Selectați datele.
(Aici este datele pe care a fost utilizat pentru a crea histograma eşantion indicat mai sus.)

2. Faceți clic pe Inserare > Inserați o diagramă statistică > Histogramă.

De asemenea, puteţi crea o histogramă din fila Toate diagramele în Diagrame de


recomandat.
Sfaturi:
 Utilizaţi filele designul şi formatul pentru a particulariza aspectul diagramei.

Etapele realizării unei diagrame Pareto


O diagramă Pareto sau histogramă sortată conține
atât coloane sortate în ordine descendentă, cât și
o linie care reprezintă procentul total cumulat.
Diagramele Pareto evidențiază cei mai mari
factori dintr-un set de date, fiind considerate unul
dintre cele șapte instrumente de bază pentru
controlul calității, deoarece este simplu de văzut
cele mai obișnuite probleme.

1. Selectați datele. De obicei, selectați o coloană care conține text (categorii) și una care
conține numere. O diagramă Pareto grupează apoi aceleași categorii și adună numerele
corespunzătoare.

Pag. 12 din 14
PREZENTAREA INSTUMENTELOR DE ANALIZA – DATA ANALYSIS

Datele utilizate pentru a crea exemplul de diagramă de mai sus


Dacă selectați două coloane de numere, nu o coloană de numere și una cu categoriile de
text corespunzătoare, Excel va reprezenta datele în compartimente, la fel ca o histogramă.
Apoi puteți ajusta aceste compartimente.
2. Faceți clic pe Inserare > Inserați o diagramă
statistică, apoi, sub Histogramă, alegeți Pareto.

De asemenea, puteți utiliza fila Toate diagramele din


Diagrame recomandate pentru a crea o diagramă
Pareto (faceți clic pe Inserare > Diagrame
recomandate > fila Toate diagramele.
Sfat : Utilizați filele Proiectare și Format pentru a particulariza aspectul diagramei. Dacă nu
vedeți aceste file, faceți clic oriunde în diagrama Pareto pentru a adăuga Instrumente diagramă
în panglică.

2.2 Configurarea compartimentelor


1. Faceți clic dreapta pe axa orizontală a diagramei > Formatare
axă >Opțiuni axă.

2. Utilizați informațiile de mai jos pentru a alege opțiunile dorite


în panoul de activități Formatare axă.

După categorie Setare implicită atunci când sunt reprezentate grafic


și date, și text. Categoriile de text sunt reprezentate pe axa orizontală
și reprezentate grafic în ordine descendentă.
Sfat : Pentru a contoriza numărul de apariții pentru șiruri text,
adăugați o coloană și completați-o cu valoarea „1”, apoi
reprezentați diagrama Pareto și setați compartimentele la
După categorie.
Automat Aceasta este setarea implicită pentru diagrame Pareto
reprezentate cu o singură coloană de date. Lățimea
compartimentului este calculată utilizând regula de
referință normală a lui Scott.
Lățime compartiment Introduceți un număr zecimal pozitiv
pentru numărul de puncte de date din fiecare zonă.
Număr de compartimente Introduceți numărul de
compartimente pentru diagrama Pareto (inclusiv
compartimentele de depășire și de subdepășire). Lățimea
compartimentului se va regla automat.

Pag. 13 din 14
PREZENTAREA INSTUMENTELOR DE ANALIZA – DATA ANALYSIS

Compartiment de depășire Bifați caseta pentru a crea un compartiment pentru toate valorile
care depășesc numărul din caseta corespunzătoare. Pentru a modifica această valoare,
introduceți un număr zecimal în casetă.
Compartiment de subdepășire Bifați caseta pentru a crea un compartiment pentru toate valorile
mai mici sau egale cu numărul din caseta corespunzătoare. Pentru a modifica această
valoare, introduceți un număr zecimal în casetă.

2.3 Formulele folosite pentru a crea histograme în Excel 2016


Regula de referință normală a lui Scott:

Regula de referință normală a lui Scott încearcă să minimizeze varianța diagramei Pareto,
comparativ cu setul de date, date fiind date normal distribuite.
Compartiment de depășire

Compartiment de subdepășire

Pag. 14 din 14

You might also like