Professional Documents
Culture Documents
Organització de Les Dades
Organització de Les Dades
• Si GRAN nº dades o la variable és contínua agrupar dades en intervals amb mateixa amplada 🡪
CLASSES delimitada pel límit inferior i el límit superior
•De vegades es poden crear intervals “calaix de sastre” per a classificar els valors més extrems. Poden
ser per al primer o l’últim valor i es sol expresar com > X (per als més grans) o < X (per als més petits).
Avantatges: impacten, ràpida lectura, informació global i completa de la mostra o població estudiada.
A la representació gràfica s’han de mostrar les escales i les unitats, és recomanable que continguin un
títol, que el contingut sigui clar i per si soles han de ser auto-explicatives.
1.2.1 HISTOGRAMA
● Dades quantitatives agrupades en intervals.
● A l’eix d’abscises (horitzontal, x): intervals de classe
● A l’eix d’ordenades (vertical, y): la freqüència (n, f, %...)
● Si són dades contínues: adossats.
● Si són dades discretes o qualitatives no adossades.
● S’utilitza un rectangle, amb una amplada proporcional a la longitud o amplitud de l’interval.
1.2.4 PICTOGRAMES
Representen gràficament,(dibuix o figura) les freq. d’una variable.
Poden haver diferents formes:
● De repetició: s’assigna un valor a un dibuix en relació a la freqüència. Es repeteix en funció de la
seva freqüència
● D’ampliació: a cada classe se li assigna una figura diferent amb una àrea proporcional a la seva
freqüència.
b. Mediana (m)
● Representa el valor que deixa a la dreta i esquerra el 50% dels valors
● És l'observació equidistant dels extrems
x (n/2)❑+ x(n/2+1)
● Si el nº és parell, sempre existiran dos valors centrals: m=
2
● Si és imparell: m= x (n+½)
● Per dades qualitatives ordinals o quantitatius discrets, si són diferents els valors, es diu que la
mediana està entre aquells dos valors.
● No s’altera tant com la mitjana en els valors extrems. S’utilitza més per distribucions simètriques.
c. La Moda (mo)
● Valor que més es repeteix d’una mostra o població
● Quantitatives continues agrupades no mo, sinó com interval modal
● Distribucions variable amb 1o+ valors amb molta freqüència bimodal, trimodal…
● Té més transcendència en valors qualitatius, ja que aquests no tenen mesures de tendència central
● Ens fa perdre molta informació. Si les dades són simètriques, els valors són practicament igual a la
mitjana i la mediana.
d. Altres
Mitjana ponderada: Es simbolitza amb X̅ p. És la mitjana aritmètica
amb pesos diferents (%), els quals es dessignen amb wi
xi∗wi + x 2∗w 2+....
w 1+ w 2+...
Mitjana geomètrica: Es simbolitza amb X̅ g. És l’arrel enèssima del
producte dels valors de la variable.
S’utilitza quan la mitjana aritmètica està molt influenciada pels valors extrems.
√ x 1∗x 2∗x 3....
N
Decils: divideixen la població o sèrie de dades en 10 parts iguals. Així tenim el P10 = D1, P20 = D2,
P30 = D3...
Quartils: divideixen la població o sèrie de dades en 4 parts iguals. Així tenim Q1 = P25, Q2 = P50,
P75 = Q3...
La mediana és el percentil 50, el decil 5 i el quartil 2.
a. Amplitud o rang (A): diferència entre 2 valors, el màxim i el mínim de la variable d’estudi d’una mostra
o població.
És poc utilitzada, ja que només considera dos valors de la variable.
No depèn de la grandària mostral.
Rang:
A: 1,1,1,1,1,1,1,1,1,1,1,1,1,5
B:1,2,3,4,5
En ambdós és A=4, però són molt diferents.
dm=( Σ |xi−x| )/ N
1r mitjana aritmètica
Suma de la diferencia entre cada valor i la mitjana aritmètica. No posem el signe valor absoluto = en positiu
c. Variança (S2)
És la mitjana aritmètica del quadrat de les desviacions respecte a la mitjana de la mateixa.
Se simbolitza com σ 2
Es calcula aplicant la fórmula
Molt sensible a les puntuacions extremes, una variància elevada significa que les dades estan més
disperses, mentre que un valor de la variància baix indica que els valors estan en general més propers a
la mitjana.
Un valor=0 implica q tots valors són = i coincideixen amb la mitjana aritmètica.
d. Desviació típica
Si es tracta d’una població s’utilitza σ
És l’arrel quadrada de la variança
És l’estadístic més utilitzat per la dispersió, ja que es molt estable a les fluctuacions matemàtiques S=
√❑
e. Coeficient de variació
És la desviació típica relacionada amb (dividida per) la mitjana.
S’utilitza per al control de qualitat de màquines
Si el seu valor és baix: alta precisió de l’aparell mesurador. Expressar en %
A major valor de CV, major heterogeneïtat dels valors de la variable; i a menor CV, major homogeneïtat.
cv= (s/x)*100