Download as docx, pdf, or txt
Download as docx, pdf, or txt
You are on page 1of 5

1.

MÈTODES D’AVALUACIÓ DE DADES


La informació recollida mitjançant els mètodes que hem conegut fins ara pot ser numèrica o
textual (variables qualitatives o quantitatives).Però aquestes dades no ens seran útils fins que no les
analitzem.

Organització de les dades


TABULACIÓ: resumir les dades en una taula que substitueix una massa de dades difícilment
interpretables, x representació ordenada de les mateixes.
GRÀFIQUES:es representen les dades de manera visual

1.1 TAULES DE FREQÜÈNCIES


Per resumir dades en taules o en forma de representació gràfica organitzar i ordenar mitjançant la distribució de freqüències.
La freqüència vegades q es repeteixen les variables de la mostra o població.

Hi ha dos tipus de freqüències:


Absoluta ni : número de vegades que es repeteix
Relativa fi : coeficient relaciona ni-nº total de dades que tenim.
Es Pot convertir en altres valors de freqüència:
Percentatges: % i= fi x 100
Altres: tant per mil, tant per milió
Freqüència acumulada: sumar freqüències consecutives (Ni o Fi)

• Si GRAN nº dades o la variable és contínua agrupar dades en intervals amb mateixa amplada 🡪
CLASSES delimitada pel límit inferior i el límit superior

•A cada classe se li assignarà la freqüència corresponent.


• Amplitud (A)/RANG de classe/longitud de classe diferència límits i .
•M arca de classe punt mig de cada interval, representa a tot l’interval per al càlcul d’alguns paràmetres
(límit superior + límit inferior)/2

•Número d’intervals. Enesaquest


pot determinar percom
cas, és calcula la regla delal’arrel
n (n és mida quadrada
de la mostra)

•De vegades es poden crear intervals “calaix de sastre” per a classificar els valors més extrems. Poden
ser per al primer o l’últim valor i es sol expresar com > X (per als més grans) o < X (per als més petits).

Protocol per construir els intervals

1. Amplitut Xi (nº total valors ). Rang= (X i màx - Xi min ) +1


2.
Nº intervals que es vol. Segons l’interès de l’investigador. S’usa n i és aconsellable que sigui un número senar. No es recom

3. Amplada/mida de l’interval. Dividir rang/nº intervals. Arrodonir cap amunt.


4. Construir els nous intervals.Valor més petit es va sumant l’amplada.
5. Construir la nova taula d’intervals sumant les freqüències dels valors que s’inclouen a cada nou
interval.

1.2 REPRESENTACIÓ GRÀFICA


Resumir variables mitjançant la representació visual o gràfica:

Avantatges: impacten, ràpida lectura, informació global i completa de la mostra o població estudiada.
A la representació gràfica s’han de mostrar les escales i les unitats, és recomanable que continguin un
títol, que el contingut sigui clar i per si soles han de ser auto-explicatives.

Hi ha diferents tipus de gràfiques, en funció dels tipus de dades.


GRÀFICA TIPUS DE CARÀCTERS ÚS PREFERENCIAL

Diagrama de sector o Qualitatius i quantitatius Estadística descriptiva


sectograma

Pictograma Qualitatius i quantitatius Estadística descriptiva

Diagrama de barres Qualitatius i quantitatius discrets Estadística descriptiva

Histograma Quantitatius continus Estadística descriptiva

Polígon de freqüències Quantitatius discrets i continus Estadística descriptiva

1.2.1 HISTOGRAMA
● Dades quantitatives agrupades en intervals.
● A l’eix d’abscises (horitzontal, x): intervals de classe
● A l’eix d’ordenades (vertical, y): la freqüència (n, f, %...)
● Si són dades contínues: adossats.
● Si són dades discretes o qualitatives no adossades.
● S’utilitza un rectangle, amb una amplada proporcional a la longitud o amplitud de l’interval.

1.2.2 POLÍGONS DE FREQÜÈNCIES


● Gràfics lineals utilitzats per representar caràcters quantitat.
● S’utilitza un eix de coordenades, situant punts en les interseccions entre les dades i la seva freqüència,
representant un polígon al unir-se de forma ordenada mitjançant rectes.
● Existeix una modalitat de polígon de freqüències acumulades, que s’utilitza per representar distribucions
de freqüències acumulades, tant absol. com relat.
● En un mateix gràfic es poden construir dos polígons de freqüència per poder-los comparar.
1.2.3 DIAGRAMA DE BARRES

Són similars a l’histograma però, s’utilitzen barres de freqüències.


S’utilitzen per representar caràcter qualitatius i quantitatius discrets.
● Vertical (o de barres verticals): se situa la varible a l’eix d'abscisses (x)
● Horitzontal (o de barres horitzontals): a l’eix d'ordenades (y)
Representar 3D rectangles substituïts x prismes de base rectangular.

1.2.4 PICTOGRAMES
Representen gràficament,(dibuix o figura) les freq. d’una variable.
Poden haver diferents formes:
● De repetició: s’assigna un valor a un dibuix en relació a la freqüència. Es repeteix en funció de la
seva freqüència
● D’ampliació: a cada classe se li assigna una figura diferent amb una àrea proporcional a la seva
freqüència.

1.2.5 DIAGRAMA DE SECTORS


Són gràfics circulars, en els que cada modalitat o classe correspon a un sector de l’àrea proporcional a la
seva freqüència (una porció diferent del pastís).
Se sol utilitzar amb variables qualitatives i quantitatives discretes.
Es construeix partint que el 100% de la freq. correspon als 360° del pastis.
Si el nº de categories és molt gran, la imatge proporcionada pel gràfic de sectors no és suficientment
clara.
GRAUS = Freqüència relativa * 360= (f/total)*360
PERCENTATGE = Freqüència relativa * 100= (fr/total)*100

1.2.6 GRÀFICS LINEALS


Els gràfics de línies són una bona solució per dades quantitatives
Són especialment útils per expressar canvis que es produeixen en els valors entre diferents categories de
dades.

2. ANÀLISI ESTADÍSTIC DE DADES


2.1 Mesures de posició i dispersió de dades
Per a l’anàlisi de les dades, en interessa saber :
On està la majoria de valors de la variable: mesures de centralització
On està un valor qualsevol respecte als altres: mesures de posició o de quantils
Com són de discrepants els valors d’una variable: mesures de dispersió

2.1.1 Mesures de centralització


a. Mitjana aritmètica:
● Valor promig dels valors d’una variable de la mostra o de la població.
● Si és mostral x si és poblacional μ
● En taula, incloure columna amb valors xi · ni, per realitzar la mitjana
● Més real el resultat com més gran sigui la grandària mostral
● S’utilitza qüestions de quantitat
● Es veu molt afectada per valors extrems. Utilitzar-la quan hi ha simetria
● Si els valors són continus i s’agrupen en intervals es posa la marca de cada classe (punt mig)

b. Mediana (m)
● Representa el valor que deixa a la dreta i esquerra el 50% dels valors
● És l'observació equidistant dels extrems
x (n/2)❑+ x(n/2+1)
● Si el nº és parell, sempre existiran dos valors centrals: m=
2
● Si és imparell: m= x (n+½)
● Per dades qualitatives ordinals o quantitatius discrets, si són diferents els valors, es diu que la
mediana està entre aquells dos valors.
● No s’altera tant com la mitjana en els valors extrems. S’utilitza més per distribucions simètriques.

c. La Moda (mo)
● Valor que més es repeteix d’una mostra o població
● Quantitatives continues agrupades no mo, sinó com interval modal
● Distribucions variable amb 1o+ valors amb molta freqüència bimodal, trimodal…
● Té més transcendència en valors qualitatius, ja que aquests no tenen mesures de tendència central
● Ens fa perdre molta informació. Si les dades són simètriques, els valors són practicament igual a la
mitjana i la mediana.

d. Altres
Mitjana ponderada: Es simbolitza amb X̅ p. És la mitjana aritmètica
amb pesos diferents (%), els quals es dessignen amb wi
xi∗wi + x 2∗w 2+....
w 1+ w 2+...
Mitjana geomètrica: Es simbolitza amb X̅ g. És l’arrel enèssima del
producte dels valors de la variable.
S’utilitza quan la mitjana aritmètica està molt influenciada pels valors extrems.
√ x 1∗x 2∗x 3....
N

2.1.2 Mesures de posició o quantils


Mesures de posició ordre que ocupa una dada dins del total de dades Divideixen un conjunt de dades en grups amb el mateix número
Cal ordenar les dades de menor a major.
PERCENTIL: mesura estadística la qual divideix una serie de dades ordenats de menor a major en 100
parts iguals. Es tracta d’un indicador que busca mostrar la proporció de la sèrie de dades que queda per
sota del seu valor.
Els percentils donen els valors corresponents al 1%, 2%....99%.

k∗N P50 coincideix amb la mitjana


quartils: P50 coincideix amb Q2
4 P50 coincideix amb D5
k∗N P50= Me = Q2 = D5
decils:
10
percentil:
k∗N
100
Primer es busca la classe on es troba (K*N)/100, k= 1, 2,...99 a la taula de freqûències.
n= total elements
k=el percentil que piden (P50 o p lo que sea)

Decils: divideixen la població o sèrie de dades en 10 parts iguals. Així tenim el P10 = D1, P20 = D2,
P30 = D3...
Quartils: divideixen la població o sèrie de dades en 4 parts iguals. Així tenim Q1 = P25, Q2 = P50,
P75 = Q3...
La mediana és el percentil 50, el decil 5 i el quartil 2.

2.1.3 Mesures de dispersió


Índexs estadístics x conèixer el grau de variabilitat o dispersió de les dades d’una distribució respecte una
mesura central.
Exemple: si hi ha dues persones, una amb 24 anys i l’altra amb 26 i una altra parella de 18 i 32, ambdues
tenen una mitjana aritmètica de 25, però l’última presenta més dispersió.

a. Amplitud o rang (A): diferència entre 2 valors, el màxim i el mínim de la variable d’estudi d’una mostra
o població.
És poc utilitzada, ja que només considera dos valors de la variable.
No depèn de la grandària mostral.

Rang:
A: 1,1,1,1,1,1,1,1,1,1,1,1,1,5
B:1,2,3,4,5
En ambdós és A=4, però són molt diferents.

b. Desviació mitjana (dm): mitjana aritmètica de les desviacions absolutes a la mitjana


Es consideren tots els valors de la variable respecte la seva mitjana en valor absolut (no negatiu)
Si el seu valor és alt molta dispersió
És només orientatiu

dm=( Σ |xi−x| )/ N
1r mitjana aritmètica
Suma de la diferencia entre cada valor i la mitjana aritmètica. No posem el signe valor absoluto = en positiu

c. Variança (S2)
És la mitjana aritmètica del quadrat de les desviacions respecte a la mitjana de la mateixa.
Se simbolitza com σ 2
Es calcula aplicant la fórmula

Molt sensible a les puntuacions extremes, una variància elevada significa que les dades estan més
disperses, mentre que un valor de la variància baix indica que els valors estan en general més propers a
la mitjana.
Un valor=0 implica q tots valors són = i coincideixen amb la mitjana aritmètica.

d. Desviació típica
Si es tracta d’una població s’utilitza σ
És l’arrel quadrada de la variança
És l’estadístic més utilitzat per la dispersió, ja que es molt estable a les fluctuacions matemàtiques S=
√❑
e. Coeficient de variació
És la desviació típica relacionada amb (dividida per) la mitjana.
S’utilitza per al control de qualitat de màquines
Si el seu valor és baix: alta precisió de l’aparell mesurador. Expressar en %
A major valor de CV, major heterogeneïtat dels valors de la variable; i a menor CV, major homogeneïtat.

cv= (s/x)*100

You might also like