INTRODUCCIÓN

You might also like

Download as pdf or txt
Download as pdf or txt
You are on page 1of 51

Tema 1.

INTRODUCCIÓ
ÍNDEX
Conceptes bàsics

1. Població
2. Mostra
3. Tipus de mostreig
4. Variables i tipus de variables
5. Dades i tipus de dades
2
1. Població
Conjunt d’elements, amb una característica comú,
subjectes a estudi i dels quals volem obtenir un
resultat.

Població

3
1. Població
Exemple:
Una empresa consultora vol fer un estudi per conèixer
el comportament turístic de les dones residents a
Barcelona.
Quina seria la població d’estudi?

 Població: dones residents a Barcelona

És possible estudiar a totes les dones residents a Barcelona?

4
1. Població
És possible estudiar a tots els elements d’una població?
Habitualment haurem de recórrer a una mostra per
poder inferir dades de la població.
Població
Mostra

5
2. Mostra
Subconjunt d’elements que formen part de la població.
La mostra ha de ser representativa de la població.

6
2. Mostra
Exemple:
Volem conèixer el sou mitjà dels treballadors d’una
gran empresa durant l’any 2019.
Quina mostra seleccionarem?

 Mostra: un grup de treballadors


representatius de l’empresa durant l’any 2019.

Com triem una mostra representativa?


Haurem de tenir representades totes les categories laborals de
l’empresa.

7
2. Mostra
Exercici 1:
• En un diari surt publicada la següent notícia:
“El 10% dels espanyols que van viatjar a l’estranger
durant el 2019 van preferir no contractar cap
assegurança de viatge.”

Es va arribar a aquesta conclusió a partir d’una


mostra o d’una població?

8
2. Mostra
Exercici 1 (solució):
Es va arribar a aquesta conclusió a partir d’una
mostra, ja que no podem entrevistar a tots els
espanyols que van viatjar a l’estranger durant l’any
2019.
Per què no?
- Elevat cost (€)
- No existeix un registre amb aquesta informació.
Com podem saber quins espanyols van viatjar a
l’estranger durant l’any 2019?

9
2. Mostra
Exercici 2:
• El 15% de les matriculacions d’automòbils fetes a
Catalunya durant els últims cinc anys van ser d’una
determinada marca comercial.

Es va arribar a aquesta conclusió a partir d’una


mostra o d’una població?

10
2. Mostra
Exercici 2 (solució):
Es va arribar a aquesta conclusió a partir de tota la
població, ja que existeix un registre de totes les
matriculacions que es fan a Catalunya (Direcció
General de Tràfic).

En aquest cas hagués estat més costós i més difícil fer-


ho a partir d’una enquesta mostral.

11
2. Mostra
Mida mostral (o grandària de la mostra)

És el nombre d’elements que formen part de la


mostra.

Ho denotarem per n o N

12
3. Tipus de mostreig
La millor manera per evitar la influència de qualsevol
factor extern i que la mostra sigui representativa serà
fer-ho de manera....
ALEATÒRIA

13
3. Tipus de mostreig
Mostreig aleatori simple
1er. Numerem tots els elements que composen la
població.

2on. Mitjançant qualsevol sistema


aleatori (taules de nombres aleatoris,
ordinador) seleccionem aquells que
formaran part de la mostra.

14
3. Tipus de mostreig
Exercici 3:
Volem fer un estudi dels hàbits turístics dels residents
a Espanya.

1. Quina és la població d’estudi?


2. En aquest cas és necessària una mostra?
3. Com faríeu en aquest cas un mostreig aleatori
simple si volguéssiu una mostra de N = 10.000?

15
3. Tipus de mostreig
Exercici 3 (solució):

1. Població espanyola (49 milions de persones)


2. Sí, serà necessària una mostra, ja que no existeix
un registre dels hàbits turístics dels espanyols i
seria molt costós entrevistar-los a tots.
3. A partir del cens amb els 49 milions de persones
generaríem informàticament 10.000 nombres
aleatoris que seleccionessin als individus a
entrevistar.

16
3. Tipus de mostreig
Mostreig aleatori sistemàtic
1er. Ordenem mitjançant algun criteri tots els
elements o individus que composen la població.

2on. Els seleccionem sistemàticament, en funció de la


seva posició en l’ordenació.

17
3. Tipus de mostreig
Mostreig aleatori sistemàtic
3er. Seleccionem un element cada x, on:

4rt. El primer element que triarem no serà el primer


element de la llista, serà un element triat
aleatòriament d’entre els x primers.

18
3. Tipus de mostreig
Exercici 4:
Volem fer un estudi dels hàbits turístics dels residents
a Espanya.

4. Com faríeu en aquest cas un mostreig aleatori


sistemàtic si volguéssiu una mostra de N = 10.000?

19
3. Tipus de mostreig
Exercici 4 (solució):
Seleccionaríem un element cada x=4.900
(49.000.000/10.000).

4.200 – 9.100 – 14.000 – 18.900 – 23.800 – ...

Recordeu que el primer element el triem a l’atzar


d’entre els 4.900 primers.

20
3. Tipus de mostreig
Atenció!
No fer servir aquest tipus de mostreig en el cas de
dades temporals amb periodicitat, ja que la mostra
que obtindríem no seria representativa de la població.

Gener – Febrer – Març – Abril – Maig – Juny – Juliol –


Agost – Setembre – Octubre – Novembre - Desembre

21
3. Tipus de mostreig
Mostreig aleatori estratificat
1er. Dividim la població en grups o categories en
funció d’alguna característica de la població (p.ex.:
gènere (dones/homes), edat (<25, 25-45, >45)).
Aquests grups o categories s’anomenen estrats.

2on. Apliquem el mostreig aleatori simple, de manera


independent, a cada un dels estrats que, finalment,
s’agruparan per crear una única mostra.

22
3. Tipus de mostreig
Exercici 5:
Volem fer un estudi dels hàbits turístics dels residents
a Espanya, però volem que a la nostra mostra hi hagi
el mateix nombre de dones que d’homes.

5. Com faríeu en aquest cas un mostreig aleatori


estratificat si volguéssim una mostra de N = 10.000?

23
3. Tipus de mostreig
Exercici 5 (solució):
Dividirem els 49 milions de població en dos grups:
dones i homes.

Seleccionarem mitjançant un mostreig aleatori simple


5.000 dones.

Seleccionarem mitjançant un mostreig aleatori simple


5.000 homes.

24
3. Tipus de mostreig
Mostreig per conglomerats
1er. Dividim la població en grups o conglomerats que
siguin representatius de la població (p.ex.: pobles,
ciutats, cursos, aules, famílies, universitats, etc.)

2on. Seleccionem aleatòriament un d’aquests grups o


conglomerats.

25
3. Tipus de mostreig
Exercici 6:
Volem fer un estudi dels hàbits turístics dels residents
a Espanya.

6. Com faríeu en aquest cas un mostreig aleatori per


conglomerats si volguéssim una mostra de
N = 10.000?

26
3. Tipus de mostreig
Exercici 6 (solució):
Buscaríem una ciutat o poble espanyol que tingués
aproximadament uns 10.000 habitants.

Tot el poble o ciutat seria la nostra mostra.

27
3. Tipus de mostreig
Mostreig probabilístic (= mostreig aleatori)
- Mostreig aleatori simple
- Mostreig aleatori sistemàtic
- Mostreig aleatori estratificat
- Mostreig per conglomerats

Mostreig NO probabilístic (= mostreig NO aleatori)


- Mostreig per conveniència
- Mostreig consecutiu
- De judici
- Per quotes

28
3. Tipus de mostreig
Mostreig per conveniència
Seleccionem als elements de la població que estiguin
convenientment disponibles per a nosaltres.

Què vol dir convenientment disponibles? Que siguin fàcils


de reclutar.

Per exemple: Si jo envio una enquesta només a aquells


alumnes que s’han ofert com a voluntaris per contestar-
la.

29
3. Tipus de mostreig
Mostreig consecutiu
Seleccionem als elements de la població a mesura que
van arribant.

Per exemple: Enquestes fetes al carrer a la gent que


va passant.

30
3. Tipus de mostreig
Mostreig de judici
Seleccionem als elements de la població en base al
que determina un expert.

Per exemple:
- Les millors ciutats per provar la venda d’un producte.
- Col·legis electorals representatius.
- Clients fidels per provar el llançament d’un nou
producte.

31
3. Tipus de mostreig
Mostreig per quotes
Establim una sèrie de quotes per a diferents categories de la població basades en
una sèrie de consideracions rellevants a l’estudi (per exemple, 200 dones de 18-
25 anys residents a Barcelona) i, una vegada determinada la quota, seleccionem
als primers elements de la població que compleixin aquestes característiques.

Es pot entendre com la versió no probabilística del mostreig estratificat, però a


diferència d’aquest, dins de cada estrat seleccionem “per conveniència”.

32
3. Tipus de mostreig
Mostreig per etapes

És la combinació de 2 o més tipus de mostreig.

Exemple:
1a etapa: Mostreig aleatori per conglomerats.
Conglomerat: zona censal o poble o ciutat
2a etapa: Mostreig aleatori estratificat.
Estrats: dones/homes
3a etapa: Mostreig aleatori simple

33
4. Variable

Característica de la població en la que estem


interessats, aquella que volem estudiar i la que
mesurarem.

Pot indicar una qualitat o una quantitat.

La denotarem per Xi

34
4. Tipus de variables
Exercici 7:

Agrupeu les següents variables en funció del valor que prenen:

Color dels ulls Pes


Nombre d’anuncis d’un producte Estat civil
Edat Nombre de fills
Medalles olímpiques Preu
Nombre d’alumnes Tipus de transport
Distància Notes
Gènere Treballadors d’una empresa

35
4. Tipus de variables

Les variables es poden classificar com:


• Qualitatives (o categòriques):
• Nominals
• Ordinals

• Quantitatives:
• Discretes
• Contínues

36
4. Tipus de variables
Indica una qualitat
Variable qualitativa (o categòrica):
Color dels ulls (marró, blau, verd, ...)
Medalles olímpiques (or, plata, bronze)
Gènere (home, dona)
Estat civil (casat, solter, separat, vidu, ...)
Tipus de transport (tren, cotxe, avió, bicicleta, ...)
Notes (excel·lent, notable, ...)

37
4. Tipus de variables
Indica una qualitat
Variable qualitativa nominal: que no es pot ordenar

Color dels ulls (marró, blau, verd, ...)


Medalles olímpiques (or, plata, bronze)
Gènere (home, dona)  Variable binària o dicotòmica
Estat civil (casat, solter, separat, vidu, ...)
Tipus de transport (tren, cotxe, avió, bicicleta, ...)
Notes (excel·lent, notable, ...)

38
4. Tipus de variables
Indica una qualitat
Variable qualitativa ordinal: que es pot ordenar

Color dels ulls (marró, blau, verd, ...)


Medalles olímpiques (or, plata, bronze)
Gènere (home, dona)
Estat civil (casat, solter, separat, vidu, ...)
Tipus de transport (tren, cotxe, avió, bicicleta, ...)
Notes (excel·lent, notable, ...)

39
4. Tipus de variables
Indica una quantitat
Variable quantitativa:
Edat Nombre d’alumnes
Pes Distància
Nombre de fills Nombre d’anuncis d’un producte
Preu
Treballadors d’una empresa

40
4. Tipus de variables

Variable quantitativa discreta:


Edat Nombre d’alumnes
Pes Distància
Nombre de fills Nombre d’anuncis d’un producte
Preu
Treballadors d’una empresa

Entre dos valors consecutius no pot prendre cap valor.

41
4. Tipus de variables

Variable quantitativa contínua:


Edat Nombre d’alumnes
Pes Distància
Nombre de fills Nombre d’anuncis d’un producte
Preu
Treballadors d’una empresa

Entre dos valors consecutius pot prendre infinits valors.

42
4. Tipus de variables

És possible canviar algunes variables de tipus:

• Variable quantitativa contínua: Preu d’un producte (en €)

• Variable qualitativa ordinal:


• Pèrdues (<10 €)
• Sense pèrdues ni beneficis (=10 €)
• Beneficis (>10 €)

• Variable qualitativa nominal (binària o dicotòmica):


• Beneficis sí / no
[beneficis (>10 €), no beneficis (<=10 €)]

43
4. Tipus de variables

És possible assignar valors numèrics (codis) a variables categòriques:

Home: 0, Dona: 1
Marró: 0, Blau: 1, Verd: 2
Pèrdues: 0; Sense pèrdues ni beneficis: 1, Beneficis: 2

En cap cas aquests codis es podran utilitzar numèricament.

44
4. Tipus de variables
Exercici 7:

A quin tipus correspon cada una d’aquestes variables?


- Idioma
- Diners que porteu a la butxaca
- Nombre de comptes ocults a Suïssa
- Contingut d’alcohol que conté una beguda alcohòlica
- Temps que passeu mirant Netflix

45
4. Tipus de variables
Exercici 7 (solució):

A quin tipus correspon cada una d’aquestes variables?


- Idioma  Variable qualitativa nominal
- Diners que porteu a la butxaca  Variable quantitativa contínua
- Nombre de comptes ocults a Suïssa  Variable quantitativa
discreta
- Contingut d’alcohol que conté una beguda alcohòlica  Variable
quantitativa contínua
- Temps que passeu mirant Netflix  Variable quantitativa
contínua

46
5. Dades
Cada un dels valors observats de la variable en els elements o
individus de la mostra. Variable

Registre

Dada

47
5. Tipus de dades
Amb aquest tipus de
Dades transversals dades treballarem en els
2 següents temes (2 i 3).
Per a un únic individu tenim una o més variables
en un únic moment del temps.

Exemple:
Consum d’oci que van realitzar les famílies durant l’any 2018.
Família Despesa (€) Cinema Teatre
1 1.500 Sí Sí
2 950 No No
3 1.200 Sí No
... ... ... ...
Assumim que el consum que realitza la família 1 és independent del que realitza la família 2, etc.

48
5. Tipus de dades
Amb aquest tipus de
Dades temporals dades treballarem en el
Tema 4. Sèries temporals
Per a un únic individu tenim una o més variables
en diferents moments del temps.

Exemple:
Consum d’oci que van realitzar les famílies durant l’any 2018.
Despesa Despesa Altes
Mes
en cinema (€) en teatre (€) despeses (€)
Gener 9.000 10.300 400
Febrer 10.500 7.200 700
Març 8.200 5.100 250
... ... ... ...
Assumim que el consum que realitza una família en el mes de març no és independent del que va
realitzar la mateixa família en el mes de febrer, etc.

49
5. Tipus de dades
Dades temporals

Sèrie Temporal

50
5. Tipus de dades
Dades de panell
És una combinació de les dades transversals i temporals.

Despesa Despesa Altres


Família Mes
en cinema (€) en teatre (€) despeses (€)
1 Gener 650 550 50
1 Febrer 540 250 100
1 Març 100 300 75
2 Gener 420 410 120
2 Febrer 330 420 95
2 Marc 300 310 70
... ... ... ... ...

51

You might also like