Download as pdf or txt
Download as pdf or txt
You are on page 1of 9

Mostreig

Selecció d’activitats resoltes

Jose Fco. Martínez Boscá, Arnau Mir Torres, Lluís M. Pla Aragonés,
Àngel J. Gil Estallo (autors) i Ángel A. Juan (editor)
© FUOC • 5 Mostreig

Introducció

Posem per cas que hem dissenyat un programa de comptabilitat nou i volem
comprovar-ne el grau d'acceptació entre les empreses de Catalunya. Com
podem fer aquesta comprovació? Una manera simple de respondre aquesta
pregunta és simplement triar aleatòriament un conjunt d'empreses i fer l'en-
questa corresponent.

Ara bé, si l'elecció del conjunt anterior no s'executa de “manera representati-


va”, el resultat de l'enquesta pot no ser fiable.

Hem de fer, per tant, un estudi de com ens caldria triar una mostra represen-
tativa de totes les empreses de Catalunya per a obtenir un resultat fiable de
l'enquesta sobre el programa de comptabilitat.

Les tècniques de mostreig ens diuen com es pot desenvolupar un estudi com
l'anterior perquè la mostra seleccionada resulti com menys esbiaixada millor.
Quan diem esbiaixada, ens referim al fet que la mostra tingui més empreses
d'un determinat tipus que d'un altre. Per exemple, si en la nostra mostra apa-
reix un 60% d'empreses que es dediquen al sector de les comunicacions i un
20% d'empreses que es dediquen al sector de l'assessorament jurídic, la nostra
mostra serà esbiaixada, ja que tindrà el triple d'empreses que es dediquen al
sector de les comunicacions respecte al nombre d’empreses que es dediquen a
l'assessorament jurídic.

Per a poder elaborar la llista d'empreses de la mostra, en primer lloc necessi-


tem analitzar la informació amb què comptem. És a dir, tenim una llista de
totes les empreses de Catalunya?, aquesta llista conté informació sobre el
tipus d'empresa?, etc. Depenent de la informació que tinguem, podem realit-
zar un tipus de mostreig o un altre.

A continuació, presentem uns problemes resolts sobre mostrejos que ens po-
den ajudar a resoldre qüestions com les que plantejàvem abans.
© FUOC • 6 Mostreig

Mapa conceptual
Activitats Resoltes - Mostreig
Ángel Gil

Activitats Resoltes - Mostreig

Activitat 1. Nivell de satisfacció d’un servidor de cor-


reu.
Tècniques de mostreig. Mostreig probabilístic.
Volem fer un estudi de satisfacció que tenen els alumnes de la UOC amb el seu servidor de
correu. Per realitzar aquest estudi, es decideix passar una enquesta a 500 alumnes. Digueu
quin tipus de mostreig faríeu en cadascun dels casos següents explicant com faríeu el mostreig
i detallant com determinaríeu la mostra:
a) Si disposem d’un llistat de tots els alumnes de la UOC.
b) Si volem considerar les comarques de Catalunya, Illes Balears, País Valencià i uns altres
com a zones geogràfiques. En aquest cas, també disposem d’un llistat dels alumnes on
hi ha indicada la comunitat autònoma a la qual pertany cada alumne.
c) Si tenim la taula següent on s’indica el percentatge d’alumnes per franges d’edat (entre
20 i 40 anys, entre 40 i 60 anys i > 60 anys) i per tipus de servidor.

Servidor Correu/Edat 20-40 anys 40-60 anys >60 anys


GMAIL 20% 5% 1%
——————— ———— ———— ———
HOTMAIL 20% 5% 2%
——————— ———— ———— ———
YAHOO 20% 3% 1%
——————— ———— ———— ——–
ALTRES 20% 2% 1%

Solució

a) En aquest cas hem de fer un mostreig aleatori simple. Suposem que tenim 15000
alumnes. Per simular en R una mostra de 500 alumnes podem usar directament les
instruccions

1
test1<-sample(1:15000,500,replace=TRUE)

amb què obtenim 500 valors (cada vegada que s’executi s’obté una mostra diferent)
dels quals vam mostrar els 10 primers:
test1[0:10]

## [1] 510 8420 12887 12715 5731 7342 8872 12497 11480 5783
b) En aquest cas hem de realitzar un mostreig per conglomerats usant proporcionalment els
alumnes pertanyents a cada comunitat autònoma. Per exemple, imaginem que el 60%
dels alumnes de la UOC són de Catalunya, el 15% del País Valencià, el 15% de Balears
i el 10% restant pertanyent a altres comunitats autònomes. Llavors la nostra mostra
tindrà 0.6 ú 500 = 300 alumnes de Catalunya, 0.15 ú 500 = 75 alumnes del País Valencià,
75 alumnes de Balears i 50 alumnes d’altres comunitats. Després triem aleatòriament
unes comarques de Catalunya, País Valencià, Balears i d’altres comunitats autònomes.
Suposem, per fixar idees, que triem 10 comarques de Catalunya, 10 comarques del
País Valencià, 10 comarques de Balears i 10 comarques d’altres comunitats autònomes.
Seguidament, hem de triar 30 estudiants per a cada comarca de Catalunya, 7 estudiants
de 5 comarques del País Valencià i 8 estudiants de les altres 5 comarques, el mateix
per a les comarques de Balears i 5 estudiants per a les comarques d’altres comunitats
autònomes totes les eleccions de forma aleatòria. D’aquesta forma, haurem format una
mostra de 500 estudiants.
c) En aquest cas hem de realitzar un mostreig per quotes. Calculem quants estudiants
hem de tenir en la nostra mostra per franges d’edat i per servidor:

Servidor Correu/Edat 20-40 anys 40-60 anys >60 anys


GMAIL 20%*500=100 5%*500=25 1%*500=5
——————— ———— ———— ———
HOTMAIL 20%*500=100 5%*500=25 2%*500=10
——————— ———— ———— ———
YAHOO 20%*500=100 3%*500=15 1%*500=5
——————— ———— ———— ——–
ALTRES 20%*500=100 2%*500=10 1%*500=5

Seguidament, hem d’encarregar als nostres entrevistadors que entrevistin a 100 alumnes entre
20-40 anys que usin GMAIL, a 100 que usin HOTMAIL, a 100 que usin YAHOO i a 100 que
usin altres servidors de correu. També han d’entrevistar a 25 alumnes entre 40-60 anys que
usin GMAIL, a 25 que usin HOTMAIL, a 15 que usin YAHOO i a 10 que usin altres servidors
de correu. Finalment, han d’entrevistar a 5 alumnes majors de 60 anys que usin GMAIL, a
10 que usin HOTMAIL, a 5 que usin YAHOO i a 5 que usin altres servidors de correu.

2
Activitat 2. Estudi de la velocitat de banda ampla.
Tècniques de mostreig. Mostreig probabilístic
Es vol realitzar un estudi de la velocitat de banda ampla a la ciutat de Palma de Mallorca.
Volem enquestar a 300 clients de banda ampla. Digueu quin tipus de mostreig realitzaríeu en
cadascun dels casos següents i expliqueu com fer-ho:
a) Si disposem d’un llistat de tots els clients de banda ampla de tots els ISP (“Internet
Servide Provider”) d’Internet.
b) Si tenim un mapa de la ciutat separada en 50 zones geogràfiques on tenim una llista
d’usuaris per zona. A cada zona hi ha més o menys el mateix nombre de clients.
c) Si tenim la taula següent on s’indica el percentatge de clients per franges d’edat (< 20
anys, entre 20 i 40 anys, entre 40 i 60 anys i > 60 anys) i per ISP (Telefónica, Ono,
Orange, Jazztel, etc. . . )

ISP/Edat <20 anys 20-40 anys 40-60 anys >60 anys


Telefónica 20% 30% 10% 10%
——————— ———- ———— ———— ———
Ono 5% 15% 3% 2%
——————— ———- ———— ———— ———
Altres (Orange,. . . ) 1% 2% 1% 1%

Solució

a) En aquest cas hem de fer un mostreig aleatori simple. Suposem que tenim 150000
clients. En aquest cas usarem la instrucció (per estalviar espai es mostren solament els
5 primers valors)
sample(1:150000,300,replace=TRUE)[0:5]

## [1] 102136 17186 72326 32847 76081


b) En aquest cas hem de realitzar un mostreig per conglomerats on aquests són les zones.
Per exemple, suposem que triem aleatòriament 10 zones entre les 50. Per triar aquestes
10 zones, podem usar novament R de la mateixa forma en què ho hem usat a l’apartat
anterior. Amb la instrucció
test2<-sample(50,10,replace=TRUE)
test2[0:10]

## [1] 47 14 24 34 36 11 48 3 29 14
Després, dins de cada zona triada hem de triar aleatòriament 30 clients.

3
c) En aquest cas hem de realitzar un mostreig per quotes. Calculem quants clients hem
de tenir en la nostra mostra per edat i per ISP:

ISP/Edat <20 anys 20-40 anys 40-60 anys > 60 anys


Telefónica 20%*300=60 30%*300=90 10%*300=30 10%*300=30
—————– —————— ————— ————— ————-
Ono 5%*300=15 15%*300=45 3%*300=9 2%*300=6
—————– —————— ————— ————— ————-
Altres (Orange, . . . ) 1%*300=3 2%*300=6 1%*300=3 1%*300=3

Finalment, hem d’encarregar als nostres entrevistadors que entrevistin a 60 clients de menys
de 20 anys que tinguin Telefónica, a 15 que tinguin Ono i a 3 que tinguin altres ISPs. També
han d’entrevistar a 90 clients entre 20-40 anys que tinguin Telefónica, a 45 que tinguin Ono i
a 6 que tinguin altres ISPs. També han d’entrevistar a 30 clients entre 40-60 anys que tinguin
Telefónica, a 9 que tinguin Ono i a 3 que tinguin altres ISPs. Finalment, han d’entrevistar a
30 clients majors de 60 anys que tinguin Telefónica, 6 clients que tinguin Ono i 3 clients que
tinguin altres ISPs.

Activitat 3. Estudi de l’ús d’internet.


Tècniques de mostreig. Mostreig probabilístic.
Es vol realitzar un estudi sobre l’ús d’internet en un barri de la ciutat de Barcelona. Volem
extreure una mostra de 150 llars. Digueu quin tipus de mostreig faríeu i com ho faríeu en
cadascun dels següents casos:
a) Si tenim un llistat de totes les llars d’aquest barri on s’indica el nivell adquisitiu de
cada llar: baix, mitjà i alt.
b) Si tenim un mapa del barri de la ciutat separada per 15 zones geogràfiques.
c) Si tenim la informació següent del barri:

Tipus de llar < 25 anys Entre 25 i 40 anys Entre 40 i 65 anys > 65 anys
Família amb fills 5 50 40 35
—————– ———— ——————— ——————– ———
Família sense fills 15 26 19 7
—————– ———— ——————— ——————– ———
Estudiants 30 10 0 0
—————– ———— ——————— ——————– ———
Altres 12 15 18 23

4
Solució

a) En aquest cas hem de fer un mostreig aleatori simple. Suposem que tenim 1000 llars.
Simulem en R una mostra de 150 llars. Per a això usem les següents instruccions (que
només mostren els 10 primers resultats, per estalviar espai)
test3<-sample(1:100,150,replace=TRUE)
test3[0:10]

## [1] 83 30 10 96 6 54 65 19 55 67
Aquesta última ens mostra els 14 primeres llars escollides en la mostra.
b) En aquest cas hem de realitzar un mostreig per conglomerats on aquests són les zones.
Per exemple, suposem que triem aleatòriament 5 zones entre les 15. Per triar aquestes
5 zones, podem usar novament R de la mateixa forma en què ho hem usat a l’apartat
anterior, amb el que s’obté:
test4<-sample(1:15,5,replace=TRUE)
test4

## [1] 15 13 9 8 15
Després, dins de cada zona triada hem de triar aleatòriament 30 llars.
c) En aquest cas hem de realitzar un mostreig per quotes. En total tenim 305 llars usant la
taula anterior. Calculem quants clients hem de tenir en la nostra mostra edat mitjana i
per tipus de llar:

> 65
Tipus de llar < 25 anys Entre 25 i 40 anys Entre 40 i 65 anys anys
150 150 150
Família amb fills 5ú 305
¥2 50 ú 305
¥ 25 40 ú 305
¥ 20 35ú 150
305
¥
17
—————– ———— ——————— ——————– ———
Família sense 15 ú 305 ¥ 7 26 ú 150
150
305
¥ 13 19 ú 150
305
¥9 7 ú 150
305
¥
fills 4
—————– ———— ——————— ——————– ———
Estudiants 30ú 150
305
¥ 15 10 ú 150
305
¥5 0 0
—————– ———— ——————— ——————– ———
150
Altres 12 ú 305 ¥6 15 ú 150
305
¥7 18 ú 150
305
¥9 23ú 150
305
¥
11

Finalment, hem d’encarregar als nostres entrevistadors que entrevistin a 2 llars amb edat
mitjana de menys de 25 anys en els quals hi hagi fills, a 7 llars sense fills, a 15 llars on viuen
estudiants i a 6 llars amb altres característiques. També han d’entrevistar a 25 llars amb
edat mitjana entre 20-40 anys en els quals hi hagi fills, a 13 llars sense fills, a 5 llars on viuen
estudiants i a 7 llars amb altres característiques. També han d’entrevistar a 20 llars amb
edat mitjana entre 40-65 anys en què hi hagi fills, a 9 llars sense fills i a 9 llars amb altres

5
característiques. Finalment, han d’entrevistar a 17 llars amb edat mitjana major de 65 anys
amb fills, a 4 llars sense fills i a 11 llars amb altres característiques.

Adreces d’interès

• Mostreig (http://en.wikipedia.org/wiki/sampling_(statistics))
• Mostreig aleatori simple (http://en.wikipedia.org/wiki/simple_random_sample)
• Mostreig estratificat (http://en.wikipedia.org/wiki/stratified_sampling)
• Mostreig sistemàtic (http://en.wikipedia.org/wiki/systematic_sampling)

You might also like