Professional Documents
Culture Documents
Mostreig - Exercicis
Mostreig - Exercicis
Jose Fco. Martínez Boscá, Arnau Mir Torres, Lluís M. Pla Aragonés,
Àngel J. Gil Estallo (autors) i Ángel A. Juan (editor)
© FUOC • 5 Mostreig
Introducció
Posem per cas que hem dissenyat un programa de comptabilitat nou i volem
comprovar-ne el grau d'acceptació entre les empreses de Catalunya. Com
podem fer aquesta comprovació? Una manera simple de respondre aquesta
pregunta és simplement triar aleatòriament un conjunt d'empreses i fer l'en-
questa corresponent.
Hem de fer, per tant, un estudi de com ens caldria triar una mostra represen-
tativa de totes les empreses de Catalunya per a obtenir un resultat fiable de
l'enquesta sobre el programa de comptabilitat.
Les tècniques de mostreig ens diuen com es pot desenvolupar un estudi com
l'anterior perquè la mostra seleccionada resulti com menys esbiaixada millor.
Quan diem esbiaixada, ens referim al fet que la mostra tingui més empreses
d'un determinat tipus que d'un altre. Per exemple, si en la nostra mostra apa-
reix un 60% d'empreses que es dediquen al sector de les comunicacions i un
20% d'empreses que es dediquen al sector de l'assessorament jurídic, la nostra
mostra serà esbiaixada, ja que tindrà el triple d'empreses que es dediquen al
sector de les comunicacions respecte al nombre d’empreses que es dediquen a
l'assessorament jurídic.
A continuació, presentem uns problemes resolts sobre mostrejos que ens po-
den ajudar a resoldre qüestions com les que plantejàvem abans.
© FUOC • 6 Mostreig
Mapa conceptual
Activitats Resoltes - Mostreig
Ángel Gil
Solució
a) En aquest cas hem de fer un mostreig aleatori simple. Suposem que tenim 15000
alumnes. Per simular en R una mostra de 500 alumnes podem usar directament les
instruccions
1
test1<-sample(1:15000,500,replace=TRUE)
amb què obtenim 500 valors (cada vegada que s’executi s’obté una mostra diferent)
dels quals vam mostrar els 10 primers:
test1[0:10]
## [1] 510 8420 12887 12715 5731 7342 8872 12497 11480 5783
b) En aquest cas hem de realitzar un mostreig per conglomerats usant proporcionalment els
alumnes pertanyents a cada comunitat autònoma. Per exemple, imaginem que el 60%
dels alumnes de la UOC són de Catalunya, el 15% del País Valencià, el 15% de Balears
i el 10% restant pertanyent a altres comunitats autònomes. Llavors la nostra mostra
tindrà 0.6 ú 500 = 300 alumnes de Catalunya, 0.15 ú 500 = 75 alumnes del País Valencià,
75 alumnes de Balears i 50 alumnes d’altres comunitats. Després triem aleatòriament
unes comarques de Catalunya, País Valencià, Balears i d’altres comunitats autònomes.
Suposem, per fixar idees, que triem 10 comarques de Catalunya, 10 comarques del
País Valencià, 10 comarques de Balears i 10 comarques d’altres comunitats autònomes.
Seguidament, hem de triar 30 estudiants per a cada comarca de Catalunya, 7 estudiants
de 5 comarques del País Valencià i 8 estudiants de les altres 5 comarques, el mateix
per a les comarques de Balears i 5 estudiants per a les comarques d’altres comunitats
autònomes totes les eleccions de forma aleatòria. D’aquesta forma, haurem format una
mostra de 500 estudiants.
c) En aquest cas hem de realitzar un mostreig per quotes. Calculem quants estudiants
hem de tenir en la nostra mostra per franges d’edat i per servidor:
Seguidament, hem d’encarregar als nostres entrevistadors que entrevistin a 100 alumnes entre
20-40 anys que usin GMAIL, a 100 que usin HOTMAIL, a 100 que usin YAHOO i a 100 que
usin altres servidors de correu. També han d’entrevistar a 25 alumnes entre 40-60 anys que
usin GMAIL, a 25 que usin HOTMAIL, a 15 que usin YAHOO i a 10 que usin altres servidors
de correu. Finalment, han d’entrevistar a 5 alumnes majors de 60 anys que usin GMAIL, a
10 que usin HOTMAIL, a 5 que usin YAHOO i a 5 que usin altres servidors de correu.
2
Activitat 2. Estudi de la velocitat de banda ampla.
Tècniques de mostreig. Mostreig probabilístic
Es vol realitzar un estudi de la velocitat de banda ampla a la ciutat de Palma de Mallorca.
Volem enquestar a 300 clients de banda ampla. Digueu quin tipus de mostreig realitzaríeu en
cadascun dels casos següents i expliqueu com fer-ho:
a) Si disposem d’un llistat de tots els clients de banda ampla de tots els ISP (“Internet
Servide Provider”) d’Internet.
b) Si tenim un mapa de la ciutat separada en 50 zones geogràfiques on tenim una llista
d’usuaris per zona. A cada zona hi ha més o menys el mateix nombre de clients.
c) Si tenim la taula següent on s’indica el percentatge de clients per franges d’edat (< 20
anys, entre 20 i 40 anys, entre 40 i 60 anys i > 60 anys) i per ISP (Telefónica, Ono,
Orange, Jazztel, etc. . . )
Solució
a) En aquest cas hem de fer un mostreig aleatori simple. Suposem que tenim 150000
clients. En aquest cas usarem la instrucció (per estalviar espai es mostren solament els
5 primers valors)
sample(1:150000,300,replace=TRUE)[0:5]
## [1] 47 14 24 34 36 11 48 3 29 14
Després, dins de cada zona triada hem de triar aleatòriament 30 clients.
3
c) En aquest cas hem de realitzar un mostreig per quotes. Calculem quants clients hem
de tenir en la nostra mostra per edat i per ISP:
Finalment, hem d’encarregar als nostres entrevistadors que entrevistin a 60 clients de menys
de 20 anys que tinguin Telefónica, a 15 que tinguin Ono i a 3 que tinguin altres ISPs. També
han d’entrevistar a 90 clients entre 20-40 anys que tinguin Telefónica, a 45 que tinguin Ono i
a 6 que tinguin altres ISPs. També han d’entrevistar a 30 clients entre 40-60 anys que tinguin
Telefónica, a 9 que tinguin Ono i a 3 que tinguin altres ISPs. Finalment, han d’entrevistar a
30 clients majors de 60 anys que tinguin Telefónica, 6 clients que tinguin Ono i 3 clients que
tinguin altres ISPs.
Tipus de llar < 25 anys Entre 25 i 40 anys Entre 40 i 65 anys > 65 anys
Família amb fills 5 50 40 35
—————– ———— ——————— ——————– ———
Família sense fills 15 26 19 7
—————– ———— ——————— ——————– ———
Estudiants 30 10 0 0
—————– ———— ——————— ——————– ———
Altres 12 15 18 23
4
Solució
a) En aquest cas hem de fer un mostreig aleatori simple. Suposem que tenim 1000 llars.
Simulem en R una mostra de 150 llars. Per a això usem les següents instruccions (que
només mostren els 10 primers resultats, per estalviar espai)
test3<-sample(1:100,150,replace=TRUE)
test3[0:10]
## [1] 83 30 10 96 6 54 65 19 55 67
Aquesta última ens mostra els 14 primeres llars escollides en la mostra.
b) En aquest cas hem de realitzar un mostreig per conglomerats on aquests són les zones.
Per exemple, suposem que triem aleatòriament 5 zones entre les 15. Per triar aquestes
5 zones, podem usar novament R de la mateixa forma en què ho hem usat a l’apartat
anterior, amb el que s’obté:
test4<-sample(1:15,5,replace=TRUE)
test4
## [1] 15 13 9 8 15
Després, dins de cada zona triada hem de triar aleatòriament 30 llars.
c) En aquest cas hem de realitzar un mostreig per quotes. En total tenim 305 llars usant la
taula anterior. Calculem quants clients hem de tenir en la nostra mostra edat mitjana i
per tipus de llar:
> 65
Tipus de llar < 25 anys Entre 25 i 40 anys Entre 40 i 65 anys anys
150 150 150
Família amb fills 5ú 305
¥2 50 ú 305
¥ 25 40 ú 305
¥ 20 35ú 150
305
¥
17
—————– ———— ——————— ——————– ———
Família sense 15 ú 305 ¥ 7 26 ú 150
150
305
¥ 13 19 ú 150
305
¥9 7 ú 150
305
¥
fills 4
—————– ———— ——————— ——————– ———
Estudiants 30ú 150
305
¥ 15 10 ú 150
305
¥5 0 0
—————– ———— ——————— ——————– ———
150
Altres 12 ú 305 ¥6 15 ú 150
305
¥7 18 ú 150
305
¥9 23ú 150
305
¥
11
Finalment, hem d’encarregar als nostres entrevistadors que entrevistin a 2 llars amb edat
mitjana de menys de 25 anys en els quals hi hagi fills, a 7 llars sense fills, a 15 llars on viuen
estudiants i a 6 llars amb altres característiques. També han d’entrevistar a 25 llars amb
edat mitjana entre 20-40 anys en els quals hi hagi fills, a 13 llars sense fills, a 5 llars on viuen
estudiants i a 7 llars amb altres característiques. També han d’entrevistar a 20 llars amb
edat mitjana entre 40-65 anys en què hi hagi fills, a 9 llars sense fills i a 9 llars amb altres
5
característiques. Finalment, han d’entrevistar a 17 llars amb edat mitjana major de 65 anys
amb fills, a 4 llars sense fills i a 11 llars amb altres característiques.
Adreces d’interès
• Mostreig (http://en.wikipedia.org/wiki/sampling_(statistics))
• Mostreig aleatori simple (http://en.wikipedia.org/wiki/simple_random_sample)
• Mostreig estratificat (http://en.wikipedia.org/wiki/stratified_sampling)
• Mostreig sistemàtic (http://en.wikipedia.org/wiki/systematic_sampling)