Download as pdf or txt
Download as pdf or txt
You are on page 1of 14

08.

581 Anàlisi Multivariant


Curs 2018-19 / 1r semestre

Solucions orientatives

Prova d’avaluació continuada 3. ANÀLISI MULTIVARIANT(I)

Enunciat

A partir de les dades que hi ha en el fitxer “Dades_CasPractic3.csv”, en què es basa el cas pràctic
de “El triangle de les Bermudas”, es demana que contesteu, de forma raonada, les següents
qüestions. El nivell de significació  que heu de considerar en tots els contrastos és de 0,05.

Pregunta 1:

Del segon exercici de la PAC2, havíem pogut veure que la satisfacció general dels clients de fora del
barri no s’explicava gaire bé a partir de la percepció de qualitat del servei de pàrquing. Hi faltaven
més variables explicatives. En aquesta pregunta volem ajudar el gerent del centre comercial a
comprovar si els resultats obtinguts en el cas pràctic per a tota la mostra (siguin clients del barri o de
fora) també són vàlids quan considerem només els clients de fora del barri.

Com podeu veure en l’apartat 4 del cas pràctic “La satisfacció dels clients amb el centre”, a partir del
nivell de satisfacció en diferents aspectes del centre comercial s’intuïa una mala gestió del centre en
l’àmbit del màrqueting, i s’analitzava si aquest fet tenia implicacions directes amb el grau de
satisfacció general. Això serà cert en el cas dels clients de fora del barri?

Per respondre a aquesta pregunta, es demana el següent:

1.1.Realitzeu una anàlisi de regressió múltiple, considerant com a variable dependent el grau de
satisfacció general SATISF_GEN, i com a variables independents (explicatives) les valoracions dels
següents elements del centre comercial:

Nom Descripció
P34_1 PREUS
P34_2 PROMOCIONS OFERTES
P34_3 VARIETAT DE LES BOTIGUES
P34_4 QUALITAT DE LES BOTIGUES
P34_5 PARKING
P34_6 QUANTITAT QUALITAT REST BAR
P34_7 ACT CULTURAL ENTRETENIMENT
P34_8 INFORMACIO SENYALITZACIO AR
P34_9 AMBIENTACIO DEL CENTRE
P34_10 NETEJA DEL CENTRE
P34_11 SEGURETAT DEL CENTRE
P34_12 LLOCS PER A ENTRETENIR NENS
P34_13 OFERTA D'OCI
P34_14 ATENCIO AL CLIENT
P34_15 ACCESIBILITAT SENYALITZACIO
P34_16 PUBLICITAT DEL CENTRE
P34_17 SERVEIS COMPLEMENTARIS

Comenteu els resultats obtinguts (entre d’altres coses, comenteu la significació individual dels
coeficients, la significació global del model, el nivell d’ajust, i els signes).

1/14
Solucions PAC3. ANÀLISI MUTIVARIANT (I)
Nota: Per fer això, heu de tenir present que s’ha de seleccionar una submostra, amb només aquells
casos en què s’ha usat el pàrquing. És a dir, amb aquells casos en què P14_M23 = 1. Heu d’indicar
l’expressió de selecció (P14_M23R=="1") en la mateixa finestra del model de regressió lineal.

Call:
lm(formula = SATISF_GEN ~ P34_1 + P34_2 + P34_3 + P34_4 + P34_5 +
P34_6 + P34_7 + P34_8 + P34_9 + P34_10 + P34_11 + P34_12 +
P34_13 + P34_14 + P34_15 + P34_16 + P34_17, data = Datos_CasoPractico1, subset =
P14_M23R == "1")

Residuals:
Min 1Q Median 3Q Max
-1.33303 -0.46059 -0.02527 0.39697 2.45550

Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 1.899904 0.379740 5.003 1.55e-06 ***
P34_1 -0.049013 0.037542 -1.306 0.19369
P34_2 0.126123 0.038267 3.296 0.00122 **
P34_3 0.085608 0.047819 1.790 0.07542 .
P34_4 0.110421 0.058721 1.880 0.06197 .
P34_5 0.038600 0.035936 1.074 0.28447
P34_6 0.023485 0.048750 0.482 0.63069
P34_7 0.043140 0.036108 1.195 0.23406
P34_8 -0.005110 0.053394 -0.096 0.92389
P34_9 0.044158 0.059298 0.745 0.45762
P34_10 0.005889 0.047925 0.123 0.90237
P34_11 0.078474 0.036976 2.122 0.03544 *
P34_12 -0.015950 0.036073 -0.442 0.65902
P34_13 0.144086 0.045581 3.161 0.00190 **
P34_14 -0.004829 0.042064 -0.115 0.90876
P34_15 0.010725 0.039433 0.272 0.78602
P34_16 0.052752 0.036791 1.434 0.15368
P34_17 0.111933 0.040778 2.745 0.00679 **
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 0.6744 on 151 degrees of freedom


(150 observations deleted due to missingness)
Multiple R-squared: 0.6966, Adjusted R-squared: 0.6625
F-statistic: 20.4 on 17 and 151 DF, p-value: < 2.2e-16

A partir dels resultats obtinguts, podem veure que hi ha molt pocs coeficients que siguin
significativament diferents de zero, és a dir, que tinguin un valor P més petit que 0,05. En concret són
la constant i quatre variables més:
P34_2 PROMOCIONS OFERTES
P34_11 SEGURETAT DEL CENTRE
P34_13 OFERTA D'OCI
P34_17 SERVEIS COMPLEMENTARIS
Per tant, pels clients de fora del barri, aquestes quatre variables són les que expliquen el grau de
satisfacció general. A més l’expliquen, com era d’esperar, amb signe positiu: a millor valoració de les
promocions, de la seguretat, de l’oferta d’oci, i dels serveis complementaris, millor valoració general.
Sorprén, d’aquests resultats, que la variable que sempre haviem considerat especialment interessant
per explicar el grau de satisfacció general dels clients de fora del barri (P34_5 PARKING) ara no sigui
significativa.

La significació global del model és correcta: l’estadístic F val 20.4, i té un valor P més petit que 0,05
(0,000). El nivell d’ajust també és molt acceptable, ja que l’R2 val 69,7%. Això ens indica que gairebé el
70% de la variabilitat de la satisfacció general ve explicat per les variables incloses en el model.

2/14
Solucions PAC3. ANÀLISI MUTIVARIANT (I)
D’aquesta anàlisi, podem veure que el que hem fet és incloure moltes variables que finalment són
irrellevants per explicar la variable dependent. Ara el següent pas seria tornar a repetir l’anàlisi anterior
però només amb (la constant i) les quatre variables anteriors.

1.2 Per tal de completar la valoració de l’estimació obtinguda del model, volem analitzar els residus i si
hi ha o no problemes de multicol·linealitat:

Anàlisi dels residus:


El fet que els residus no siguin esfèrics (és a dir, homoscedàstics i sense autocorrelació), implicarà
que les estimacions que hem obtingut no siguin eficients (és a dir, de variància mínima). Hi ha
indicis de problemes d’heteroscedasticitat en l’estimació?

Nota: Per analitzar-ho, un cop feta l’estimació del model (Estadístics > Ajustament de models > Regressió
lineal…), heu d’anar a Models > Gràfics > Gràfics bàsics de diagnòstic i després Models > Gràfics >
Gràfics components + residus per obtenir gràfics dels residus versus la variable ajustada i gràfics dels
residus versus les variables explicatives del model. Tal i com s’indica en els materials didàctics, si els
residus es distribueixin aleatòriament al voltant de “0” ens estarà dient que hi ha indicis d’homoscedasticitat,
en canvi, si hi ha algun tipus d’estructura organitzada, tindrem indicis del contrari, de que hi ha
heteroscedasticitat.

3/14
Solucions PAC3. ANÀLISI MUTIVARIANT (I)

4/14
Solucions PAC3. ANÀLISI MUTIVARIANT (I)
En aquests gràfics es pot veure que no hi ha indicis d’heteroscedasticitat, especialment si considerem
només els gràfics corresponents a les variables explicatives que són significatives. La major part de residus
es troben al voltant dels valors 3 a 9 de les variables independents (ja que aquests són els valors més
freqüents en les respostes dels clients), i no s’observa cap comportament sistemàtic. Sembla que els
residus es distribueixen aleatòriament al voltant del zero. Si haguèssim vist, per exemple, que per a valors
més grans d’una variable independent hi ha més (o menys) dispersió en els residus, aleshores haguèssim
tingut l’indici d’heteroscedasticitat provocada, a més, per aquella variable en concret.

Multicol·linealitat:
Si hi ha una forta correlació entre variables independents, podem tenir un problema de sobre-
informació en el model, amb informació redundant. Hi ha problemes de multicol·linealitat en el
model estimat?

Nota: Un cop feta l’estimació del model (Estadístics > Ajustament de models > Regressió lineal…), heu
d’anar a Models > Diagnostics numèrics > Inflació de variància dels factors… . D’aquesta manera, per
cada variable independent obtindreu un valor VIF. Si aquest valor és més gran que 5 es considera que
poden haver problemes de multicol·linealitat originats per aquella variable. Si és més gran que 10, els
problemes poden ser molt més importants.

P34_1 P34_2 P34_3 P34_4 P34_5 P34_6 P34_7 P34_8


1.683096 1.834948 2.543877 2.489822 1.590976 2.253981 2.282655 2.998574

P34_9 P34_10 P34_11 P34_12 P34_13 P34_14 P34_15 P34_16


3.585560 2.058570 2.136604 1.997401 1.978728 1.978754 1.777486 2.058373

P34_17
2.200177

Podem observar que tots el FIV són clarament més petits que 5. Això ens està dient, a més, que hi ha una
baixa correlació múltiple entre el conjunt de les variables explicatives o independents.

1.3 Finalment, per a acabar d’ajudar al gerent del centre comercial a interpretar els resultats, es demana
que respongueu raonadament les següents preguntes:
 Quan afegim totes aquestes variables, quin és el paper que juga ara la valoració sobre la
percepció de qualitat del pàrquing?

Com ja hem dit abans (en la solució de l’apartat 1.1), la variable que sempre haviem considerat
especialment interessant per explicar el grau de satisfacció general dels clients de fora del barri (P34_5
PARKING) ara no és rellevant; podem considerar que el coeficient que multiplica aquesta variable és 0
(el valor P és 0,284, més gran que 0,05). Això ens està dient que realment hi ha d’altres variables que
expliquen millor el grau de satisfacció general per als clients de fora del barri.

 Els resultats obtinguts, són semblants o diferents als obtinguts en el cas pràctic, per a tota la
mostra? Justifiqueu la resposta.

A l’anàlisi de regressió del cas pràctic (veure la Figura 15 a l’apartat 4, “La satisfacció dels clients amb
el centre”), en què es considera tot el conjunt de clients, es pot comprovar que les variables que tenen
coeficients significativament diferents de zero són:

P34_4 QUALITAT DE LES BOTIGUES


P34_7 ACT CULTURAL ENTRETENIMENT
P34_8 INFORMACIO SENYALITZACIO AR
P34_11 SEGURETAT DEL CENTRE
P34_17 SERVEIS COMPLEMENTARIS

Hi ha dues variables que coincideixen: les dos últimes. La valoració sobre la seguretat del centre, així
com la dels serveis complementaris són rellevants a l’hora d’explicar el grau de satisfacció general dels
clients, tant si el client és de fora del barri com no. Per contra, hi ha tres aspectes que ara sí que són

5/14
Solucions PAC3. ANÀLISI MUTIVARIANT (I)
rellevants (quan considerem tots els clients), com són la qualitat de les botigues, les activitats culturals
i d’entreteniment, i la informació i la senyalització.

Addicionalment, podem veure que el model del cas pràctic també és significatiu en el seu conjunt, però
l’R2 que s’obté (64,50%) és lleugerament inferior al de l’apartat 1.1.

Pregunta 2:

A partir del resultat obtingut en l’exercici anterior, el gerent del centre comercial, tenia una mica més
clar quins apectes concrets del centre s’havien de “cuidar” més per tal de millorar el nivell de satisfació
general dels clients de fora del barri. Però tenia molts més resultats de valoracions que, tot i no ser
significatius a l’hora explicar aquesta satisfacció general, podien ser molt importants a l’hora de mirar
de solucionar els indicis d’una mala gestió del centre en l’àmbit del màrqueting.

La interpretació, però, del conjunt de totes les variables (17 en total) per als clients de fora del barri
se li feia una mica complicat. Per aquesta raó volia mirar d’agrupar tota la informació en uns quants
(pocs) components, que li facilitessin una mica la feina. Amb aquest objectiu, es demana:

2.1 Creeu un nou conjunt de dades de nom DadesPreg2 que contingui només les 17 variables de les
valoracions parcials (P34_1 a P34_17) i recollint les observacions dels que usen el pàrquing
(P14_M23R==”1”) i que no tenen valor perdut o missing (NA) en cap de les variables.

Nota: Per fer això heu de fer dues etapes: a) Crear un conjut de dades amb les observacions que
P14_M23R==”1” fent Dades > Taula de dades activa > Filtrar la Taula de dades i b) A partir d’aquest
conjunt de dades, crear un nou conjunt de dades només amb les variables P34_1 a P34_17 i les
observacions que no continguin missings o valors omitits fent Dades > Taula de dades activa > Eliminar
casos amb valors omesos

2.2 Realitzeu una anàlisi factorial de components principals amb totes aquestes 17 variables, sense
rotació varimax. Intenteu interpretar els components que tinguin associat un valor propi (en anglès,
eigenvalue) més gran que 1, a partir de les variables que hi tenen un pes més gran. Podeu fer de
forma clara una interpretació d’aquests components? Perquè? Quin percentatge d’informació
expliquen aquests primers components?

Nota: Heu de treballar amb la submostra corresponent als de fora del barri a partir dels que han
utilitzat el parquing (P14_M23R==”1”).
Recordeu que per poder fer l’Anàlisi de Components Principals primer heu d’instal·lar el paquet
FactoMineR, executant dins de R les comandes:
install.packages("FactoMineR") ≫ Ens demanarà un CRAN Mirror ≪
library(FactoMineR)
install.packages("RcmdrPlugin.FactoMineR")
library(Rcmdr)

Un cop ens trobem a RCommander hem d’anar al menú i triar Eines ≫ Carregar plugin(s) de Rcmdr… ,
seleccionem RcmdrPlugin.FactoMineR i acceptem reiniciar. Finalment haurem de trobar el menú

6/14
Solucions PAC3. ANÀLISI MUTIVARIANT (I)
FactoMineR a la barra de manús del R-Commander. Seleccionem Principal Component Analysis (PCA
i a Outputs marquelm Eigenvalues i Description of the dimensions

res<-PCA(DadesPreg2.PCA , scale.unit=TRUE, ncp=5, graph = FALSE)

> plot.PCA(res, axes=c(1, 2), choix="ind", habillage="none", col.ind="black",


col.ind.sup="blue", col.quali="magenta", label=c("ind", "ind.sup", "quali"),new.plot=TRUE)

> plot.PCA(res, axes=c(1, 2), choix="var", new.plot=TRUE, col.var="black",


col.quanti.sup="blue", label=c("var", "quanti.sup"), lim.cos2.var=0)

> res$eig
eigenvalue percentage of variance cumulative percentage of variance
comp 1 7.0709048 41.593558 41.59356
comp 2 1.5059547 8.858557 50.45212
comp 3 1.1072710 6.513359 56.96547
comp 4 1.0719952 6.305854 63.27133
comp 5 0.9092803 5.348708 68.62004
comp 6 0.8256618 4.856834 73.47687
comp 7 0.7221242 4.247789 77.72466
comp 8 0.6101177 3.588927 81.31359
comp 9 0.6070814 3.571067 84.88465
comp 10 0.4936880 2.904047 87.78870
comp 11 0.4293989 2.525876 90.31458
comp 12 0.3760573 2.212102 92.52668
comp 13 0.3112979 1.831164 94.35784
comp 14 0.3033499 1.784411 96.14225
comp 15 0.2795212 1.644243 97.78650
comp 16 0.2059698 1.211587 98.99808
comp 17 0.1703257 1.001916 100.00000

> dimdesc(res, axes=1:5)


$Dim.1
$Dim.1$quanti
correlation p.value
P34_9 0.8064434 0.000000e+00
P34_8 0.7706073 0.000000e+00
P34_6 0.7234689 0.000000e+00
P34_3 0.7111411 0.000000e+00
P34_4 0.7086655 0.000000e+00
P34_17 0.7063302 0.000000e+00
P34_14 0.6850101 0.000000e+00
P34_11 0.6529630 0.000000e+00
P34_12 0.6407210 0.000000e+00
P34_13 0.6388678 0.000000e+00
P34_7 0.6342096 0.000000e+00
P34_10 0.6139279 0.000000e+00
P34_16 0.5629081 1.554312e-15
P34_2 0.5394288 3.819167e-14
P34_15 0.5186319 5.087042e-13
P34_5 0.4913241 1.180145e-11
P34_1 0.4299405 5.422833e-09

$Dim.2
$Dim.2$quanti
correlation p.value
P34_1 0.5039498 2.855494e-12
P34_16 0.4678547 1.421163e-10
P34_7 0.3584229 1.711059e-06
P34_2 0.2958294 9.422178e-05
P34_12 0.2189327 4.239363e-03
P34_3 0.1973301 1.012330e-02
P34_13 0.1844319 1.637494e-02
P34_8 -0.1760779 2.202452e-02
P34_6 -0.1830952 1.718380e-02
P34_11 -0.3828021 2.798929e-07

7/14
Solucions PAC3. ANÀLISI MUTIVARIANT (I)
P34_5 -0.4551509 5.062055e-10
P34_10 -0.4966379 6.540868e-12

$Dim.3
$Dim.3$quanti
correlation p.value
P34_1 0.5192133 4.742873e-13
P34_2 0.4605916 2.956813e-10
P34_4 0.1892062 1.375031e-02
P34_14 0.1566905 4.190702e-02
P34_5 -0.1770779 2.126986e-02
P34_17 -0.2740962 3.108133e-04
P34_16 -0.3507032 2.944670e-06
P34_12 -0.3593125 1.605809e-06
P34_7 -0.3756932 4.818888e-07

$Dim.4
$Dim.4$quanti
correlation p.value
P34_15 0.7228854 0.000000e+00
P34_14 0.2536417 8.764334e-04
P34_1 0.2141874 5.169170e-03
P34_13 0.1698909 2.722560e-02
P34_8 0.1618397 3.553751e-02
P34_4 -0.1920554 1.236607e-02
P34_12 -0.2260760 3.121239e-03
P34_5 -0.2262127 3.102719e-03
P34_3 -0.2834122 1.885620e-04
P34_2 -0.3546061 2.241875e-06

Els resultats de l’anàlisi de components principals mostren que hi ha quatre components amb un valor propi
més gran que 1 (els quatre primers), amb els quals ja s’explica un 63,3% de tota la informació de les 17 variables
inicials. A partir d’aquests, si n’anem afegint més components, la millora en el percentatge és molt petita (així
per exemple, el cinquè component només afegeix un ínfim 5,3%).

Ara, si ens centrem en la interpretació dels primers quatre components, a partir del pes de cadascuna de les
17 variables en cadascun dels quatre components, veurem que ho tenim força complicat. Així per exemple, en
el primer component, no hi ha unes poques variables que tinguin un pes més important (correlacions superiors
a 0.5) a partir de les quals puguem interpretar quina informació recull aquest primer component. Gairebé totes
les variables tenen una correlació superior a 0.5 i, per tant, no podem fer una interpretació clara d’aquest primer
component.

Pràcticament el mateix passa en els altres tres components. En el segon i el tercer no hi han variables amb
correlacions clarament superiors a 0.5. En el quart component, però, veiem que sí que hi ha una variable,
P34_15, que té un pes clarament més gran que 0,5, i que ens podria ajudar a la seva interpretació. De totes
maneres, el gruix de resultats aconsella que es realitzi una rotació Varimax per tal de millorar-ne la interpretació.
Això és, precisament, el que es demana en el següent apartat.

2.3 Repetiu l’analisi anterior, però ara amb rotació Varimax, per mirar de millorar la interpretació dels
factors, seleccionant-ne el màxim nombre possible (11). Ara, raoneu les respostes a les següents
qüestions:

 Creieu que el fet que només una variable (o dues) tinguin un pes realment significatiu en els
factors té relació amb els resultats sobre la maulticol·lienalitat de l’apartat 1.2 de la pregunta
anterior?
 A partir dels resultats, creieu que reduim significativament la informació en uns pocs factors,
tal i com pretenia fer el gerent del centre comercial?
 Els resultats són semblants als obtinguts en el cas pràctic per tota la mostra?.

8/14
Solucions PAC3. ANÀLISI MUTIVARIANT (I)
Nota: Heu d’anar a Estadísticos > Análisis dimensional > Análisis Factorial. Marqueu la rotació
Varimax, l'opció Método de regresión, i trieu onze components. Seguiu la Fitxa “Aplicació de la rotació
Varimax a l’Anàlisi Factorial”.

Call:
factanal(x = ~P34_1 + P34_2 + P34_3 + P34_4 + P34_5 + P34_6 + P34_7 + P34_8 + P34_9 + P34_10 + P34_11
+ P34_12 + P34_13 + P34_14 + P34_15 + P34_16 + P34_17, factors = 11, data = DadesPreg2, scores =
"none", rotation = "varimax")

Uniquenesses:
P34_1 P34_2 P34_3 P34_4 P34_5 P34_6 P34_7 P34_8 P34_9 P34_10 P34_11 P34_12 P34_13 P34_14 P34_15
P34_16 P34_17
0.452 0.005 0.005 0.005 0.126 0.192 0.398 0.321 0.005 0.410 0.253 0.288 0.409 0.420 0.005
0.005 0.382

Loadings:
Factor1 Factor2 Factor3 Factor4 Factor5 Factor6 Factor7 Factor8 Factor9 Factor10 Factor11
P34_1 0.125 0.111 0.144 0.262 0.630
P34_2 0.139 0.173 0.128 0.902 0.121 0.115 0.268
P34_3 0.170 0.226 0.211 0.138 0.201 0.156 0.281 0.819 0.171
P34_4 0.253 0.120 0.171 0.103 0.176 0.150 0.151 0.160 0.835 0.261
P34_5 0.218 0.147 0.117 0.120 0.866 0.113
P34_6 0.318 0.129 0.131 0.199 0.732 0.167 0.120 0.163 0.139
P34_7 0.141 0.453 0.491 0.274 0.162 0.128
P34_8 0.309 0.248 0.114 0.209 0.471 0.388 0.157 0.119 0.174 0.152
P34_9 0.363 0.174 0.127 0.170 0.784 0.197 0.131 0.169 0.180 0.105 0.211
P34_10 0.624 0.176 0.215 0.184 0.253 0.113 0.103
P34_11 0.761 0.126 0.136 0.169 0.120 0.206 0.140
P34_12 0.200 0.745 0.224 0.144 0.107
P34_13 0.458 0.274 0.104 0.254 0.117 0.217 0.386
P34_14 0.525 0.179 0.158 0.230 0.231 0.214 0.295
P34_15 0.176 0.131 0.939 0.136 0.105 0.141
P34_16 0.199 0.931 0.149 0.116 0.136 0.134
P34_17 0.240 0.487 0.128 0.212 0.128 0.427 0.169 0.157

Factor1 Factor2 Factor3 Factor4 Factor5 Factor6 Factor7 Factor8 Factor9 Factor10 Factor11
SS loadings 1.895 1.568 1.374 1.202 1.172 1.161 1.069 1.049 0.993 0.948 0.890
Proportion Var 0.111 0.092 0.081 0.071 0.069 0.068 0.063 0.062 0.058 0.056 0.052
Cumulative Var 0.111 0.204 0.284 0.355 0.424 0.492 0.555 0.617 0.675 0.731 0.784

Test of the hypothesis that 11 factors are sufficient.


The chi square statistic is 5.58 on 4 degrees of freedom.
The p-value is 0.233

En fer la rotació Varimax, veiem que el que ens passa és que cada factor només té el pes significatiu (marcat
en groc) d’una única variable (o com a molt dues). Per tant, la interpretació de cada component és la mateixa
que la de cada variable que hi està associada, i a més el percentatge de cada component és ara molt baix
(gairebé tots estan entre 0,05 i 0,1). Això vol dir que hem de considerar més de 6 components per tenir un valor
superior d’informació explicada del 50%.
En conseqüència, no reduim significativament la informació de les variables inicials (17) ja que hem de
considerar molts components per no perdre molta informació. A més l’aportació de cada component és
pràcticament la mateixa que fan les variables individualment. Per tant no té gaire sentit aplicar aquesta tècnica
per “reduir el nombre de variables”.

Aquests resultat està en relació amb el que hem obtingut a l’apartat 1.2, relatiu a la multicol·linealitat. Allí ja
havíem vist que hi havia indicis d’una molt baixa correlació múltiple entre variables, i que per tant la informació
de cadascuna d’elles no tenia res a veure amb les altres. Per tant, no hauria de tenir sentit fer una agrupació
de variables (en components) com la que hem intentat en aquest apartat.
El resultat obtingut en aquest apartat no coincideix completament amb el del cas pràctic, tot i que s’hi acosta.
A la Figura 17 a l’apartat 4, “La satisfacció dels clients amb el centre”, es pot veure que el primer component de
la rotació Varimax s’explica per dues variables (P34_3 i P34_4), el segon només per una (P34_12), el tercer
també per dues (P34_1 i P34_2), etc. Cada component s’explica, com a molt, a partir de dues variables. I n’hi
ha que només a partir d’una. Per tant, no és redueix molt la dimensionalitat, tot i que una mica més que en el
cas de considerar només els clients de fora del barri.

9/14
Solucions PAC3. ANÀLISI MUTIVARIANT (I)
2.4 Sense fer els càlculs corresponents, quina creieu que seria la correlació entre els diferents factors
obtinguts de l’anàlis anterior? Per què?
La correlació entre els components d’una anàlisi factorial és zero, donat que per definició els components que
s’obtenen són ortogonals (independents els uns dels altres). La informació d’uns no té res a veure amb la dels
altres. Això és degut a que els components d’obtenen precisament de la diagonalització de la matriu de
correlacions.

Pregunta 3:

Amb l’objectiu d’aprofundir en la interpretació de les valoracions que els clients de fora del barri feien
del seu centre comercial (Barcelona Glòries), el gerent volia saber com el situaven respecte els altres
dos centres que configuraven l’anomenat Triangle de las Bermudas: Diagonal Mar i la Maquinista.
Això li permetria saber quina era la imatge i el posicionament del seu centre comercial respecte la
competència.

Aquest posicionament el volia realitzar a partir de la valoració de 15 característiques (C1 – C15)


associades als centres comercials. Per aquesta raó, va prendre com a base el qüestionari (i les dades
recollides) del cas pràctic (veure l’apartat 5, “Imatge i posicionament del centre comercial”):

Seleccionant només la submostra dels clients que usen el pàrquing (que són de fora del barri),
s’obtenen els següent resultats agregats:

Diagonal
Glòries Maquinista
Mar
C1 55 98 18
C2 46 109 15
C3 38 107 17
C4 56 95 21
C5 56 117 17
C6 42 99 19
C7 60 101 16
C8 63 112 20
C9 57 105 25

10/14
Solucions PAC3. ANÀLISI MUTIVARIANT (I)
C10 42 90 17
C11 40 93 24
C12 30 131 20
C13 49 96 23
C14 40 119 18
C15 55 102 23

3.1 A partir de les variables de la Base de Dades corresponents a les dades recollides pel qüestionari
(Ei1, Ei4, Ei7, Ei10, Ei13, Ei16, Ei19, Ei22, Ei25, Ei28, Ei31, Ei34, Ei37, Ei40, Ei43), en què consten
les respostes dels clients, associant preferentment un centre comercial a cada característica, com
s’ha calculat la taula agregada anterior? Com s’interpreta cadascun dels valors de les cel·les?
Poseu algun exemple, i raoneu la resposta.
Per a calcular la taula agregada anterior, el que s’ha fet és simplement calcular el nombre de vegades que
sortia l’1, el 2 i el 5 en cadascuna de les variables “Ei”. La interpretació de cada cel·la és directa: és el nombre
de vegades que algun client de fora del barri (dels enquestats) ha associat de forma preferent un determinat
centre comercial a una característica. Així per exemple, 119 clients han dit que el centre comercial de La
Maquinista és qui té els millors cinemes, 40 han dit que Glòries, i 18 que Diagonal Mar.

3.2.Com heu pogut comprovar a l’apartat anterior, hi ha un total de 45 cel·les a interpretar, 15 per
cadascun dels 3 centres comercials que configuren el Triangle de les Bermudas. Això era massa
informació per al gerent, i la seva interpretació era difícil. Per aquesta raó, es demana que per ajudar
al gerent en aquesta anàlisi, realitzeu una anàlisi de correspondències a partir de les dades de la
Taula anterior (que trobareu a l’arxiu Imatge.xls) :
 Trobeu els 2 eixos factorials, i interpreteu-los.
 Feu la representació gràfica dels resultats i interpreteu-los, veient com s’agrupen les
característiques i els centres comercials.
Nota: Per resoldre l’apartat heu de seguir els pasos de la Fitxa corresponent a l’”Anàlisi de correspondències
simple”.

> res$eig
eigenvalue percentage of variance cumulative percentage of variance
dim 1 1.075755e-02 7.689355e+01 76.89355
dim 2 3.232634e-03 2.310645e+01 100.00000
dim 3 6.319005e-33 4.516742e-29 100.00000
> res$col
$coord
Dim 1 Dim 2
Glòries 0.15876881 -0.02653433
Maquinista -0.07738209 -0.01730803
Diagonal.Mar 0.02067217 0.15899783

$contrib
Dim 1 Dim 2
Glòries 65.8021236 6.116212
Maquinista 33.7495218 5.618737
Diagonal.Mar 0.4483546 88.265051

$cos2
Dim 1 Dim 2
Glòries 0.97282798 0.02717202
Maquinista 0.95235543 0.04764457
Diagonal.Mar 0.01662301 0.98337699

$inertia
Glòries Maquinista Diagonal.Mar
0.007276410 0.003812255 0.002901518

> res$row
$coord
Dim 1 Dim 2
Ubicació i accessos 0.085754910 -0.030199688
Informació i senyalització -0.046573975 -0.074717512
Restaurants i cafeteries -0.112795811 -0.017077995
Pàrquing 0.110645446 0.021348123
Varietat de productes 0.009579352 -0.074796077
Tracte dependents -0.036141394 0.021218205

11/14
Solucions PAC3. ANÀLISI MUTIVARIANT (I)
Qualitat de productes 0.111192445 -0.079117691
Ambient 0.086480763 -0.038802795
Preus 0.074322191 0.060678950
Seguretat 0.003580214 0.003635524
Exclusivitat -0.021472223 0.128262665
Serveis complementaris -0.264237376 0.011327870
Neteja 0.047429788 0.072781402
Cinemes -0.135395526 -0.025743153
Modern i innovador 0.070424062 0.042225683

$contrib
Dim 1 Dim 2
Ubicació i accessos 4.50293916 1.85840242
Informació i senyalització 1.32043646 11.30921531
Restaurants i cafeteries 7.38045153 0.56302482
Pàrquing 7.54010706 0.93408538
Varietat de productes 0.06243209 12.66630628
Tracte dependents 0.74836205 0.85837295
Qualitat de productes 7.83620535 13.20259263
Ambient 5.22222542 3.49864098
Preus 3.69879786 8.20458209
Seguretat 0.00683890 0.02346708
Exclusivitat 0.25920040 30.77789515
Serveis complementaris 45.25317439 0.27676669
Neteja 1.35329860 10.60446744
Cinemes 11.61886938 1.39776925
Modern i innovador 3.19666135 3.82441152

$cos2
Dim 1 Dim 2
Ubicació i accessos 0.88966497 0.11033503
Informació i senyalització 0.27982191 0.72017809
Restaurants i cafeteries 0.97758986 0.02241014
Pàrquing 0.96410957 0.03589043
Varietat de productes 0.01613797 0.98386203
Tracte dependents 0.74367513 0.25632487
Qualitat de productes 0.66388417 0.33611583
Ambient 0.83241765 0.16758235
Preus 0.60003849 0.39996151
Seguretat 0.49233529 0.50766471
Exclusivitat 0.02726149 0.97273851
Serveis complementaris 0.99816553 0.00183447
Neteja 0.29808786 0.70191214
Cinemes 0.96511072 0.03488928
Modern i innovador 0.73555903 0.26444097

$inertia
Ubicació i accessos Informació i senyalització Restaurants i cafeteries
5.444812e-04 5.076322e-04 8.121562e-04
Pàrquing Varietat de productes Tracte dependents Qualitat de productes
8.413263e-04 4.161715e-04 1.082535e-04 1.269775e-03
Ambient Preus Seguretat Exclusivitat
6.748817e-04 6.631241e-04 1.494303e-06 1.022820e-03
Serveis complementaris Neteja Cinemes Modern i innovador
4.877079e-03 4.883854e-04 1.295090e-03 4.675116e-04

12/14
Solucions PAC3. ANÀLISI MUTIVARIANT (I)

Els dos eixos factorials (o components) s’han d’interpretar a partir de la contribució de les diferents
característiques en cadascun d’ells, i després mirarem com es situen (respecte aquests eixos) els tres centres
comercials. El primer component s’explica principalment per tenir una relació negativa (coordenada negativa)
amb les característiques “Millors serveis complementaris”, “Millors cinemes” i “Millors restaurants”, i per tenir
una relació positiva amb “Millor pàrquing” i “Millor qualitat de productes”. Podem interpretar aquest eix a partir
dels seus extrems: l’objectiu d’anar als centres comercials és bàsicament anar a comprar (si soc de fora del
barri, utilitzo el pàrquing i busco directament els millors productes) o bé gaudir de tota l’oferta de serveis del
centre (cinemes, restaurants, etc.).

Respecte l’eix vertical (corresponent al segon component), té una relació positiva amb “Millors preus”, “Més
exclusiu”, i “Més net”, i una relació nagativa amb “Millor informació”, “Més varietat de productes”, i “Millor qualitat
de productes”. Per tant, podríem fer una primera interpretació considerant que representa la relació Preu –
Qualitat.

La resta de característiques estan massa a prop de l’origen (és a dir, que tenen una contribució molt baixa en
els eixos) per considerar-les en la interpretació.

On es situen els tres centres comercials respecte aquests eixos, i en relació al que representen? Doncs, tant
“La Maquinista” com “Barcelona Glòries” no s’associen especialment per la seva qualitat de productes o pel seu
preu (les seves coordenades, i la seva contribució, respecte l’eix vertical són molt properes a zero: -0,017 i -
0,027, respectivament). En canvi sí que s’associen a l’eix horitzontal (primer component). “La Maquinista”
s’associa amb la gent que vol gaudir de l’oferta de serveis del centre, i en especial a les característiques “Millors
cinemes” i “Millors restaurants” (són les que té més a prop en el gràfic anterior). En el cas de “Barcelona Glòries”,
és ben valorat per aquelles persones que tenen l’objectiu principal d’anar a comprar (productes). En particular,
les característiques que li queden més a prop serien la C4, la C8, la C1 i la C7. Té tot el sentit que aparegui la
característica C1 (“Millor ubicat”) ja que de fet s’havia entrevistat a clients que anaven a aquest centre comercial.
En canvi, el centre comercial “Diagonal Mar”, associat clarament a la part positiva de l’eix vertical, es elegit
principalment per aquells clients que valoren “Millors preus”, “Més exclusiu”, i “Més net”. Aquestes són les tres
característiques que té més a prop

3.3.Els resultats obtinguts són semblants o no als del cas pràctic, on es considerava tota la mostra
(fossin clients del barri o no), i a més a més l’opinió sobre d’altres centres comercials, com el Corte
Inglés i Baricentro? Raoneu i justifiqueu la resposta.

13/14
Solucions PAC3. ANÀLISI MUTIVARIANT (I)

Com podem llegir en el cas pràctic, a l’apartat 5, “Imatge i posicionament del centre comercial”, “La Maquinista”
y “Diagonal Mar” s’associen a una major varietat de botigues i productes, amb els millors serveis
complementaris, els millors restaurants i la millor informació. Hi ha una mica de coincidència en el cas del centre
comercial de “La Maquinista”, però no tant pel que fa a “Diagonal Mar”. Respecte a “Barcelona Glòries”, és
considerat com el centre millor ubicat, més net, amb millor ambient, amb el millor tracte per part dels
treballadors, i fins i tot amb el millor aparcament. En aquest cas, podem veure que la coincidència amb els
resultats és força elevada.

14/14

You might also like