Download as pdf
Download as pdf
You are on page 1of 25
Unidad 1: Inferencia en dos poblaciones Y El disefio de experiments: Este crea las condiciones para el contraste de la hipétesis y brinda la metodologia estadistica correspondiente para el analisis de datos. Hay dos aspectos en cualquier problema experimental: 1. El disefio del experimento. 2. Elanilisis estadistico de los datos. El propésito del disefio experimental es proporcionar la maxima cantidad de informacion perteneciente al problema bajo investigacién. Para poder realizar un buen disefio experimental es necesario plantearse: 1. Cuales son las caracteristicas q se van a analizar. 2. Quvariables afectan a estas caracteristicas. 3. Cuantas veces deberd repetirse el experimento. 4, A partir de q valor se considera q existe un efecto. Esta serie de planteos nos llevan a elegir las variables mas apropiadas y sus niveles de medicién, elegir la o las respuestas a evaluar y el modelo de disefio. v Términos fundamentales: + Experimento: Ensayo u observacién realizada para confirmar 0 descartar una hipétesis, bajo condiciones establecidas por el experimentador. * Variable respuesta: Variable cuya variabilidad se desea estudiar. parte mas pequefia de material experimental, en la q se aplica el tratamiento una sola vez. También puede ser cada una de las repeticiones del experimento. ‘Tamafio del experimento: Numero total de observaciones. Factor: Variable q se sospecha q puede ejercer influencia sabre la variable respuesta. ‘* Factor controlado: variable manipulada por el investigador o independiente, a fin de estudiar su influencia sobre la variable de interés 0 dependiente. ‘+ Niveles del factor: Cada una de las categorias q adopta la variable independiente. (cada uno de los tratamientos) + Tipos de factor: 1. Cuantitativos(los niveles son cantidades numéricas) 2. Cualitativos(Los niveles son procedimientos 0 cualidades) ‘Tratamiento: Cada uno de los niveles del factor son un tratamiento. © Observaciones: Valor q asume una variable en una determinada realizacién del experimento. © Efecto: Diferencia entre los valores medios de la variable respuesta en presencia 0 ausencia de un nivel del factor. + Disetio equilibrado o balanceado: disefio en el q todos los tratamientos son asignados a un numero igual de unidades experimentales. Y Pri basicos del disefio experimental + Repeticién: Las razones por las cuales es deseable realizar repeticiones del experimento son: 1.Proporcionar una estimacién del error experimental. El error experimental puede reflejar, errores de experimentacién, de observacién, de medicién y variacién del material experimental. El error experimental puede reducirse usando material experimental homogéneo, Utilizando info. proporcionada por otras variables aleatorias, dirigiendo el experimento con cuidado y utilizando ef disefio experimental mas eficiente. 2.Obtener mayor precisién en la estimacién. 3.Permitirnos extender el alcancé de la influencia relativa al experimento. Todo procedimiento de prueba se basa en supuestos q deben cumplirse para q la prueba resulte valida. Uno de los supuestos mas frecuentes es q las observaciones o los errores en ellas estén distribuidos independientemente. ‘© Controt local: Conjunto de acciones q implementa el investigador con el fin de reducir al maximo posible el error experimental, manteniendo un rango de variacién manejable. Y Tipos de estudio de investigacién Y Observacionales: No hay intervencién por parte del investigador, este se limita a medir las variables en estudio. + Ventajas: + Pricticos y factibles de realizar. ‘+ Resultados més generalizables a poblaciones. —_——— Factoresno teios en cuenta q poten Tlegar a modifica los {restos del anatiss j ) i ‘+ Inconvenientes: / + Escaso control de la influencia de los FACTMES DE Gon Fused sobre resultados del estu ‘¢ Debido a ta falta de control por el investigador, cada estudio observaciénal tiende a ser Gnico e imposible de reproducir. Y Pre-experimentales: Analizan una iinica variable, practicamente no existe ningin tipo de control, no existe manipulacién de la variable independiente, no se utiliza un grupo control. ¥ De intervencidn o experimental: Caracterizado por Ia manipulacién del factor por parte del investigador y por Ia aleator casos dos grupos (Control y tratado). ‘Cuando un estadistico se ‘utiliza para aproximar el | ¥ Inferencia en dos poblaciones valor de un paimeto Gessonocso se denosina - {, cstimador. Los extimadores | © £5 TAD9T 65: Son funciones de la muestra. son varioblesleatorisy ferinza oer extindat noe 7 : a cg. 1 informan acerca dela | © Parémetros: Caracteristica numérica de la distribucion | precisondelaestimacion, | poblacional de una variable generalmente desconocida. ~~ Enla conclusion | hago referencia ata | diferencia entre ly | | media poblacional de una de las variables y la media ~~ poblacional de ia otra variable es Casos: »,G#ora | vPiFen coin OF ped 1 2 y Conocidas. 2 ‘i Verificacién de este supuesto | a; #0; y Conocidas. oe ieaeonae Supuestos: Notmariond X, ~NGg:02) X, ~ Niei02) Verificacion de este supuesto por Shapiro-Witks Independencia entre las variables: Se cumple por la forma en q se realizo el experimento. Estimador puntual: Xi: —X: Estadistico empleado: Z= Hipotesis estadisticas:_—_<——| También < 02 Ho hy = ly a ee También ) 0 « Ay meth, Intervalo de confianza: NC 95%: Cada 100 intervalos construidos a partir de muestras de igual tamafio, aproximadamente 95 cubriran el valor verdadero de pardmetro. Ki -Ky'Z,* {24S ,” y Desconocidas Supuestos: Normalidad: X, ~ Ng: X,~ Nb03 Independencia entre las variables: Se cumple por la forma en q se realizo el experimento. Estimador puntual: X: -X2 Estadistico empleado: «= Tabi) 0 Hipotesis ee También $0 = Hoi th = Ha Ay fy # by Intervalo de confianza: 3 *y desconocidas. Supuestos: Normalidad: X, ~ N(i4:03) X, ~ (U3; Independencia entre las variables: Se cumple por la forma en q se realizo el experimento. Estimador puntual: X ~X2 oo evel tm 2) ye Estadistico empleado: Hipstesis estadisticas: También So 2 También ) 0 No se puede asegurar et ‘cumplimiento del supuesto \denomnalidad =) Por el teorema central del limite VP: Laventiiadeesa | = (0) metodologia con datos | apareaos es natualizat de alguna manera las | condiciones ioligieas ‘avid, dad, fetas peden actus Ic: %-X VLA pee dE 7 pee Ena conclusion hago Supuestos —— ferenein ala media Normalidad: D ~ N(4,;03) poblacional de las ‘ it i Pe Giferencias entre una Independencia: Los d_ son independientes para 1s1 21 eal otra variable es ,2, >.<, #0= acer Definimos una nueva variable cy 4, = iW ¥, 0 Estadistico empleado: + Hipétesis estadisticas: __-—-——— | también $02 Hy: Ml, =0 ree También) 0 ( Hy ge Intervalo de confianza: Ftp, “Y, Muestras grandes » 2 30 con datos apareados Por el teorema central del limite vest ve "4-TYEY CTeoria de los métodos basados en rangos) oT Enleconclusion hago | referencia aq la mediana ppoblacional de una de las variableses #0= ala ‘mediana poblacional de la otra variable _ Para muestras independientes, cuando la variable es numérica y su distribucién no es normal. Se combinan ambas muestras en una ‘nica muestra ordenada y luego se asigna a cada dato su rango, sin tener en cuenta de cual de las muestras proviene. Hipétesis estadisticas: Hy:8,=0, << Hy :6, #0, —$<$—$$>_______— También <0 2 También ) 0 ¢ Estadistico de contraste: Por TCL: r) mn + 1. nou j= abate Woy (01) E(t) 7 v(r)= “4mm ners steer ios cos parimetros binomiales Py Y By soniguales 010. | UFeceelas 9. independientes —_——— _[ ema conctuson nago referencia ag la proporeion | poblacional de una de as Supuestos: | variables es #0= ala El supuesto tedrico es la binomialidad de ambas variables. | ™rovercisn poblacional de a Deben cumplir con: lena eeate ‘* Cada repeticién del experimento tenga dos resultados posibles (Exito y fracaso). * Qcada resultado (Exito y fracaso) sean mutuamente excluyentes en una misma repeticién. ‘© Qos resultados (€xito y fracaso) sean independientes de cada repeticién. © Qel mimero de repeticiones este fijado de antemano y q la probabilidad de éxito sea constante a lo largo de todas las repeticiones. a = _X(Casosfavorables) Estimador puntual: \— P2 P=) Casostoales) Estadistico empleado: Por TCL: Hipotesis estadisticas: Hips pete eee FB yp ——— Intervalo de confianza: (~Pah.2gg2 PRESB BE) i En laconelusién hago referencia Vio ceeeute eu tl cociene ente bh aranze poblconal dena de as | Seats y variance \ Supuestos: |, potion dela ov varablees | Normalidad: x, ~ ¥(44:07) hese naeeriee X, ~ Miuio3) Independencia entre las variables: Se cumple por la forma en q se realizo el experimento = Fixed Hipétesis Seite aU También $02 Hy: 24-1 Me S3 Tambien ) 0 ( Intervalo de confianza: si Sk Faint F. iectlertbs Fopatecsite ribucién normal, no modifican fuertemente las conclusiones para el test t, por ello decimos q es robusto. 2.Cuando los tamafios de muestras son similares el test t para muestras independientes es robusto en cuanto al supuesto de heterogeneidad de varianzas, sin embargo el muy sensible a este cuando [os tamafios de muestra son distintos. 3.Si falla el supuesto de normalidad, pero las muestras son lo suficientemente grandes (712 30), entonces vale el test aproximado por TCL. 4.El test F para igualdad de varianzas es muy sensible a apartamientos de la is de normalidad mucho mas q el test t, por lo cual cuando hay dudas variables, ‘S.presentan evidencias de q hay diferencias entre las varianzas (el desvio de tuna es mas del doble q el de la otra) y los tamafios de muestra son muy distintos, es preferible usar t para varianzas distintas, 6.El supuesto de independencia es casi imposible de verificar, cuando este no se cumple no son validos los métodos q hemos desarrollado. 10 En a conclusion hago referencia aq | en la poblacién se puede decir q se | cumple el modelo tesrico de ' que...Bla, Bla: son iguaimente 0 no , _gualmente probable 4 | ‘Tiene mayor potencia en \ \ Unidad 2: Contrastes CHI-CUADRADO: distribuciones discretas y tiende | a 1(uno) cuando n tiende a infinito. Dado un conjunto de observaciones (Muestra aleatoria de tamato n), se esta interesado en determinar si estos corresponde a una distribucién tebrica. Se comparan frecuencias esperadas con frecuencias observadas. Cuanto menores sean los valores. deeste mayo ‘oncordancia centre frecuencias, Si “EValores muy grandes de ste, J \ indian fata de concordanci hubiese ‘entre frecuencia esperads y concordancia Voservadas perfaca el valor r - deledadisieo Se trata de una regién critica unilateral derecha se rehechaza cuando te A ims EL valor del estadistico se podré aproximar a una distribucién (Chi-cuadrado cuando (230) y todas las £25. Las observaciones son obtenidas mediante un muestreo aleatorio, a partir de ‘uma poblacién y se observa | variable particionada en categorias. Hipétesis estadistica: Kes ei nimero de categorias de In variable en estudio. O se ‘signa la probabilidad esperada He: =P. «sea enel problema nia conclusion hago referencia aq laprotablidad H,:Al_ menos una de las igualdades no se verifica., ye wnat seas ccna del tarable ere 1 Temisma pare amtas pblacones, con respect <_varale en endo. 2% Houn Genel aay ae _ 7 Una muestra tamafio n, de una micma variable aleatorin categarizada(X), de cada una de las m poblaciones. Y se observan las frecuencias de ca categoria. Se quiere comprobar si las poblaciones son homogéneas. Si la variable tiene Ia misma distribuci6n de probal Estadistico de contraste: x -30.-4) by plist Kesel numero de categorias y mel numero de poblaciones. ‘Se trata de una regién critica unilateral derecha se rehechaza Ia hipotesis de nulidad cuando los valores de 7, son grandes. Ey u K son las categorias Hipotesis estadisticas: de a inzavrable He: plk, /m,)= pik, /m,)= plk, lk; Im) = p(k /m,)= pl H,: Alguna de las igualdades anteriores no se verifica Las estimaciones de las probabilidades de las categorias de la variable son: , px [Ltses fovorabtes) En a conclusin hago referencia a| Ceili aie t + q las variables X categorizada en (Casos torales) ey, ae asanaal |. independicats. El interés es detectar asociacion entre dos variables categoricas 0 cualitativas referidas a individuos de una misma poblacién. Se extrae una muestra n de ta poblacién y sobre cada una de las unidades muéstrales se observan dos caracteristicas X ¢ Y. De esta forma se obtiene una muestra aleatoria simple bidimensional ena forma(X, /¥,). Sobre dichas observaciones se desea contrastar si las, caracteristicas poblacionales X e Y son independientes o no. Estadistico de contraste: Sc trata de una region critica unilateral derecha se rehechaza Ia hipétesis de nulidad cuando los valores de 7,, Son grandes. estadisticas: Donde Ky #son las categorias de cada una de las variables. Hy: Py=P.*P, Para 1sisk F1Sjsr Hy: Alguna de las igualdades anteriores no se verifica. 12 Unidad 3: Regresién Regresién lineal simple: Estudiaremos el impacto de una variable (X) independiente, explicativa 0 regresora, sobre otra variable (Y) dependiente o respuesta. Para lo cual hay q plantear un modelo de vinculo entre estas variables q debe inctui © Elmodo en q se vinculan entre si estas variables. * La presencia de un error aleatorio vinculado a cualquier modelo estadistico. ‘+ La descripcién del comportamiento de Ia distribucién de estas variables. Supondremos q Y es funcién lineal de X: oe Este es un modelo de RLS pues eee La.elacion de vineulo es funcidn linea. Existe una (mica variable explicativa en el modelo (x) La variable respuesta es numérica (¥) La variable explicativa es numérica (x) Incluye un tamnino de error, la magnitud absoluta de este nos da una idea del grado de bondad de ajuste del modelo. (Proximidad entre valoras obs. valores est.) epee reer ia Timi eq omen Vicoomei || ent damtyeta VB ' Representacién grafic: DALIAA DY Digit R00 WEA cada elemento de Ia muestra se le observa tun valor de cada una de las dos variables, cada punto del diagrama representa las dos observaciones simultaneas de un elemento de la muestra, por lo general Ia VI (eje x) y la VD (eje y). A: Relacién funcional negativa. Relacién funcional positiva. 13 Notacién: Yi a Un vator observado de In variable respuesta YZ Et valor estimado correspondiente, para el mismo , y segin Ia recta estimada, é Y Zz? El promedio de todos los valores observados de la variable repuesta. Yi-V Zz desvio total V;- Vz Desvio debido a ta represion. Vi-¥i a Desvio debido al error muesteal A cada uno de los n puntos observados y representados en el diagrama de dispersidn los designamos (X,;,) Ecuacién tedrica de la recta de regre 1) By are iva | Parimetros poblacionates | Fin) i | tienen daria normal bivariada aa Supuestos del modelo: 1. EQ,)=a+ x, ) Estos supuestos pueden resumirse en: 2. Varly,)=07 Y~ Na+ fct+o") Parai=i...n 3. Wad, Som VAL Obien: 4 y,-¥ Yi=atBx,te, Conisisn €,~N(@:07) La ecuacién para estimar la recta es: Saeunaea cundrados minimos de @y Para i B 14 Las distancias verticales entre los puntos observados en la muestra y los de la recta estimada son los residuos ¢,= y,—$-=> y,—(a+6x,) Estos residues son la estimacion de los €, Sil valor es subestimado por la recta el, serd +, si es sobre estimado por la rect el @, : ‘Onder lorgen, indica el valor Lo, —(a+br,)) / dela variable dependiente cuando Ivete nettle jotta EaEy) mde Us Pendiente indica q al aumenter la variable independiente en Ina unidad la variable dependiente media estimada aumenta 0 disminuya en, ses también un estimador ‘nsesgado de Varianza de los residuos: Para ello tenemos en cuenta q los €, son variables aleatorias no observables, to q poems observar son los ¢,. To se debe aa para obtener a etimacion de G” , deben primeramente obtenerse las sstimacones de a y def). arestiaen un perida de dos grads de tad Debe pertenecer al rango del ‘conjunto de dates. Estimacién de la esperanza de y da do un valor de Xo ‘Queremos estimar el valor esperado de y cuando X = X,y construir un IC q contenga ef valor esperado de y cuando X =X, , con probabilidad ) 1a, este se denomina E(y/x = 15 AF DR aay * if Intervalo de prediceién: (intervalo de preedicién para una nueva observacién Jo ). Un valor futuro de ¥ no es un pardmetro sino una variable aleatoria, por esto, mismo nos referimos a un intervalo para los valores futuros de Y, como un intervalo de prediccién. Interpretacion: Si se estiman 100 IP, esperamos q (1~@) el 100% de ellos contenga un valor de un caso a futuro, Modelo para en nuevo individuo observado: Yn =@t+B xs tepy IP: Fact ayagt [oof rete Ge ~ n =x Bondad de ajuste del model El tamaiio de los residuos es fo q nos da una idea de la bondad de ajuste del modelo. T - SCRes SCRes = Y(y,—$,)? XOi-FY sCReg ee Tato q og cicero recta Coeficiente de determinacién: epee eet cae serolueeleworsise eae sretane aera de osa?si regresin, con epee a ‘Stina con el pomotio de invariable request) Es la proporciém del eror total g logra ser explicada por la regresién. R?=0,98,,e1 98% de la varabilidad de (y) queda explicada a través dela ‘recta de regresion estimada en funcion de la variable predictora (x) ‘Segtin el modelo estimado 16 Regresién lineal maltiple: Las variables biolégicas suelen presentar relacién con miltiples variables. Es te modelo RLM nos permite estudiar los efectos de dos 0 mas variables predoctoras sobre la variable de interés o respuesta. Formula general del modelo: [R ny Yi Arb, y+ By ait BA +€; Con 1} he poo —~ } ! Ordenada al origen, valor i 7 { esperad de y cuando \ , ol | Beet error de cade valor Indica el orden de Nar een cere observado, representa la cobservacion de cada uno de : J diferencia entre el valor Jos valores de la muestra > esperado y el valar observado || ES pendiemte de la relacion tinea! entre | Vy Xe Reps cambio cat aor} | esperado de Y cuando la variable Xj se | fnerementa en una unidad, permaneciendo ‘constantes todas las demas variables \ predocto Supuestos del modelo: Ele,)=0 Varle,)= €, ¥ , son independientes para valores cualquiera de i, k €, ¥x, son independientes para valores cualquiera dei, k £, ~N paratodok Con isk sn pe eEe La estimacién de los coeficientes del modelo se realiza igual q en RLS. Dichos coeficientes se denominan coeficientes de regresion parcial ¢ indican Ia influencia parcial de cada una de las variables independientes sobre la variable dependiente cuando se mantiene constante 1a influencia de todas las demas variables independientes. 17 Docimasia para B También <0 = RLS eee Hy: B=0: También) 0 ( Ay ot ee Estadistico de prueba: b-B V8. CMregrecion _ CMdosi t a hae is CMresidual — CMerror 7 ‘Cuando pide usar la tabla de ‘ndlisis de varisraa, usamos ‘sic otro estadistico L\POTESIG CONS UAT — HB =B,=B0 Hy: Algun 2, #0 con i =1,2, Estadistico de prueba: __CMregrecion CMresidual ~ Nan-2 Hipétesis individual: Iguales q en RLS pero se ~!n-3 Fina ; ; Piha lta [eater arenes | eee Lh ieee Unidad 4: Diseiio completamente aleatorizado (DCA) Analisis de varianza (ADEVA) Anilisis de varianza de un factor: Técnica de comparacion de medias de mas de dos grupos, es decir método para comparar més de dos tratamientos o niveles de un factor. Para medias cuantitativas continuas con ~ Normal y varianzas iguales y desconocidas usamos un t-student como en unidad 1, euando se dispone de mas de dos grupos se utiliza el andlisis de varianza. EI planteo mas sencillo para este andlisis se plantea cuando se tiene una variable numérica cuantitativa y se quiere determinar en q medida se puede atribuir la variabiidad de esta a otra variable cualitativa nominal denominada factor, este con niveles fijos. Tenemos: © IL grupos: Clasificados de acuerdo a los niveles 1, 2,3,...,1 del factor (amados tratamientos). Donde en cada nivel tenemos 7, !12,...1; observaciones independientes y obtenidas aleatoriamente, © Expresion del modelo: = -¥,=4, +, paras=12,. para j=12,.n, Las variables aleatorias son independientes entre si, dentro y entre las poblaciones. ‘Cada una de las observaciones se designa con 2 subindices: jumero de ebservaciones dentro del grupo N= total de observaciones dentro de todos los grupos. Hipétesis estadisticas: Ay: = My Hu Hi, sexiste al menos un i tal q U, # 19 Este se basa enia dela | vavabilidad | entre los | aruposy dentro ios grupos. Para testear estas hipétesis se debe: 1. estimar las medias de los grupos Y, 1,< —_* [ estamisma gta ee osha 2, Estimarla isis Colt Y ray Sn La diferencia entre cada observacion y la media muestra global se puede descomponer: |\ Unotacracin( (yy. Py ViVi) ‘Si a cada término de esta expresién se lo eleva al cuadrado y se lo suma para todas las observaciones se mantiene la igualdad: X XG,-9F XD Uby-HF Ya -5P Ve STH aes “ae El cociente entre la suma de los cuadrados y sus correspondientes grados de libertad se denominan cuadrados medios: pee [Fa ucinacin den) | Se pute expres como la (f matia ponderada | (| Getrvarimeas natales de | A= 1, cada eon Ia maa de todos loo gros esa isa también 5 S /) stimocion dei varimza comin. __—-+ Cuomtitiea la dscrepenca entre las medias des grapos y lama comin o global Sies pequta La hiptesis de nulidad es cient ‘Si las observaciones son independientes y tienen distribucién) Friant normal 20 Si las medias de los grupos son diferentes CME no contiene el valor de la -varianza intrinseca estimada, (0" ), si no q ademés estard aumentada segin las discrepancias entre la medias de los tratamientos, y seré mayor cuanto mayor sean estas diferencias. Fuentesde [SC | GL cM F variacion(FV) Entre Grupos [SCE | I-1 | cae =SCE7 CMD CME (Tratamientos) F, [AN Dentrode {SCD} N-I | cap =SCD, grupos "1 (Error) Total SCT | N-1 n= Numero de muestras por grupo. I= Numero de grupos N=(n#1) Verificacién de supuestos: * Independencia: Se garantiza por el tipo de muestreo realizado. - ) Anive de signifcacén dl 3 | tengoino tengo) evidencia suticiente i : pes - —- para rechazar Hl. Es devi g los Beer reece ereet : | crores provenientes del modelo Se aplica Shapiro Wilks sobre los residuos. | propuesto(DCAio), se (~/ 4) Tabla ‘Nonnal. Por ko tanto la (VD) se ills :oradificado} (-1 4) Normal, teniendo en cuenta VaRiNDLE a Bes DE, Ww D@naLoud) | tose # Cantidad de niveles)niveles del RECoverumtacio’ 4B G0 4,03 AAG O77630 factor Hipotesis estadisticas: H,€~N(00") H, :El error + N(Q:0") Por lo Tanto ae oes Pv)a NRy, 21 Sc contraste hasta q punto los niveles del factor tienen variazas homogéneas Homosedasticidad: factor, ene varianass honogtnees ern, Tabla 2 fa ae Analisis de la varanza Test de Levene _-_-Hipdtesis estadisticas: watts MRE Rh Ay CU H,:0} =o} =o? =o para i =\,2, nvr 14 002 G0 94,24 Hy: Algun 07 #0° para i =1,2, «eg eAmain de Varaess (S401 Tengo dos posblidades: 1, Pryar NRy, Por lo tanto,” = 0 *, realizo andlisis parametrico. ANOVA 2, PwKa Le Ry, Por lo tantog,’ +,’, realizo andlisis no parameétrico. KRUSKAL WALLIS ‘A nivel de signifcacion del 5% (tengovno tengo) evidencia suficiente para rechazar H , por lo tanto al menos un valor radio pablacional (VD) (gual/stinto) de los restanies, eS decir q la (VD) media poblacional (e/no es) la misma para f a (ONivcles del factee). # aniodle - : Cuadro de Analisis dela Variangy (SC tpe TT Hipétesis estadisticas: Ee ene Heme Para i =1,2, son Hy Algun #40 Para 1=1,2,.. Pra 2225 NRy, ' Anivel de significacién del 5% (tengoino tengo) evidencia suficiente para echazar por lq se puede supener galguno de los (4 cantidad de nivees)niveles del factor iene (dstinyigal) Me para In variable en est. 2. You Tabla 4 Hipotesis estadisticas: Pris de Kruskal Wallis fe eaceisecueee ae Toh a Cen ass 2 Me paral arable en esti, 8 Hy ; Al menos una poblacién tienen a distinta Me para la variable en estudio, Pro, —Pele Tame Rn, 22 Unidad 5: Conrelacion lineal (Pearson) y no paramética (Spearman) t | Moy fea xine 00) Corsetacién © inftuencindo — ‘ssociscion) poblacionsl | porvaloes) | ~— : Tiel entre as variables (X) ‘extremo3, Coeficiente de dorrelacise do Pearson y (¥) enceta poblacin en eee _ssulio. ale Para cuantificar el grado de asociacién lineal entre los valores de dos variables continuas, necesitamos un namero q retina las siguientes condiciones: 1, Resulte positive sila asociacién lineal es positiva. 2. Resulte negativo si la asociacién lineal es negativa. 3. Crezca en valor absoluto a medida q la distribucién de las observaciones se aproxima a una configuracién rectilines. 4, Su valor no dependa de las unidades utilizadas para expresar las ee Los valores q toma este cocfieiente estén comprendios centre Asoeiacin lineal +) y~ Tasociacion fine Lacereana desu valor absolute ee 2 wo indica Ja proximidiad de ios f puntos a una funcién lineal, Sitoma 1/1 los punto eatin alineados perfoctamente positiva El coeficiente de correlacién r de Pearson mide el grado de asociacién tineal © negativamente. ‘entre los pares de valores de des variables contimas. No realiza distincién entre ‘Sitoma un valor cereano a cero ‘variables explicativasy respuesta ambas variables no presentan corelacién neal. Inferencia relativa a la correlacién lineal. Para csto s¢ deben cumplir una serie de supuestos (modelo de correlacién 1. La muestra ha sido seleccionada en forma aleatoria. 2. Las observaciones de la muestra son independientes. (cada par es independiente del otro) 3. La variable formada por los conjuntos de valores (X ; Y), tiene distribucion conjunta normal bivariada. (XY) ~ NORMAL BIVARIADA(L, ,I,, 07.07, P) El coeficiente de correlacion se obtiene a partir de los datos muéstrales recogidos pretende estimar el coeficiente de correlaci6n lineal poblacional Plrho). 23 interpretacion cocficiente de ‘Spearman <2 amisma qa del cocficiente de Pearson. ‘Se quiere decidir sila correlacién lineal observada en la muestra es casual o bien siesatribuiblea Ia ‘varabilidad sleatoria Doeimasia Hipotesis astadisticas En las hipbtesis siempre se planter Hy:p= ‘Rho con respecto a ero. y p=0 Hy:p#0 Estadistico de contraste: (Existe0 no )(correlacion o asociacién) poblacional lineal entre fas variables (X) y (Y) en esta poblacion, cen estudio, Este coeficiente utiliza los rangos, tnimeros de orden de cada grupo de ‘sjetos y compara dicho rango. Coeficiente de correlacién de rangos de Spearman (No Parametrico) Este se debe aplicar cuando las mediciones son de nivel al menos ordinal, cuando no se puede sostener el supuesto de normalidad de una © ambas variables y cuando los datos presentan valores extremos. Docimasia: Hipétesis estadisticas: 7H, :Las variables X y Y no estan (correlacionadas /+/ ? H,: Las variables X y Y estan (correlacionadas / + /-). Formula del coeficiente: ,; Sa? pagan Z n(n+1\n-1) ; = Rix, — Ry) 24 Para (4 ( » S 30) Sc utiliza el coeficiente de correlacion de Spearman exacto. Para ” ) 30 se utiliza una aproximacion normal por TCL: 25

You might also like