Ejercicios de Diagrama de Dispersion - HC

You might also like

Download as pdf
Download as pdf
You are on page 1of 10
111823, 2341 Documenta sin tuo Ejercicios Propuestos Ejercicio Propuestol Se realiza un estudio para establecer una ecuacién mediante la cual se pueda utilizar Ia concentracién de estrona en saliva (x), para predecir la concentracién de estrona en plasma libre (y). Se obtuvieron los siguientes datos de 14 hombres sanos: Kk | 74 J75 | 85 | 90 | 90 | m0 ][13.0][ 140 | 145 || 16 | 17.0 [180 | 200 | 23.0 fy | 300 |[ 250 | aus | 275 | 395 | 380 |[ 43.0 |[ 49.0 | 5500 |[ 4x5 |[ 51.0 | 645 | 63.0 | 68.0 Se pide: a. Diagrama de dispersion b. Recta de regresién de la concentracién de estrona en plasma libre en func saliva, Estudiar la bondad del ajuste . Regresién parabélica. Estudiar la bondad del ajuste. de la concentracién de estrona en Ejercicio Propuesto2 Se realiza un estudio para investigar la relaciin entre el nivel de humedad del suclo y Ia tasa de mortalidad en lombrices. La tasa de mortalidad, Y, es la proporcién de lombrices de tierra que mueren tras un periodo de dos semanas; el nivel de humedad, X, viene medido en milimetros de agua por centimetro cuadrado de suelo. Los datos se muestran en la siguiente tabla. k J 031 [031 | 0s6 | ose | 089 | 0x9 | 096 J 0.96 | 1.15 | 1.15 || 125 y || 02 [or | oo | 02 03 os | 00 || 06 | 04 | 02 |[ os Se pide: a) ;Muestran los datos una tendencia lineal? 1b) Determinar la recta de regresién Y/X, el grado de aso y la bondad del ajuste realizado en la recta de regresién. ‘én lineal entre la tasa de mortalidad y el nivel de humedad (0 explica el modelo? ©) Mediante Ia linea de regresién estimada, predecir el nivel de humedad del suelo si Ia tasa de mortalidad de las, Iombrices es 0.7 4) Determinar el coeficiente de correlacién lineal de las reetas de regresién YIX y X/Y ©) Ajustar los datos mediante una regresién curvilinea 4) Qué ajuste es mejor ;Lineal? ;Curvilineo? Ejercicio Propuesto 1 Se realiza un estudio para establecer una ecuacién mediante Ia cual se pueda utilizar la concentracién de estrona en saliva (x), para predecir Ia concentracién de estrona en plasma libre (y). Se obtuvieron los siguientes datos de 14 hombres sanos: k | 74 J_75 | 85 | 90 | 90 | 11.0 ][13.0][ 140 | 145 || 16 | 17.0 | 18.0 | 200 | 23.0 30.0 [25.0 |_a1s | 275 [395 [380 |[43.0 || 49.0 | 550 |[ 485 [51.0 | 045 | 63.0 | 68.0 Se pide: hitpsivwugresi-bioestadiguiaspssipractica’ rcicopropuesto hint sno 111823, 2341 Documenta sin tuo a. Diagrama de dispersion b. Recta de regresin de la concentracién de estrona en plasma libre en funcién de la concentracién de estrona en saliva, Estudiar la bondad del ajuste c. Regresin parabélica, Estudiar la bondad del ajuste. Solucién: a, Diagrama de Dispersion Diagrama de dispersion Estrona en saliva (x) -Estrona en plasma libre (y) ° oP 6 ogo 0-} ° sog0: a soo ° ° ago a? ° ° 200-4 500 1000 250 b. Recta de regresin de Ia concentracién de estrona en plasma libre en funcién de la concentracién de estrona en iva. Estudiar la bondad del ajuste. Resumen del modelo Rcuacrada | Erortip. del Modelo] R | Rovacrado | comegide | estimacion i a ou 904) 438490 a. Vanables predictoras: (Constante). x ANOVA! Suma ce Meda Modelo cuadrados_| al _|_cuadrética F Sig. 1 Regresion| — 2362,647 T| 2362647 122,880 “0004 Residual 730,728 | 12 19,227 Total 2503375 | 13 hitpsivwugresi-bioestadiguiaspssipractica’ @ Variables predictoras (Constante), x b. Vanable dependiente:y rcicopropuesto hint 111823, 2341 Documenta sin tuo Coeficientes Intervaio de Coeficientesno | Coeficientes confianza para B al estandarizados | estandarizadas 95% Limite | Limite Madelo, 6 Errortip Beta t Sig__| inferior_| superior 7 (Constantey| 8.645 | 3.504 2467 fos f ToT [14.275 x 27a | 246 954 | 14085] 000 | 2491 | 3.263 ‘a. Vanable depenciente: y Los resultados muestran que + El coeficiente de correlacién lineal de Pearson (R) es igual a 0.954 y el coeficiente de determinacién, R cuadrado, es igual a 0.911. Este valor indica que el 91.1% de la vatiabilidad de la concentracién de estrona en plasma es explicada por el modelo propuesto. El grado de ajuste es alto + La Tabla ANOVA muestra un valor del estadistico F = 122.880 y un p-valor asociado menor que 0.001, lo que conduce a rechazar la bipétesis nula de no linealidad, Por tanto, existe una relacién lineal significativa entre ¥ y X. + La Tabla de los Coeficientes muestra © Las estimaciones de los parametros del modelo de regresién lineal simple, la ordenada en el origen, ‘B0=8.645 y la pendiente B1= 2.727. Por lo tanto, la ecuacién de la recta estimada o ajustada es: y = 8.645 42.727 x © El contraste de la pendiente de la recta que es una alternativa equivalente al contraste que acabamos de comentar en la Tabla ANOVA. El estadistico de contraste que aparece en la columna t vale 11.085 tiene un p-valor asociado, columna Sig, menor que 0.001, menor que el nivel de significacién 0.05 que conduce al rechazo de la hipotesis nula y podemos afirmar que existe une relacién lineal significativa entre ¥ y X. En la iltima columna de la tabla se muestran los intervalos de confianza para Bo y 1, al 95%. El intevalo para 81 es (2.191, 3.263), puesto que el cero no pertenece al intervalo, hay evidencia empirica para coneluir que X influye en Y y por tanto al nivel de confianza del 95% el parametro 81 no podria considerarse igual a cero, O cservace a 7000-4 e004 so00-4 «000 2000-4 2000-4 El grafico muestra un buen ajuste lineal y una tendencia creciente. hitps:www.ugres!-bioestadiguiaspssipracticaSejerciciopropuesto hinl ano 111823, 2341 Documenta sin tla Grafico 0-0 Normal de Standardized Residual Valor Normal esperado Valor observado Este grafico representa las funciones de distribucién tedrica y empfrica de los residuos tipificados. En el eje de ordenadas se representa la funci6n teérica bajo el supuesto de normalidad y en el eje de abcisas, Ia funcién empirica. Desviaciones de los puntos del gréfico respecto de la diagonal indican alteraciones de la normalidad. Observamos la ubicacién de los puntos del ‘tifico, estos puntos se aproximan razonablemente a la diagonal lo que puede confirmar la hipétesis de normalidad. A continuacién vamos @ realizar el estudio analitico de la normalidad de los residuos mediante el contraste no-paramétrico de Kolmogorov-Smirnov. Pructa da Kolmogorov. muestra ‘Slancaraized Reesicual W TF Patdmetios normale Media ononnna Deswactén toies .we076802 Diferencias mas extiemas Aasalute sat Positvs ‘at Necatve “a7 2.9 Kolmogerowsmimar a Sia. asiniét (ilatera 01 ‘La dictrbucion do contacto os a Norval ', Se han caleulado a partir de los Gatos Esta tabla muestra la mayor diferencia entre los resultados esperados en caso de que los residuos surgieran de una distribucién normal y los valores observados. Se distingue entre la mayor diferencia en valor absoluto, la mayor diferencia positiva y la ‘mayor diferencia negativa. Se muestra el valor del estadistico Z (0.603) y el valor del p-valor asociado (0.861). Por lo tanto no se puede rechazar la hipétesis de normalidad de los residuos. La homocedasticidad de las varianzas la comprobamos gréficamente: Representamos los residuos tipificados frente a los valores de y estimados tipificados. El anilisis de este grifico puede revelar una posible violacién de la hipotesis de homocedasticidad, por ejemplo si detectamos que el tamafio de los residuos aumenta o disminuye de forma sistemética para algunos valores ajustados de la variable ¥, si observamos que el grifico muestra forma de embudo... Si por el contario dicho _gtifico no muestra patrén alguno, entonces no podemos rechazar la hipdtesis de igualdad de varianzas, hips: www ugres!-bioestadiguiaspssipracticaSejericiopropuestohinl ano 111823, 2341 Documento sin tule Grafico de dispersion Variable dependiente: y ificado Regresion Residue ti a 4 o 7 Regresion Valor pronosticado tipificado No apreciamos tendencia clara en este gréfico, los residuos no presentan estructura definida respecto de los valores predichos por el modelo por lo que no debemos rechazar la hipétesis de homocedasticidad. Resumen del model? Revacrado | Erartip. cele Madelo, R Reuadrade | _corsgida | estimacisn _| Durbin. Watson 7 954 a1 904 430490 2.524 a. Variables predictoras (Constante), x b. Vanable dependiente: y La hipétesis de independencia de los residuos la realizamos mediante el contraste de Durbin-Watson. El estadistico de Durbin- Watson mide el grado de autocorrelacién entre el residuo correspondiente a cada observacién y la anterior. Si su valor esté préximo a 2, entonces los residuos estin incorrelados, si se aproxima a 4, estarén negativamente autocorrelados y si su esté cercano a 0 estarin positivamente autocorrelados. En nuestro caso, toma cl valor 2.524, préximo a 2 lo que indica incorrelacién de los residuos. ¢. Regresién parabélica, Estudiar la bondad del ajuste, Resumen del modelo y estimaci Variable depenciente, nes de los parametros Estimaciones de los Resumen del modelo parametros: R Eouacién | cuadrado | _F oti | gt | sip [Constante | 64 b2 Cuedratico S18 [61595 z TL _ooo f= 957 | 4257 [088 Ta variable independiente es x El modelo ajustado tiene la siguiente expresién: y =-0.951 + 4.237 x - 0.053 x42 La representacién gréfica de la funcién ajustada junto con la hitps:www.ugres!-bioestadguiaspssipracticaSejericiopropuesto hinl ube de puntos es lor so 111823, 2341 Documenta sin tuo y © onservada —cuseratee ° a0] ° so00-| ° ° o 4000-4 re m00-4 9, 0 2000-4 500 yom asm 2000 25.00 x Se aprecia que la funcién curvilinea se ajusta moderadamente al diagrama de dispersién, Resumen del modelo y estimaciones de los parametros Variable depenciente Estimaciones de los Resumen del modelo parametros. R Ecuacion_| cuadrado | git | 2 | sig [Constante | b1 be Lineal 911 [122.560 7 Bl OOP 8045 | 2797 Cutadratico 216 | 61.595 2 at] soo] = 951 |_ 4237 |_-.053 Ta variable independiente es x La comparacién del ajuste de ambos modelos se puede realizar a partir de los valores del coeficiente de determinacién de cada uno de ellos, en este caso R cuadrado (lineal) = 0.911 y R cuadrado (cuadratico) = 0.918. Los resultados en el caso lineal son un poco menos satisfactorios que el cuadritico. Se aprecia, en el grifico que el modelo cuadritico (linea discontinua) se aproxima un poco mejor a la nube de puntos que el ‘modelo lineal (linea continua). hips: www ugres!-bioestadiguiaspssipracticaSejericiopropuestohinl ano 111823, 2341 Documenta sin tuo y © coservade tinea! — cuntatico ra.00: saoo 00: sn. 00 voc ssi 2000 asin) x ‘También podemos realizar la comparacién del ajuste de los dos modelos a partir de las varianzas residuales. Para ello se debe marear en Ja ventana de Estimacién curvilinea la opcién Mostrar tabla de ANOVA ANOVA Suma de Media cuadrades | gl | cuactatica i Sig Regresion| — 2380,796 2[ 1is0308 | 61.508 (000 Rosicual 212673 4 19,325 Total 259,375 12 Ta variable independiente 25 x En la tabla ANOVA se muestra un p-valor menor que 0.001 menor que el nivel de significacién 0.05, por lo que se rechaza la hipétesis nula de no regresién curvilinea. Los valores obtenidos de los coeficientes de determinacién son: R euadrado (lineal) = 0.911 y R cuadrado (cuadrétieo) = 0.918, puesto que la diferencia entre ambos coeficientes es muy pequefia, se considerard el modelo lineal por su simplicidad, sign debe tener en cuenta no sélo la bondad del ajuste numérico ,finalmente, su adecuacidn o explicacién biolégica, Conviene puntualizar que la eleccién de un modelo de r sino también la adecuacién grifica de los datos al mismo Ejercicio Propuesto 2 Se realiza un estudio para investigar la relacién entre el nivel de humedad del suelo y Ia tasa de mortalidad en Iombrices. La tasa de mortalidad, Y, es la proporcién de lombrices de tierra que mueren tras un periodo de dos semanas; el nivel de humedad, X, viene medido en milimetros de agua por centimetro cuadrado de suelo. Los datos se muestran en la siguiente tabla. k [031 | 031 | ose | ose | 089 | 089 | 0.96 | 0.96 | 1.15 | 1.15 || 125 y jo2 [or | oo | 02 03, os [00 || 06 | o4 | 02 |[ os Se pide: hitpsivwugresi-bioestadiguiaspssipractica’ rcicopropuesto hint 70 111823, 2341 Documenta sin tuo a) ;Muestran los datos una tendencia lineal? b) Determinar Ia recta de regresién Y/X, el grado de asociacién lineal entre la tasa de mortalidad y el nivel de humedad y la bondad del ajuste realizado en la recta de regresién. ;Cudnto explica el modelo? ©) Mediante Ia linea de regresién es Iombrices es 0.7 ada, predecir el nivel de humedad del suelo si Ia tasa de mortalidad de las 4) Determinar el coeficiente de correlacién lineal de las rectas de regresién Y/X y X/Y ©) Ajustar los datos mediante una regresién curvilinea 4) {Qué ajuste es mejor ;Lineal? ;Curvilineo? Solucién: a) {Muestran los datos una tendencia lineal? y b) Determinar Ia reeta de regresién Y/X, el grado de asociacién lineal entre Ia tasa de mortalidad y el nivel de humedad y la bondad del ajuste realizado en la recta de regresin, ;Cuanto explica el modelo? Cooficientos* Cosfciantes no astondarizados | “ipitesdos” mena eee Ue Nodela a norte ota : sig | cimseimiencr | ctpcror 1 Consianie) aT Tar ce 70 a x a2 76 wat | nace [soo -07s 9 3: Vatablo doponaionionY Resumen del modele? Rovataao] Sort apa weceio | R | Revaurado | “coweaida’ | “estinacien o me ae 137 18a =. \Vatiables aredictoras: (Constanta), K Bb vanabie sanenctente:” ps:wwnugres!-bioestad guiaspssioractca3iejrcciopropuesto him! ano 111823, 2341 Documenta sin tuo ©) Mediante Ia linea de Jombrices es 0.7 wocieio cunerades A casita F EM 1 RegeaaT Te 7 we] aa] 1 EVaiaples pea corge [ponctanian regresin estimada, predecir el nivel de humedad del suelo si la tasa de mortalidad de las Coerteientes® Deehaientes Triewalo ce conarza © 050%, Cocfiiantes ne ostandarizadac | “faitesdae paras Lite ovela 5 Enortip. Beta 1 sig__| Liniteinterior | supettor 1 Gonstantar TF 1a ara |e aT oF ¥ au 31 oa | 132 | uo 198 4,987, @-Vatlable dependierte % Para una tasa de mortalidad de 0.7, el nivel de humedad del suelo es 1.1778 4) Determinar el cocficiente de correlacién lineal de las rectas de regresién Y/X y X/Y : r= 0.521 ©) Ajustar los datos medi jiante una regresién curvilinea &) {Qué ajuste es mejor Coeficientes Teta estandaizsee CCoetctentes na estandoreadoe = a Ereribiee Tee ‘ 5g xr2 109 m9 az | 62 | gee (Con=tanio) 6! ara aes | 97s Sapa Tas eisdiscos | t_ | cundratica F sia Fegan 5 7 0s | 10 | ave Residual 208 6 028 Total 22 10 Ta vais dopant ne gLineal? ;Curvilineo? hips: www ugres!-bioestadiguiaspssipracticaSejericiopropuestohinl sno 111823, 2341 Documenta sin tuo Y © Obesrveds tines = curtico & 2 % 1B 7 x Resumen del modele? Resumen del modelo Revatano | Erortn dere cumiaiy | ERieage weceto | | Revatrevo | "tonenda’ | “eslmacten | Revasrada | “aneuin | feesimacen i ae a 737 eat a a om 735 3 \atabos proatorae(Conctotoy, Yahi rete ae:onetanto, Tavarable ncenenderisesk juste lineal Ajuste cuadritico hip -biosiniasps/pratclojansiopopuesa ml roo

You might also like