Download as pdf
Download as pdf
You are on page 1of 82
159 PRUEBAS’ DE HIPOTESIS 7.4 CONCEPTOS BASICOS El investirador puede plantear hipétesis, tales coro: "los nacimientos de nifies son mas frecuentes que los de nifas" ; "el tratamiento A es m&s efectivo que el PY ; "hay vida en Mar- te" ; "la dropa en estudio disminuye e1 conte- nido medio de colesterol" ; etc.. Sobre la ha- se de sus resultados experimentales, quiere de- cidir si su hipétesis es cierta o falsa. Sin embarro, nunca tendr& seruridad de que su de- cisién sea correcta, ya que siempre corre el riesro de que no lo sea. Una prueba o test de hipdtesis, es un pro- cedimiento que permite decidir, controlando cierto riesro, la veracidad o falsedad de hi- pétesis referentes a una poblacién, examinando una muestra aleatoria de ella. Gran nGmero de hip6tesis biolépicas, pero no todas, se pueden plantear en términos esta- disticos., Consideremos, por ejemplo, la hipéte- sis "los nacimientos de niftos son més frecuen- tes que los de nifias", Evidentemente esta afir- macién se refiere a todos los nacimientos. Si quisiéranos analizar si es verdadera o falsa, tomariamos una muestra de n nacimientos y ob- servariamos el sexo de cada uno. Podemos defi- nir la variable aleatori X = n@mero de nifios en n nacimientos 160 Sabemos que XV B(nsp) , siendo: P = probabilidad de que nazea un nifto Decir que nacen ms nifos que nifias, es equi- valente a que sea p>0,50 . En consecuencia, la hip6tesis biolévica planteada en términos esta- @fsticos es: p > 0,50 Las hipétesis estadisticas que utilizaremos, serdn aquellas en las que intervienen Gnicamente paraémetros desconocidos de ciertas distribuciones, Si X es una variable aleatoria N(w30) y los par&metros |) y a son desconocidos, se pueden plan- tear hipStesis acerca de ellos. Por ejemplo: u = 20 wr 4, wes a < 0,3 o$ 1,2 o> 2,5 También si X,Y N(uy30,) y Xv M(H, 509) podemos plantear las sipuientes hipétesis esta- @isticas: uy

4,2 Wo) uy muy Hy) uy 15 yu < 15, éCudles son Hy y Hy? Para plantear las hip$tesis, recordemos los dos posibles errores que se pueden cometer en este caso, Ellos son: - decidir uy > 15 y en realidad es u < 15 - decidir u < 15 y en realidad es y > 15 Cada decisi6n trae aparejada una accién, De- cidir u > 15 implicar& hacer juicio acusando de propaganda deslea. y decidir u < 18, no hacer juicio, En consecuencia, los dos posibles errores, expresados en otros términos, son respectivament. + hacer juicio acusando de propaganda desleal, cuando en realidad la propaganda es cierta. - no hacer juicio y en realidad la propaganda es falsa. Cada una de estos errores tiene cierta pro- babilidad de ocurrir, 4 una de las dos probabili- dades de error le podemos fijar un valor a peque- flo, mientras que la otra quedar& indeterminada. Elegimos a teniendo en cuenta el riesgo que queremos controlar, En este caso queremos que la probabilidad de hacer juicio en forma equivocada sea pequefia, luego, tomamos: 164 Pasos a seguir en un problema de test de hipétesis oy) a = P(hacer juicio acusando de propaganda des- leal y, en realidad, la propaganda es cier- ta) Expresando a en términos del parfmetro 1 a = P(decidir uy > 15 y en realidad es u < 15) Segin la definicién es: a = P(nechazar H, si en realidad es verdadera) © bien: a = P(decidir que vale Hy y en realidad es H, verdadera) Comparando con (#) resulta que: decidir p> 15 es equivalente a decidir que vale Hy. Por lo tanto, serg: Hy) w> 4s Por otra parte, H, verdadera es equivalente a u < 45, Como 1a igualdad la ponemos siempre en la hipétesis nula es: Ho) wg as Hy) w> 45 Para decidir entre la hip6tesis nula y la alternativa, es necesario elepir una muestra al azar, estimar los pargmetros, y luego, aplicando el test adecuado, calcular el valor de un estadfs tico que llamaremos estadistico de prueba, y to-— mar la decisi6n, Antes de dar la explicacién de cada test particular, vamos a enunciar todos los pasos que se deben sepuir para resolver cualquier problena mediante una prueba de hipétesis. Definir las variables aleatorias, Establecer las suposiciones necesarias para que se cumpla el modelo, 3.- Plantear las hip6tesis H, y My. 4.= Definir e1 estadfstico de prueba e. Indicar la distribuci6n del estadfstico de prueba, suponiendo que H, es verdadera. Determinar 1a zona de rechazo, teniendc en cuenta el nivel de significacién a. 7.- Utilizando los datos de la muestra, calcular el valor del estadistico de prueba y tomar la decisién. 8.- Interpretar la decisién en términos del pro- blema. A continuacién desarrollaremos en forma par- ticular, cada una de las pruehas de hipétesis que se utilizan con mis frecuencia en las ciencias biomédicas, 7,2 TEST DE GAUSS PARA LA MEDIA DE UNA VARIABLE ALEATORIA NORMAL CON VARIANZA CONOCIDA Supongamos que: x ~ N30) y o es conocida, El Gnico parfmetro desconocido es u. Las hi- pétesis que podemos plantear son: ue Hy wry a Hu uy Rechazaremos H, cuando tengamos evidencia que 1 es mayor que Uj. S610 disponemos del estimador de u que es %. Si obtenemos un valor de ¥ mucho mayor que i, podemos pensar que es u > us pues si fuese » =u, los valores de X estarfan cerca- nos aU) y serfa muy poco probable obtener un va- lor de K >> uj. Luego, si obtuviésenos un valor de X >> u, rechazarfamos Hi,. En lugar de trabajar con X trabejaremos con € que depende directamente de ¥. Que X sea mucho mayor que u, es equivalente a que € tome valores muy grandes. En consecuen cia, nuestra regla de decisién seré si € toma un valor muy grande, entonces rechazamos Hi. Esta regla es ambigua, Debemos precisar a partir de qué valor consideramos € muy grande. Es decir, debemos determinar A de modo tal que nues- tra repla de decisién seat si ¢ 2A, entonces rechazanos H,. Para ello tenemos en cuenta el nivel de sig- nificacién, De acuerdo con la definicién es: a= P(rechazar Hy si es verdadera) Tratemos de escribir a en forma equivalente. Segin 1a regia de decisién, rechazar H, sig- nifica que € > A. Adends, si li, es verdadera, sa- bemos que € % N(0;1). Lueno: a= P( © 2A sie ¥ N(0;1)) Podemos representar préficamente a como el rea a la derecha de A debajo de la funcién de densidad de c, que es una N(0;1), F(z) Teniendo en cuenta la notacién que usamos siempre es: a En consecuencia, la regla de decisién es: sic 22%, , entonces rechazamos Hj. 0 fo Puesto que el investigador fija a y busca el valor % en la tabla correspondiente, la regla de de- o 187 Q nin. 262 par. 93 168 cisién queda perfectamente determinada. Decimos que la zona de rechazo es: {e/e2 a, } Si tenemos que decidir entre Hone HW ucu, procedemos de manera anflora, Rechazaremos H) si X¥ << uy, es decir, si € toma valores negativos de valor absoluto muy grande. Debemos determinar B tal que, si € < -B, rechazamos ll,. Reemplazando en la definicién de ae a= PC € ¢ -B sie V N(O;1) ) Gréficamente a representa el 4rea a la izquierda de (-B), debajo de 1a funcién de densidad de la N(051). Como la curva es sim&trica, el frea a la izquierda de (-5) es igual al rea a la derecha de B, Luego B = Z, y 1a zona de rechazo es teres =a) Si tenemos que decidir entre Ho) w= uy ee) Uae rechazarenos il, si X se aleja de u, hacia 1a de- 169 recha o hacia la izquierda, Fs decir, cuando los valores de € tengan valor absoluto grande, inde- pendientemente de su signo. Debemos determinar C de manera tal que rechacemos H, si € > C 6 si eg -c. Reemplazando en la def ici6n de a es: a=PCercbcs eee eens Gr&ficamente a representa la suma de las 4reas a la derecha de C y a la izquierda de (=C), debajo de la funcién de densidad de 1a N(031). Es decir, toda el rea marcada en el grafico siguiente: Como la curva es simétrica,.el 4rea de cada una de las colas es la misma, en consecuencia es a/2 y resulta C = 2,,. la zona de rechazo est {esferxz 6 eg - } 0/2 Usando el valor absoluto de ¢, la podemos escribir en forma equivalente: } Ces lel > 2,5 A continuacién resumiremos todo lo visto sobre el test de Gauss, 170 Modelo Test de x N30) Sauselpere @ conociea una media Hg) Meu, ~ (031) si Hl es verdadera o Mtn Hip$tesis alternativa Se rechaza Hy Ss ay) ue My ee Hy) wcuy eg -2y Hy) ou lel Zaz. Al test en que es Hj) u # Uy se lo llama test de dos colas vy @ los otros, test de una cola. Desarroliarenos un ejemplo en forma deta- liada, donde seguiremos los pasos enunciados an- pap. 164 teriormente e indicaremos cada uno con el nfimero correspondiente, EJEMPLO 2 par. 163 [1 director del laboratorio del ejemplo 1, tom$ una muestra aleatoria de 25 personas, les administr6 el antiécido de la propapanda y obtu- vo K = 18 minutos. Se sabe que la varianza pobla- cional es 36 minutos”, Con un nivel de significa- cién del S$ équé decisién tomaré el director del laboratorio? 1,+ Sea la variable aleatoria: X = tiempo que tarda el antiacido de la pro- paganda en calmar la acidez estomacal. 2.- Suponemos xv NCu30) 2 o 36 minutos? 3 luero, 6 es conocida. 3.- Las hipétesis que planteamos en el ejemplo 1 son: > 15 Ho ug 15 Hy) > 15, De aenordn con 4y= Aplicames 21 cumplen Las Con in eval at 45 sechazamce Hy ° y+ Ea la muestia es pn 28. El valor que tema viable aiestovia & en nuestra muestra particular ast esta pachazar 8.~ El director del laboratorio decide hacer jui- cio acusando de proparanda ccsleal. 2Cudl es la probabilidsd de tomar wna foc sién equivocada? Come ya decidié rechazar » la Gnica manera ° de equivecanse es que sea verd, were canse Ls £ Plequivocacs ) = P(vechazar KH) siendo varda- deray = @ > 6,05 Siempre que se toma la decisisn de rechzar H). la probabilidad de suivecars eontroiads por 2 expe ja previamante, ces utado Sobre ic base de la convensién dada cc 179 aS | pSx. 165 dad en If 7 in el problema original las hipdtesis eran: Hows 18 Hy we 45 ys de acuerdo con lo convenido, pusi Wy) ws 45 Hwee as qué hicines reibued obtener la zona de rechaze. Pero, sabiamos que Tomnando H,} 18 y suponiendo MN, verdade- ra no conociamos ia disvribucién de ©, pero ot La funcién de densidad de € dependerd do vu. Siw = 18, es © % (0531), y su grdfico tendrd eje de simetrfia que pasa por el origen. Siu < 15, cl eje de simetrfa pasa por BuESeise o/vn que, por cer negative, esté a la iz- quierda del oripen. El gr&fico de la funcién de densidad de ¢ sera La zona de rechazo es { €/ © > 1,645 }. El verdadero nivel de significaci6n del test Nod u sg 15 Wu > 28 es PCerror de tipo 1) = P(rechazar Hj si es verdade~ ra) = P(e 2 1,645 si es u < 15) = frea de la repién rayada en el prafico En el pr&fico pedemos ver que el Area marca- Ua es menor que el area a la derecha de 1,645 de~ bajo de la N(O;4), y @sta es a = 0,08, En consecuencia P(error de tipo I) ¢ a Con esto justificamos el use de la convencién, ya que el verdadero nivel de significacién del test resulta menor, o a lo sumo igual aa, Por lo tan- to, si nuestra decisién es rechazar I, es P(equivocarnos) < a Volvamos al ejemplo 2. Se utiliz6 un nivel de significacién a = 0,05 y ie conclusién fue rechazar Hj. Decimos entonces que > 25, y la probabiiidad de equivocarnos en la afirmacién es menor que 5%, Nos preguntamos: épodremos afirmar lo mismo con una probabilidad de error menor?. Para res- ponder a la pregunta fijemos a = 0,01. Rechaza- mos H si Bq = 2 og = 2,926 in la muestra resulté : > €, = 2,5 > 2,326 Por lo tanto, la decisién también es recha- Hy+ Se dice que es u > 45, y la probabilidad de equivocarnos en la afirmacién es menor que 1%. En este caso nos convendrd trabajar con @ = 0,01 pues decidimos con menor probabilidad de error, Serfa muy Gtil poder afirmar lo mismo, es decir rechazar ly , con una probabilidad de error que fuese lo m&s°pequena posible. zar Liamamos nivel justo de significacién al me- nivel nor nivel de sipnificaci6n con el cual se rechaza de sinnifica Lo indicamos P. Noe cién, P 174 Propiedad de P Como consecuencia de la definicién es valida la siguiente propiedad: Si con nivel de significacién a se rechaza » entonces es P< a, ee za Hj, entonces es P > a. EJEMPLO 3 Hallar el nivel justo de significacién el ejemplo 2. De acuerdo con la propiedad enunciada, con a = 0,01 rechazabanos H,, podemos decir es P< 0,04 Pero veamos cémo determinar exactamente P es el menor nivel de significacién con el se rechaza H. Teniendo en cuenta el test que usamos, zona de rechazo, para cada a,era fever} con nivel de significaci6n a no se recha- en que Py cual El valor de ¢ obtenido a partir de la mues- tra fue emieecns Si H, es verdadera, € V N(0;1) y su funcién densidad es de 175 Teniendo en cuenta la definici6n es: ao = P(e 2 Z, siendo ¢ ~ N(O;2) ) El menor nivel de significacién con el cual rechazamos li,, lo lopramos fijando como zona de rechazo { e/ © 2 2,5} El nivel justo de significaci6n P serd en- tonces P= PC © 2 Z) siendo © ~ N(0s1) ) 2PCZ 22,5) 24-72 2,8) = = 2 - F(2,5) © 1 = 0,9938 = 0,0062 Por consiguiente es P = 0,0062, y evidentemente result6 P < 0,01. Consideremos el test de Gauss de una cola Wwe uy Hy > uy El estadistico de prueba es: R-u es or y, fijado el nivel de significaci6n a, la zona de rechazo es: Cese2rz,} 176 a pag. 162 ucémo determinamos 6 y 1a potencia? Sabemos que 8 = P(aceptar H, si es falsa) Acoptar Hy significa que € no cae en la zo- na de rechazo, es decir que, e< 7, ‘a Luego Be Ple < a, si ll, es falea) H, false significa que es 1 > uy. En consecuen- cia B= Ple <2, sies u > ud Para calcular esta probabilidad es necesario co- nocer la distribucién de € si es u > u Vimos que vew evn ost ova > u > Uy, entonces ap wesw E(e) = 2 > 9 oly La funcién de densidad de € depende de u, Siu sul, € % N(Os4) y el ofe de simetrfa pa- sa por el orinen. Siu > u, el eje de simetrta est& a la derecha del origen por ser E(e) > 0, Yi By Une, 177 Observendo el préfico de la funcién de den- sidad de € para ambos casos, analicemos las dos probabilidades de error a y 8. a = P(rechazar Hy sies verdadera) = = P(e > 2%, siesu =u.) = &rea a la derecha de Z, debajo de la funcién de densidad que corresponde au = uy = = Srea de la regi6n marcads en el graé- fico. B= P(e u,) = &rea a la izquier- da de zy debajo de la funci6n de densidad que corresponde ay > uy = = &rea de la regién marcada MQ en e1 grs- fico. Veamos ahora cémo sefialar la potencia Tl, De acuerdo con la definicién es: Re i- + P(rechazar Hy siendo falsa) = q pag. 162 = P(e y ay siendo u > uy) Graficamos, como antes, la funci6n de densi- dad correspondiente a wt = Veyau > vy y marca~ mos el mismo Z,. 178 P(e 2%, siendo > uy) = Sea a la dere- cha de 2, debajo de la funcién de densidad que corresponde ay > uj = area de la reg marcada en el grafico, Anaticemos cémo varia * ‘ara distintos valo- res del parametro desconocido p. Consideremos primero el caso en el que el verdadero u esta cerca de u.. En este caso, el valor ée 7 Ele) = ol estar préximo al orien, y en consecuencia, la funeién de densidad de ¢ estar cerca de la (052). ni yyy, u cerca de 1, Vimos qu 8 = area a la izquierda de %, debajo de la funci6n de densidad que corresponde a w > uy = area de la repién marcada en el grafico, Observamos que B resulté muy prande, mayor que 0,50, 179 Consideremos ahora el caso en el que el ver- dadero wy est& lejos de uw). El valor de E(e) est& lejos del origen, y la funcién de densidad de € se aparta bastante de la N(O;4). si uty, si uu, uw lejos de uy o Tomamos ¢1 mismo valor de a que antes, por lo tanto no cambia Z,. 8 = Srea a le izquierda de 7, debajo de le fun- cién de densidad que corresponde au > = frea de la regién marcadae WY . ° Observamos que B result6 muy pequefia, inclu- 80 menor que a. Resumiendo podemos decir que: Si e1 verdadero u est& cerca de u, resulta- v& 8 grande. Es decir, hay mucha probabilidad de equivocarse aceptando Ne siendo realmente falsa. Propiedad Si el verdadero p esté lejos de wu, resulte- core v8 B pequefia, Es decir, hay poca prohabilidad de acepter H, si en realidad es falsa. £1 sentido comin confirma estas conclusio- nes. En efecto, si tenemos que decidir entre Ho) w= 20 Hy) w > 20 y el verdadero valor de ves 50, Kno estar muy 180 alejada de 50 y rara vez nos equivocaremos di- ciendo que H, es verdadera. Fn consecuencia & se- r& pequefia. En cambio, si el verdadero valor de ji es 20,5, es muy probable que nos equivoquemos acep- tando ay cuando en realidad es falsa, En este ca- so ® ser prande, Como es desconocido no sabemos si 8 resul- taré pequefia o grande. Para poder calcular 8 hay que fijar un valor de u en la hipdtesis alterna- tiva, EJEMPLO 4 En el ejemplo 2, calcular la probabilidad de cometer error de tipo II y la potencia del test, siendo: a) us 16 b) us 19 a) Repasemos el test del ejemplo 2. Vimos que X = tiempo que tarda el antiaeido de la pro- Papanda en calmar la acidez estomacal. Suponfamos Xa N(u3o) 5 Gg -= 6 minutos Las hipétesis eran jo) R= 48 Hy) w> 45 El estad{stico de prueba € 25. (031) si HL es oe ° verdadera, La zona de rechazo para a = 0,05 era te/e 2 7, = 1,645} Calculemos ahora 8. Segfn la definicién es: 8 = Placeptar H, siendo falsa) Aceptar H, significa que € no cae en la zona de rechazo, es decir que es © < 1,645 Por otra parte, H, falsa significa que Hy 18a es verdadera, o sea que > 15. Ya dijimos que para poder calcular ® debfamos fijar un valor en la hipétesis alternativa. De acuerdo con nuestro enunciado es u = 16, Luepo B= P( € < 1,645 siendo y = 16 ) Debemos calcular esta probabilidad. Reempla- zando € y los valores 0 = 6 y n = 25 es p= r(X=48 <4 bus siendo wp = 16 6/¥25 Despejamos X 8 = PC = PC ¥ < 46,974 siendo u = 16 ) Ahora estamos ante un problema conocido. Te- nemos que calcular la probabilidad de que X sea menor que un nfimero,siendo X una variable aleato- ria normal, Como XV N(W39) yu = 16,02 6 por la propiedad 5.4 sabemos que a page 126 ~ u(051) Luego, estandarizando ¥ es: B= Pp (Rabe 26974 serge s 16) = on ol 6/v75 F(0,81) = 0,7910 ve tatty a a cones ys la potencia es M = 41-8 = 1 - 0,7910 = 0,2090 b) Calcularemos 8 fijando » = 19 en la hi- potesis alternative, Repitiendo los mismos pasos que antes es: 182 q pans. 176 y 177 B = Placeptar i, siendo falsa) P( € < 1,645 siendo uy = 19) = P 45 < 1,645 siendo » = 19) = 6/VES P( ¥ < 16,974 siendo y= 29 ) Pero XV N(N30) con = 19 ya = 6 entonces Ea d8 a cosa) 6/VEE Luero pf E248 < 16.974 - 19 6/V35 6/8 PC % < -1,69) = T(-1,69) = 1 ~ F(1,69) = 1 = 0,95u5 = 0,055 y la potencia es Ts 4 +8 = 1 - 0,045 = 0,955 Observamos que se cumple la propiedad an- tes enunciada. Fijando vy = 16, obtuvimos un va- lor grande de @ = 0,7910, y para u = 19, que se aleja del valor de la hinétesis nula, resulté 2 = 0,0455 que es pequena, Analicemos ahora qué relacién hay entre a y 8 cuando n es fijo. Tomemos un valor a, La zona de rechazo es {eserz, } De acuerdo con lo visto anteriormente, podenos praficar la funcién de densidad de € y deter ninar B= PC ee zy sies vou.) si wey, LS Wore Veamos qué sucede si achicamos a , es de- cir, si tomamos un valor a! < a, En este caso resulta > at Bey he <2, i POOR GG, Olcom oth Dp Como n no cambia, tampoco lo hace €, Entonces la representaci6n gréfica de la funcién de densidad de € es la misma que antes: si usu, si wy, NN N at 8B Vises N Observamos que B' > B, es decir que la pro- babilidad de cometer error de tipo II aumenta. 184 Propiedad de ay B Propiedad de Byn Podemos enunciar la sipuiente propiedad, que hemos verificado graficamente para al test de Gauss de una cola, pero es valida para cual- quier test de hipdtesis: Sines fijo, cuando disminuye a , aumenta 8 , y cuando aumenta a disminuye 8, También podemos decir que: Sia es fijo, cuando aumenta n disminuye 8 y, cuando disminuye n, aumenta 8. La Gnica manera de disminuir simultaneamen- te ambas probabilidades de error, a y 8 , consis- te en aumentar el tamafio de la muestra, A manera de ejemplo, se calculé la potencia I, y la probabilidad de cometer error de tipo Il, 8, para distintos valores de ay de n. En todos los casos se consideré XUN) » oF 6 y el test Ho) we a5 Hy) > 45 fijando en la hipétesis alternativa el valor wee 46, Los resultados obtenidos fueron: o 8 1 25 0,05 0,7910 0,2080 25 0,04 0,9319 0,0684 100 0,05 0,4920 0,080 100 0,01 047454 0,2546 Los resultados del primer renglén se obtu- vieron en el ejemplo 4, Los restantes se calcu- lan en forma an&loga y pueden quedar como ejer- cicio para el lector interesado, In el cuadro se observa con claridad que se cumplen las dos propiedades anteriormente enunciadas, 7.3 TEST DE STUDENT PARA LA MEDIA DE UNA VARIA- BLE ALEATORIA NORMAL CON VARIANZA DESCONOCI- DA Supongamos que Xx MQi3g) y 0 es desconocida, Tenemos dos par4metros desconocidos, y 0, pero planteamos hipétesis acerca de u. Usando la convencién dada anteriormente, los Gnicos tipos de hipétesis que se nos pueden presentar sont = > Ho) we uy Hy ur ny : eal Howey Hyun, Ho) we uy Ayu tus donde 1, es un aGmero fijo que depende del problema, Para decidir entre las dos hipétesis se toma una nuestra de tamafio n de X, Los estimadores puntuales de los dos pardémetros desconocidos uy o son Gss a El estadfistico de prueba que se utiliza en este caso es Como X y § son variables aleatorias, © es una variable aleatoria, Para determinar la zona de rechazo debemos conocer la distribucién de € si ll, es verdadera, En ese caso es u = II Por la propiedad 5,11 sabemos que: : pig. 135 —Pevety sir " si XV N(30) entonces Luego: si es ver ~ ay dadera, © % ty Consideremos el problema en el cual tenemos que decidir entre 186 Ho) we uw Hy) > ny ° Rechazaremos i, cuando XK tome valores mucho mayores que U,, es decir, cuando € tome valores grandes, Debemos determinar A tal que: sie >A rechazamos Hy. Por definicién sabemos que a = P(rechazar H, si es verdadera) Luepo a PC e 2A sil, es verdadera) o PCe 2A siervti 4) En consecuencia, podemos representar grafi- camente a como el frea a la derecha de A, deba- jo de la funcién de densidad de 1a t, 4. De acuerdo con nuestra notacién es Art agnad Luego, la regla de decisién sera: sie rt, réchazamos Hy 107 Si tenemos que decidir entre HO) web H < ° ° » YW Mo Fechazarenos 1, cuando F sea sucho menor que », es decir si € toma valores nepativos de valor absoluto grande. Debemos determinar B tal que si €€-B rechazanos Hy. Reemplazando en la definici6n de nivel de signi- ficacién es = €-Dsie% OG GG sy oot y Luero a representa el Srea a la izquierda de (-F), debajo de la funcién de densidad de la t,_y. Entonces, como la curva es simétrica, e1 frea a la derecha de B también vale a, luego Be toned y la zona de rechazo es fer e<- tyniat 188 Si tenemos que decidir entre wee uy Ww eas rechazarenos H, si ¥ se aparta mucho de u,, es decir, si € toma valores con valor absoluto gran- de. Pebemos determinar C tal que » Pechazamos Ho. icién de a es: d Reemplazando en la defi ed oee (cle) Cla0 uc a 7 iewt c siewt, @ vepresenta la suma de las freas a la derecha de Cy a la izquierda de (-C), debajo de la fun- cién de densidad de la t, 4. Como la curva es simétrica, las dos 4reas marcadas son iguales. Por lo tanto el Srea a la derecha de C es a/2 y resulta © = tayagnat Luepo, la zona de rechazo es Ceser tayayn-a 8 & + S “Tayasn-t Escrita en forma equivalente es: { e/ Jel > tayayner } 199 Efectuemos un resumen del test de Student Para una media. [ste test se usa mucho més Fre- cuentemente que el de Gauss pues, en la investi- gaci6n experimental raramente se conoce la varian- za de la variable aleatoria, odelo xv N(u30) Test de © desconocida Student para una media Ho) ou es Coto A thy st Hy es verdadera sit alternativa Se rechaza H, si Mo © 2 tained nyu< © € tend Huey > tapout EJEMPLO 5 Se sabe que el tiempo que dura el efecto de un hipoglucemiante es, en promedio, 6 horas. Un investigador sintetiz6 un nuevo hipoglu- cemiante, y sospecha que el tiempo medio de dura- n de su efecto es mayor que 6 horas. Se lo ad- inistr6 a 10 diabéticos voluntarios y obtuvo 0,64 hs, n. ¥ = 6,3 hs. y 6 El investigador quiere decidir, con un nivel de sipnificacién del 5%, si es cierta o no su sos- pecha, Sea X = tiempo, en horas, que dura el efecto del nuevo hipoglucemiante. Suponemos Xv N(u3a), ll = tiempo medio de duracién del efecto del nuevo hipoglucemiante, O es desconocida, y admitimos que se cumplen las condiciones del modelo del test de Student para una media, 190 Regla préctica El investigador sospecha que u > 6, Tiene que decidir entre us by n> 6 ecémo plantea Hy y Hy? Veamos cuél riespo quiere controlar, No olvidemos que, de las dos probabilidades de error, « la fija el experimentador y B es des- conocida, Si la decisién es > 6, el investigador conunicara a la comunidad cientifica el hallazgo de la nueva droga, informando que el tiempo me- dio de duracién de su efecto es mayor que 6 hs. es decir, u > 6, En ese caso la probabilidad de error es P(comunicar up > 6 y en realidad es u << 6 ) Si el investigador es responsable pretende- r& que esta probabilidad de error sea pequefia; luero pondra a = P(decidir que » > 6 y en realidad es » < 6) Puesto que a = P(decidir que vale H, si es H, verdadera) pondré 1 > 6 en ly yu < 6 en HO. Como, por 1a convencién adoptada, ponemos Gnicamente la igual- dad en H,, las hipétesis son: duse6 Hy) w> 6 Observemos que la sospecha del investiga- dor 1a pusimos en H,, Como regla general para plantear las hipétesis podemos decir que: la conclusién a la que se quiere llegar con po- ca probabilidad de error se pone en la hipéte- sis alternativa, En este caso, el investigador, para poder publicar su hallazgo, quiere estar relativamen- te seguro que es u >'6, por lo tanto lo pone en ly. 1 Una vez planteadss las hipétesis, dehe efec- tuar el test para tomar su decisién, El estadistico de prueba es 194 y si, es verdaderac wt, Se rechaza H) si © > s ch Hy GO ron En este caso es a = 0,05 y n = 10, Buscando en la tabla correspondiente se ohtiene: *asn-1 * to,05 ; 9 ~ 11899 Notar que, si la tabla da los valores t,,. y no as los t, , para hallar ty hay que buscar t 0s 0,10/2° si Se rechaza En la muestra n= 10 5 = 0,64 El valor de © para la muestra es: : B . 813-= 6 5 a iuge slvr 0,64//T0, como e, = 1,82 # 1,039 no est4 en la zona de rechazo y la decisién es no rechazar H. éCu4l es la probabilidad de tomar una deci- sién equivocada? Como la decisién es aceptar HJ, 1a Gnica ma- nera de equivocarse es que H, sea falsa. Luefot P(equivocarse) = P(aceptar H, siendo falsa) B = desconocida Si, al no rechazar Ii, , el investigador afirmase que es Ww < 6 , no sabrfa cul es su pro- babilidad de error, y ésta puede ser muy grande. En consecuencia, no puede asegurar nada. Por lo reneral, en estos casos la conclu- sién se expresa diciendo que: "y no es sipnificativamente mayor que 6" s decir, que: "el tiempo medio de duracién del efecto del nuevo hipoplucemiante, no es significativa- mente mayor que 6 horas" Quiere decir que, con una prohabilidad de error menor que 5% , no se puede asegurar que sea ieee 192 Cyn. 142 7,4 PRUEBA DE HIPOTESIS MEDIANTE UN INTERVALO DE CONFIANZA Podenos observar que, los fundamentos nate~ néticos utilizados en los test de hipétesis, son los mismos que en los intervalos de confianza, Es muy frecuente que un investipador quiera estinar un par&metro con un intervalo de confian- za, y adem&s efectuar un test de hipStesis para a. En algunos casos, cuando se dispone de un intervalo de confianza para un par&metro descono- o 6 , es muy sencillo realizar un test de hi- pétesis acerca de 8. Todemos enunciar la siquien- te propiedad. PROPIFDAD 7.2 Sean: © un parémetro desconocido. (Uysh,) un intervalo de confianza para @ con nivel de confianza (1-a), 8, un valor conocido, Si se plantean las hipétesis HO) 8 =e, H,) 6 #8, y se toma como regla de decisién rechazar H, si @, € (hsb) Entonces, este test tiene nivel de significacién a. Demostracién: Usando la definicién de intervalo de confian- za es: PC by <8 < by) = deo Por otra parte, el nivel de sipnificacién de un test es la probabilidad de rechazar Hj si en realidad es verdadera, En este test es: nivel de gnificacién = P(rechazar H, si en realidad es verdadera)°= = P(8, € (LysL,) si es H, verdade- ra) = 193 PCO, # (Lysb,) si es @ = 6) ) PCO € (ysl) ) = = 1- PC 6 (hy3b,) ) = 1+ (ia) = a Luego, el nivel de significacién es a. (c.q.d.) Notar que esta propiedad la podemos utilizar Gnicamente cuando queremos realizar un test de dos colas de nivel a, y disponemos de un intervalo de confianza de nivel (1-a), EJEMPLO 6 ejemplo 2 del capftulo 6, desea decidir, con un nivel de sipnificacién del 5%, si la temperatura media de los conejos después de dos horas de ino- culados con 10 mg de droga, difiere significati- vamente de 37°C, El investigador que inoculé los conejos del péx. 148 La variable aleatoria era: X = temperatura en °C, de los conejos a las dos horas de ser inoculados con 10 mp de la érora. Se suponta X ~ N(u3a) y se obtuvo el sipuiente intervalo de confianza para ut C( 37,77 0% Rechazaremos li, cuando S* sea mucho mayor que o2 , es decir , cuando € tome valores grandes. De- bemos determinar A, de modo que, si € % A recha- zamos ° Si a es el nivel de significacién, es: a = P( rechazar H, siendo verdadera) : 2 > ~ a= PC ERA siendo ev x, ) ~ a es el Grea a la derecha de A, debajo de la fun- . cién de densidad de la variable aleatoria x2, ~ a ~ A - De acuerdo con la notacién que usamos es g pap. 130 2 : B® Xasned En consecuencia, la zona de rechazo es: Si tenemos que decidir entre = 2. G2 7 lo) FF 9G Hy) 5 rechazarenos #1, cuando 8? sea mucho menor que o? © sea, cuando € tome valores pequefios. Debemos determinar B de modo que rechacemos I, sie < B. En este caso es ° a=P( eg Dsieryx ) n= Gr&ficamente a representa el rea a la izquier- da de B, debajo de la funci6n de densidad de la variable aleatoria x24. Como el area total debajo de la funcién de densidad es 1, resulta que el frea a la derecha de Bes (i-a). En consecuencia, de acuerdo con nuestra notacién es: 2 Xt-asn-1 y la zona de rechazo es: 2 fe ses Xqeagnea } Si tenemos que decidir entre 2 2 2 HD) oF Hy) 0% #05 rechazarenos H, cuando 8? aifiera mucho de 0? , es decir, cuando € tome valores muy pequefios o muy grandes, Como la funcién de densidad de € no es simétrica, debemos determinar dos nfmeros Cy D, tales que rechacemos KH, sie ¢ C 6 si € > D. Resulta: 7 ed Gri G4) v 9 si ev xy 197 tomamos © < D, los sucesos . {ev ect} y Les e>d} - son mutuamente excluyentes, luego: 2D si Bore) a representa la suma de las Sreas, debajo de la funeign de densidad de la x2_y, 2 1a izquierda de A z ¢ y a la derecha de D, Podrfamos tomar cualquier par de nGmeros C y D que cumplan con l&condicién que la suma de las Areas de las repiones marcadas en el prafico sea a Por comodidad, para que estén unfvocamente determinados, convenimos en que cada una de esas : Sreas sea a/2. : Luero, el area a la derecha de D serf a/2 y, segGn nuestra notacién es -y? DF Xayosn-4 - También el frea a la izquierda de C es a/2, y en consecuencia, el frea a la derecha de C es (1-a/2), Resulta entonces: 2 ~ © = Xtas/2sn-4 Luego, 1a zona de rechazo es: 198 Test x? para una varianza 2 2 fe Lee xayaynea & © € Xtay En resumen, el test x? para la varianza es: Modelo: xv N50) : 2 2 Hn) 0? = 02 3 ee Gos ~ ey si ll, es verdaders 8 Hip6tesis alternativa Se rechaza Ky s 2 2 % Ute Xagnet 2 2 %9 ls Xqeasnet 2 2 0 £2 Xasasnet 8 2 © S$ Xteasasn-a EJEMPLO 7 Se envasan autom4ticamente sobres de sal de fruta euyo contenido medio es 10 f. Si la varianza del contenido de los sobres es mayor que 0,2 47, se debe parar el proceso de envasado para proceder a su ajuste, Se tom una nuestra de 15 sobres, se pesé su contenido y se obtuvo He 10,2g , s2 = 0,38 Con a = 0,05, decidir si se debe ajustar el proceso. Sea X = peso en gramos del contenido de los sobres. Suponemos Xv NCu30). Es Var(X) = 0%, Se pararé el proceso si a” > 0,2. Luego, las hipStesis que debemos plantear son: Po) 9? 2 9,2 nD) a? > 0,2 El estadistico de prueba es ve Ga A v2, si il, es verdadera. La zona de rechazo es 2 Cererxy ) En este caso es p= 45 a = 0,05 Buscands en la tabla correspondiente obtenemos Kagnea ~ Xazosgan © 23988 Se rechaza I ai € % 23,808, Para tomar ta deciei6n caleulames et valer del estadistion obteuide a partir de la muestra ob ae foeap at + M92" oaye Como fy = 28,8 > 72,805 , 1a deciaién ex recha- zar ft Decidimos que a? > 0,2 y la probabilidad de squivacarnna es manor que 0,05. En consecuencia, se decilirf parar el proceso de envasado para provedor a su ajuste. 7.6 TEST DE GAUSS PARA UNA PROPOPCTON Nuchas veces, en aplicaciones biomédicas, apa- reves sipfcests acerca de proporciones o porcenta Ts ry. por ejemplo, proporcién de curades, jor rentate te individues con reaccién alérgica a una Aeona, peonareif@n de muertos por accident fin todas esas aplicactones hay implfeite un expactnonto de ternoulli, y las hipétesis se vefie ron a ta praporeifie de étitos. et ‘ea ol parAmeten desconovide f° proporeién de éxitos = probabilidad de Brito, 200 Gg pag. 153 C] pae. 154 g vin. 08 Las hipStesis que se plantean pueden ser: Ho) pe Py Hy) p> py dpe HO p< py Hy) PEP, Hy) Pp # Py donde p, es un valor conocide. Para estimar p deberSamos repetir el expe- rimento n veces y contar el nimero de éxitos, de la misma forma como se hizo para el intervalo de confianza, Sea la variable aleatoria X = n@mero de éxitos en n repeticiones inde- pendientes del experimento de Bernoull X~ B(n3p). El estimador de p es ae Para poder realizar el test, supondremos adem&s que mp > 5 y n(t-p) > 5. El estadfstico de prueba es e-——— 2 \Poct-P.) Para determinar la zona de rechazo debemos cono- cer la distribucién de ¢ si H) es verdadera, Por 1g propiedad 6.1 sabemos que la distri- bucién de P se aproxima a una cp 5 (PEE Estandarizando, por la propiedad 3.8, la varia- ble aleatoria Bop. Pop Pee vpti-p) a sigue aproximadamente una N(031). SiH, es verdadera, es p=p, y esta variable aleato ie coincide con €, En consecuencia, pode- 204 mos decir: si il, es verdadera, € % N(031) con &% indicamos "sigue aproximadamente". El hecho que la distribucién de € no sea exactamente N(03;1), traer& como consecuencia que el test que se obtenga sea aproximado. Se dice que el test de Gauss para una proporcién es un test con nivel asintético a. Fso quiere decir que e1 nivel de significacién del test no es cxacta~ mente a , sino que se acerca a a cuando n tien- dea Si tenemos que decidir entre: > Ny pee Hy) p> py rechazaremos i, cuando € tome valores grandes. Us decir, dehenos® determinar A tal qu sie 2A rechazamos II, Como a= PC © 2A sit, es verdadera) es a=PC ERA sie %N(O51) ) y resulta: Luero, la zona de rechazo es Ces ered Las zonas de rechazo correspondientes a las otras hipétesis alternativas, son las mismas que las del test de Gauss para una media, y se ob- tienen en forma an§loga. Enuneiaremos a continuacién, en forma resu- nida el vest de Gauss para una proporcién Model X = nfimero de 6xitos en n repeticiones in- st de dependientes de un experimento de Ber- joss noulli. 2eeS a xv B(nsp) proporcsé probabilidad de éxito = proporeién de éxitos 5 n (4-p) > 5 Bboy 202 7 Yo % (031) si B, es verdadera VP,G=p) Hip6tesis alternativa Se rechaza I, si EJEMPLO 8 La droga que se utiliza habityalmente pa- ra curar cierta enfermedad es efectiva en el ~ 80% de los casos. Un médico quiere poner a prueba otra dro- ga. La administra a 120 enfermos, y obtiene que se curan 108. Desea decidir, con a = 0,01, si la nueva dropa es més efectiva que la tradicional. 7 X = nfimero de enfermos que se curan a entre 120 que reciben la nueva ~ dropa. X ~ B(n3p) donde n = 120 P = probabilidad de curarse con la nueva droga = proporcién de curados E1 médico quiere decfdir si la nueva droga es mas efectiva que la tradicional, es de- cir, si cura en m&s del 80% de los casos. - Luego planteara las hip6tesis Hg) p = 0,80 Hy) p> 0,80 = Para poder aplicar el test de Gauss para e una proporcién, se deben cumplir las condicio- nes del modelo, Luego debe ser np>S y n (isp) > 5 Como p es desconocido, probamos si se cumplen las condiciones con su estimador. En la muestra es %. 108 2g 9 wn” To * &s* p nop = 120, 0,9 = 108> 5 n (4-p) = 120, 0,1 = 12> 5 Admitimos que se cumplen las condiciones del modelo y aplicamos el test, El estad$stico de prueba es: eo = Ak ee e053) oi we Vo,8 (i-0,8) verdadera la zona de rechazo es >Z = 2 = } Cesc > 2, = Zo 4 = 25326 Calculamos e] valor de € en la muestra a = 2,739 W5,8. 053 Como €, = 2,739 > 2,826 est& en 1a zona de re- » se rechaza H.. ° Luepo es p > 0,80 y la probabilidad ée vocarse es menor que 1%. El m&dico informaré que la nueva dro efectiva en més del 80% de los casos, y la proba~ bilidad de error es menor que 1%. En consecuc cia, la nueva droga es ms efectiva que la tra- dicional con a < 0,01, 7,7 PRUEBAS DE HIPOTESIS PARA DIFERENCIA DE MEDIAS Hasta ahora estudiamos varias pruebas que se utilizan para decidir entre hipétesis en las que interviene un Gnico parametro poblacional. Pero, frecuentemente, se presentan hipétesis en las cuales aparecen dos parametros y, por lo tanto, debemos estudiar los test necesarios pa- 204 ra decidir entre ellas, En ciertas investigaciones se pretende verifi- car, por ejemplo, si los efectos de dos tratamien- tos son distintos, si el porcentaje de muertes por accidente es mayor en una ciudad que en otra, si dos métodos de medicién difieren en su precisién, si una droga no produce el mismo efecto en hombres que en mujeres, etc. Para resolver estas cuestiones es necesario plantear hipétesis estad{sticas en las que inter- vienen dos paraémetros poblacionales. Supongamos que en un criaderp se quiere estu- diar si el agregado de vitamina Cal alimento tra- dicional, produce mejor efecto sobre el engorde de los cerdos. Para ello, luego de un tiempo determinado, se medir§ e1 aumento de peso que se produce en los cerdos que reciben el alimento tradicional, y el de los que reciben el agregado de vitamina C, Se definen las variables aleatorias: X, = aumento de peso de cerdos que ingieren el alimento tradicional durante 30 dias. X, = aumento de peso de cerdos que ingieren el alimento tradicional con agregado de vita- mina C durante 30 dias. Si E(%1) = y E(X)) = Hy 4 = aumento medio de peso de cerdos que in- gieren el alimento tradicional durante 30 dias. 2 = aumento medio de peso de cerdos que in- gieren el alimento con agregado de vita- mina C durante 30 dfas Para estudiar si el agregado de vitamina C produce mejor efecto sobre el enporde, hay que comparar los aumentos medios de peso que produ- cen. En este caso se plantean las hipétesis: La forma mas general de plantear la hipétesis n la es: Ho) wy - wy ea donde a es un nfmero fijo que depende del proble- ma. En este caso, y en la mayoria, es _ Para decidir entre hipétesis de este tipo utilizan los llamados "test para diferencias dc medias", En todos ellos se supone: 2 "G1 304) © W(19305) pero, cada uno de ellos se basa en un modelo dis+ tinto. In el caso del criadero, se tomarfn dos mues- tras de cerdos. Una tendr& ny animales elegidos al azar, y la otra tendraé ny animales, también vleni- dos al azar y distintos “de los anteriores, Los ny animales recibiran el alimento tradi- cional, y al cabo de 30 dfas se les medira el av- mento de peso. & los otros ny cerdos se les dard @1 alimento con el agregado de vitamina C y tan- bién se observara el aumento de peso al cabo de 30 dias. Tendremos asf, una muestra de tamafo ny de ja variable aleatoria X,, y una muestra de tama- fio ng de la variable Xj, y las muestras son: ind 2 ay vendientes, El test que se debe aplicar para este prob. ma se basa, adem&s de la normalidad, en que las variables X. y X, son independientes, y que 1 roscras aleatorias de ellas también lo son. En este caso, como en la mayorfa de ellos las varianzas son desconocidas. Por ser mas simpir estudiaremos primero el test de Gauss, donde se consideran conocidas las varianzas, y luego *1 test de Student donde se suponen las varianzas desconocidas pero iguales. Para el caso en quc las varianzas son desconocidas y desiguales no hay ningfin test exacto. Hay veces que, por la naturaleza de 1 tigacién, no se toman muestras independientes. Supongamos que se desea estudiar si una dvc~ ga reduce la concentraci6n de colesterol en sangre. El investigador toma n personas al azar, les nide la concentraci6n de colesterol, los trata con la droga, y luego de cierto tiempo, les » nuevamente la concentracién de colesterol. Se puc- den considerar las variables aleatoria: X, = concentracién de colesterol en sangre an- tes de tratar con la dropa. X, = concentraci6n de colesterol en sangre des- pués de tratar con la droga. 206 Uso del test e Student para muestras apareadas si BCX.) = Wy E(X) = Uy las hipétesis que se plantean para estudiar si ja dropa disminuye la concentracién media de co- lesterol en sangre son: 2 1 Las muestras de observaciones de las varia- bles aleatorias X, y Xj no son independientes, pues se obtuvieron a partir de la misma muestra de individuos, En este caso se dice que las mues- tras son apareadas, Al tomar los valores experimentales, la muestra de observaciones se expresa destacando en qué individuo se efectué la observacién de la variable. En estos casos, para decidir entre Hy y Hy , se usa el "test de Student para muestras apare- adas",. Este test no se utiliza solamente cuando las variables se observan sobre el mismo individu, Por ejemplo, si para poder medir la variable X es necesario sacrificar al animal, a éste mismd no se le puede medir x, Si el investigador, por la naturaleza de su experiencia, quiere aplicar un disefio de mues- tras apareadas, puede tomar pares de animales con idénticas caracter{sticas, como por ejemplo, gemelos del mismo sexo, y a uno medirle X, y al otro X). Resumiendo, cuando se requiere un test para diferencia de medias de dos variables, que se miden sobre la misma unidad experimental o sobye pares de unidades experjmentales con idénticas caracteristicas, corresponde utilizar el test de Student para muestras apareadas. 7.8 TEST DE GAUSS PARA DIFERENCIA DE MEDIAS Supongamos que: ~ NCH 504) X,Y Ny305) y X son independientes y G, conocidas y_se presenta uno de los siguientes pares de hi- potesis: Ho) Wy Hy Fa Hy) ou - pa HA) wy wy =a ~ a rechazarem i 6 14) wy > uy > a rechazaremos H, si X, - ¥, toma valores mucho mayores que a, es de- cir, cuando © toma valores grandes. Por lo tan- to, hay que determinar A tal que se rechaza Hj sic >A Teniendo en cuenta el nivel de significacién es @= PC © >A si cv NCOs1) } buego yg - g o y se rechaza H, si c > Z,. Para las otras hipétesis alternativas se procede en forma anfloga a la del test de Gauss para una media y se obtiene: sies Hj) vy - bh Zaye 209 Test de Gauss para diferencia de medias Daremos un resumen del test de Gauss para diferencia de medias. Modelo: 2 ¥ NQ150,) 5 XQ v MCg30,) y X, independientes ©, ¥ 6, conocidas se toman muestras aleatorias independien- 2 X, y X) respectivamente. tes de tamafios ny y n, de las variables es verdadera ° Hipétesis alternativa Se rechaza ll, si Hy uy su >a cb 2 Ayu rugs a e< -2, Hwy = fa le] > ayo EJEMPLO 9 Un laboratorio tiene dos peachimetros, A y B, La desviacién estandar de las mediciones efec- tuadas con el A es 0,04, y con el B es 0,03, De una misma solucién se separaron 35 ali- cuotas. 11 de ellas se observaron con el peach{- metro A, y el promedio de los pil medidos fue 8,293, Las otras 14 se midieron con el B, y el promedio fue 8,316, Decidir, con a = 0,10, si, en promedio, las mediciones con ambos instrumentos son diferentes. Se definen las variables aleatorias: aaa X= medicién del pli de alfcuotas de la solu- cién con el peachfmetro A. XQ = medicién del pH de alfcuotas de la solu- cién con el. peachimetro B. Suponemos: xy Cy 5 Sita) X, y X, independientes De acuerdo con el enunciado es oO, = 0,04 a, = 0,03 es decir, 0, y 0, son conocidas. Las muestras aleatorias de X, y Xj son indepen- dientes, pues se observaron de distintas unidades experimentales (alfcuotas de la solucién). Se, quiere decidir entre: Ho) wy = Hwy #4, © en forma equivalente = ° Ry) uy - uy #0 Podemos utilizar el test de Gauss para dife- rencia de medias, pues se cumplen todas las con- diciones del modelo, El estadistico de prueba es Si Hl, es verdadera, € ¥ N(031) y se rechaza H, st lel > 2a/p Como a = 0,10, buscando en 1a tabla tenemos a/2 = 20,10/2 = 19845 Luego, si |e] % 1,685 se rechaza H, 212 De acuerdo con e1 enunciado, en las muestras es: ny = at %, a4 Fg 8,293 a 8,316 El valor de € para esas muestras es Poa 8,293 - 9,316 tes m ———=—== , (0,04)? , (0,03) Sy + Se : Puesto que le,! = |-1,588| = 1,588 ¥ 1,645 no se rechaza H.. Luego, coneluimos que no hay diferencias signi- ficativas entre u, y Wy. Podemos decir que, en promedio, las mediciones con ambos instrumentos no difieren significativamente, 7,9 TEST DE STUDENT PARA DIFERENCIA DE MEDIAS Supongamos que: xy ¥ NQy304) Xy ™ N(iy soy) X, y X_ son independientes Las varianzas son desconocidas pero iguales, por lo tanto es y se nos presenta uno de los siguientes pares de hip6tesis: Hy) uy - a Hy uy - uy ra i HO) wy - a Hy) wy - wy nan. aa %2 = So Pero, como las varianzas son iguales, hay uns Gni- ca desviacién est&ndar desconocida que debenos es- timar, y que llamamos o Tomamos como estimador de g a: o donde 2 2 2 2 Sa St y= Pp +n, - ny 272 s? es un promedio ponderado de 5? y 52, Si ios ta- mafios de ambas muestras son iguales, es el prome- dio de sus respectivas varianzas; es decir: 2 4 2 4 Veremos dos propiedades importantes que nos serfn ftiles para poder efectuar el test. PROPIEDAD 7.3 ~NQy30,) 5 X,Y NUHy305) xy y Ky independientes o,f 0,20 Se toman dos muestras aleatorias indepen- dientes, de tamafios n, y nj, de las varia- 244 4 pag. 129 bles X, y X, respectivamente, te) s?y 2. son sus varianzas * 2. (44.- 1) 82 + (ny - 1) 85 "PO nyt ny - 2 Entonces: (ny + Demostracién: Por ser 5.10 es oy utilizando la propiedad Estas dos variables aleatorias son indepen- dientes, porque X, y X, son independientes y las muestras también, Entonces, aplicando la propiedad 5.7, resulta que: - 1) 8? (i, - 1) 83 1, &% _ oe 2 (nyt) (nyt) © sea: 2 2 tres eer TTT nyth, Pero 2 2 52 (my - 4) Sf + (ny - 2) 85 = (ayer?) 8h Luego 2 (ny + 8 A Xnyeng-2 (e.qed.) PROPIEDAD 7,4 : BEX, NCHys04) i x) M9509) 1 X, y X,: indepéndientes O, 20,50 Se toman dos muestras aleatorias independien- tes, de tamafo n, y ny, de las variables x, y X, respectivamente, X, y %, son sus medias 1 s? s? son Ss varianza: Si y 83 son sus varianzas Si est Entonces: Demostracién: Por la propiedad 7.2 es: Cj pfs ~ NCO54) - Por la propiedad 7.3 es: De acuerdo con 1a definicién de variable aleatoria ao t de Student: Pero es: a. | |- Luego: (e.q.d.) Volvamos al test de Student. Debiamos deci» dir entre dos hipétesis donde: 217 El estadfstico de prueba que se utiliza es: SiH, es verdadera, es uy - uy = ayy en consecuencia, el estadfstico € coincide con la variable aleatoria que aparece en la propiedad 7.4, Luepo, podemos enunciar que: sill, es verdadera , et ° nytny-2 Para determinar la zona de rechazo que corres ponde a cada una de las hipétesis alternativas, se procede en forma anfloga a la seguida en el test de Student para una media, obteniéndose resulta- dos similares. Solamente cambian los prados de 1 bertad. Podemos cfectuar un resumen del test de Student para diferencia de medias: Hodelo: D8 fy Octo) 1 1 Test ce Student para X, ¥ %) independientes diferencia de medias 0, = 0, +0 desconocida se toman muestras aleatorias independien- tes, de tamafios n, y n, de las variables X, y X, respectivanente. 4H) Ge t si H) es verda~ ieee 2 dera 3? 2 gs SPB STF img = 185 218 Wipétesis alternativa Se rechaza li, 5 Hy) uy uy >a © 2 tainyenge2 eae © agnytn,-2 - uta lel > taasmyeny EJEMPLO 10 Se quiere verificar si un nuevo medicamento, cuya base es lorazepén, es m4s efectivo que el ansiolitico con el que se trata habitualmente a los enfermos con neurosis. # un grupo de 17 personas que sufren neuro- sis, se le suministré e1 nuevo medicanento, y luego, se observé el puntaje de ansiedad; obte niéndose una media de 14,8 y un desvio estandar anak A otro grupo de 25 enfermos se le administré el ansiolitico tradicional y se obtuvo una media de 16,4 y un desvfo estandar 2,6. Decidir, hallando el nivel justo de signifi- cacién, si el nuevo medicamento es més efectivo que el ansiolitico que se usa habitualmente. Sean: X4 = puntaje de ansiedad de enfernos de neuro- sis, luego de ser tratados con el nuevo medicamento. X, = puntaje de ansiedad de enfermos de neuro- sis, luego de ser tratados con el ansio- litico tradicional. Suponemos: © NG14304) 3 Ky ¥ NG309) X, y X, independientes Esta igualdad supone que la varianza del pun- taje de ansiedad es la misma para ambos tratamien- tos. Esta suposicién es m4s razonable de lo que parece a simple vista. Se verifica en la mayorfa de las situaciones practicas en las que se util material homogéneo y se controlan cuidadosamente las condiciones de trabajo. Si existiese alguna duda sobre la veracidad 219 la prueba que veremos en la seccién 7.11. pag. 226 Admitimos, entonces, la igualdad de varian- zas, que verificarenos aplicando el test adecua- do, en el ejemplo 12. pg. 232 de esa suposicién, se puede comprobar mediante ») Las muestras aleatorias son independientes, pues provienen de dos grupos de individuos dis- tintos. Decidir si el nuevo medicamento es mas efec- tivo que el ansiolitico que se usa habitualmente, es equivalente a decir que, con el nuevo medica mento, se obtiene un puntaje de ansiedad medio menor que con el tradicional. Es decir, Wy a 0 Para acotar a P se necesitan dos valores de a , tales que, con uno de ellos se rechaza i, y con el otro no. Teniendo en cuenta que rechazamos H, si eg -t y €, = -2,079 5 buscamos en la ta- a340 bla correspondiente dos valores consecutivos de tajyo entre los cuales se encuentre 1 ntimerc 2,079. Ellos son 2,021 2,423 Observemos a qué valor de a corresponde ca~ da uno de ellos Core ¥ To 025 3 40 aeu2deel | Serge o Con w = 0,025 se rechaza ll, si © < -2,074 como €, = 72,079 < -2,021 se rechaza H, Luego, por la propiedad de P es P< 0,025 Con a = 0,01 se rechaza Hy si c < -2,423 como = -2,079 # -2,423 no se rechaza !! onces P > 0,01 En consecuencia, se rechaza Hj con un nivel jus~ to de significacién P tal que 0,01 < P < 0,025 La conclusién final sera: en enfermos con neurosis, el puntaje medio de ansiedad de los tratados con el nuevo medicamento es sipnifica- tivamente menor que el de los tratados con el ansiolitico tradicional, con 0,01 < P < 0,025. Esto Gltimo indica que, la probabilidad de error est4 entre 1% y 2,5%. 7,10 TEST DE STUDENT PARA MUESTRAS APAREADAS En la seccién 7.7 se indicéd en qué tipo de O pap. 206 experiencias corresponde utilizar este test. \- Ahora veremos cuél es e1 modelo y cémo se aplica. 222 Consideremos dos variables aleatorias x, y tales qu E(k) = E(X,) = uy Se toma al azar una muestra de n-individuos 0 n-pares de individuos idénticos, y sobre ellos se miden las variables X, y X, . Se necesita un procedimiento de decisién pa- ra problemas donde Ho) My > My a siendo a un valor fijo conocido. Se define la variable aleatoria diferencia: De xX) - xX, Efectuando las diferencias de los valores de X; y X) en cada individuo, o en cada par de indi- viduos idénticos, se tiene una muestra aleatoria de tamafio n de la variable Dy Suponemos que D~ N(ugsoq) ECD) = E(Xy - X54) = BCXy) - BOK) En consecuencia, la hipédtesis nula es equivalen- te Ho) waza Estamos ante un problema de un test de hipé- tesis para la media wy , de una variable aleato- ria normal. Como G, es desconocida corresponde aplicar el test de Student para una media. Para hallar el estadistico de prueba, se calculan la media y la varianza de las diferen- cias D, . Las zonas de rechazo son las mismas ya vis- tas, por lo cual daremos directamente un resu- men de este test. 223 Modelo Test de D~ N(ugsoq) Student para muestras apareadas - g desconocida D +9D, muestra aleatoria de tama- aug H es verdadera Hipétesis alternativa Se rechaza Ls si pig ra © tyne Hy ug typogned EJEMPLO 14 En un estudio sobre el uso de vitamina By, - en ciertos casos de anemia, a 7 pacientes se les administraron 30 ¢ de vitamina durante 2 sema- nas. A cada uno de ellos se le midié 1a concen- tracién de hemoplobina, en #/%, antes y después del tratamiento. Se quiere decidir, con a = 0,01, si, en pa- cientes con ese tipo de anemia, la concentracién media de hemoglobina aumenta con el tratamiento 224 Los resultados obtenidos fueron: Paciente 1 2 4 Antes del tratamiento] 8,2] 7,6] 8,3| 7,9] 7,917 Después del tratamiento] 9,6] 9,2] 9,1] 8,2] 8,71]7,2 |a,9 Sean las variables aleatorias X, = concentracién de hemoplobina, on g/%, antes del tratamiento. x concentracién de hemoglobina, en g/%, después del tratamiento. Como las variables se midieron en el mismo pa ciente, las muestras no son independientes, si- no apareadas. Definimos la variable diferencia: DX, = xX. D = aumento de la concentracién de hemorlo- bina luego del tratamiento. Nay que tener en cuenta que los valores negati- vos de D indican que la concentracién de hem plobina disminuyd luego del tratamiento, Suponemos DY NQgsoQ) E21 hecho que la concentracién media de hemoglo- bina aumente con el tratamiento sinnifica que es luego, las hipétesis que planteamos son: Ho) ug = 0 Hy) wg > 0 Como suponemos v4lido e1 modelo, aplicamos el test de Student para muestras apareadas. E1 estadistico de prueba es: 225 SiH, es verdadera , e% ti 4 Rech. i azamos H si € > ty oy Como n=7 5; @ = 0,01 est t : aint * to,o1;6 7 99248 In consecuencia: sie %3,1W3 se rechaza li. Para calcular el valor del estadfstico de - prueba en nuestra muestra, debemos calcular pre- viamente Ty sy. Para ello necesitamos conocer los valores de las diferencias d; , que obtenemos a partir de - los datos, nae]? 2]? "|? ]°] 7] a, ee 1,4 | 0,8 ]0,3] o,8 -0,21 1,2 En esta muestra es: ad aye near =F yu 1,44 00. 4 4,2) = - =}. 5,7 2 0,084 af = (1,4)? + (2,4)? # 0. + (4,29? = 6,77 a ct a, ? 32s wt pa?. tt}. aT fast n 2 oW 4 3 , ° 226 Como €, = 3,616 > 3,143 se rechaza H, y concluimos que: 1a concentracién media de hemoglobina, aumenta con el tratamiento; con un nivel de significaci6n del 1%, 7.11 TEST F PARA IGUALDAD DE VARTANZAS Frecuentenente, se utiliza este test en los casos en que el propésito de la investigacién es comparar las precisiones de dos técnicas o de dos instrumentos. También cuando, al efectuar un test de Student para diferencia de medias, se duda de la veracidad del supuesto de inualdad de varianzas. Suponemos: x, ™ NQy30,) 3 X) ™ N(Uy30,) X, y X, independientes Es: 2 = 2 Var(X,) = of Var(X,) = 95 Este test nos permite decidir entre los sipuien- tes pares de hipdtesis: 2. G2 25 42 Hy) of =o Hy) of > of 2. 42 2 6g Hj) of = 02 Hy) of < 0% 2. 42 a foam Tega a ame Teica Para poder decidir acerca de la validez de esas hipdtesis, se toman dos nuestras aleatorias independientes, de tamafios n, y n, de las varia- : ee? bles X, y X, respectivamentes Los estimadores puntuales de las varianzas son: ay ee 2 : of = st 05 = 83 El estadistico de prueba es: 227 52 - ot e = 82 Por la propiedad 5.15 sabemos que: Q pag. 199 s? 2 1 2 sz a? 2 1 . Si Il, es verdadera, es a? = 0% , y esta variable ° , 172° coincide con € . Luego: es verdadera , € % F. yrting-2 En el caso en que hay que decidir entre: i 2 s? rechazaremos H, cuando Sj sea mucho mayor que S), es decir, cuando € tome valores grandes. Debenos determinar A tal que sie 2 A rechacemos H.. De acuerdo con la definicién de nivel de significacién es: a = P(rechazar H) , siendo verdadera) a= P(e 2A siendoe VFL a es el 4rea a la derecha de A, debajo de la fun- cién de densidad de la variable aleatoria 13ny-1 228 De acuerdo con nuestra notacién e: En consecuencia azamos ic 2 n consecuencia, rechazamos H, si € 2 Fagnyetsngea En el caso en que hay que decidir entre rechazaremos H, cuando € tome valores pequefos. Debemos determinar B tal que, rechacemos Hl, si Gen El nivel de significacién es: a=PC eSB siendo € a representa el 4rea a la izquierda de B, debajo de la funcién de densidad de la variable aleato- oe 2 Como el drea total debajo de la funcién de den- sidad es 1, e1 rea a la derecha de B es (1-0); teniendo en cuenta nuestra notacién, resulta Ys em consecuencia, rechazamos Hi, 5 _ 229 En el caso en que hay que decidir entre: 2 2 42 2 4 2 Hy) of = 0} Wy) oy # oD 7 se rechazaré H, cuando € tome valores muy peque- fos o muy grafdes. Debemos determinar dos nfmeros C y D tales gue rechacemos H, si esc 6 exp El nivel de sipnificacién es: ® PC eg C6E2D siendo ev Si € < D estes sucesos son mutuamente excluyen- tes, y resulta: 2 PC eg C siendo evr - ny-15n. + . PCE RD elendo ©™T, ay ig? a es la suma de las reas a la izquierda ¢e © y a la derecha de D, debajo de la funcién de densidad de la variable aleatoria Puyctanget! Se podrfan tomar dos nGmeros cualesquiera cy D de modo que el Srea de la regién rayada en el préfico sea a. Pero, por comodidad, ele- gimos C y D de modo que las reas a la izquier- da de Cy a la derecha de D, sean a/2. 230 Test F para igualdad de varianzas En consecuencia es DeF A @/25nq-13n5-4 y» por ser a/2 el Area a la izquierda de C, el Area a su derecha es 1-0/2 y, por lo tanto F A-a/2sny-5n-1 Con lo cual, para el test de dos colas, se recha- za si ° esr ee 6 © BP yyoe aan 1-0/25ny-45ny-2 o/23ny~15 2 2 Podemos dar un resumen del test para ipualdad de varianzas: Modelo: WG) 5 2 ¥ Mig39,) X, y X, independientes se toman dos muestras aleatorias indepen- dientes, de tamafios ny y ny de las varia~ bles X, y X, respectivamente. 2 2. g H,) 02 = 0? Sk TOE Fayeangea 84 Hy 08 verdadera 53 Nip6tesis alternativa Se rechaza H, sit ae ty) oF > 0 © 2 Fasn -asn,- 1) 9% 7% asmy-t3n,-1 2 6g? Hy) oF <0 rc rene tear 4) %4 <9 teasnyat3myo4 24 42 5 Hilo, #09 [Petettceula) a. nee tana 7 shite esr t-a/25ny-43nq-4 Cuando vamos a aplicar este test nos enfren- tamos con el inconveniente que, en la tabla de la gistribucién F, aparecen sélo los puntos erfticos Fy que corresponden aa = 0,01, a = 0,05, y a a = 0,40. $i e1 punto erftico que necesitamos es Fy_y © Ty qygs Podenos utilizar la propiedad 5.12 pa- pag. 136 ra caleularlo. Daremos ahora una rela practica para que, al aplicar este test, utilicemos sélo los puntos eriticos de F que estén en la tabla, y no tenga- mos que recurrir a ninguna propiedad. Cuando debemos realizar un test de una cola, podemos dar el nombre a las variables de modo que en la hipétesis alternativa nos quede siempre 2 2 Hy) of > 05 Por otra parte, al hacer la deduccién del test, tomamos como estadistico de prueba pero, podiamos haber tomado y hubi€semos obtenido un test equivalente, inter- cambiando en los puptos criticos los grados de libertad del numerador y del denominador. En un problema concreto, debemos calcular el valor muestral del estadistico, e,, para luego observar si pertenece o no a la zona de rechazo. La regla pr&ctica consiste en tomar en el numera- dor la mayor varianza muestral, y en el denomina- dor, la menor. Esto es: De esta forma siempre es € > 1, y nunca estar en la cola izquierda de la zona de rechazo. 232 Regla pr&ctica para el uso del test F de igualdad de varianzas a pag. 218 2 = ¥ 2 2 Eq = 7 donde sy > so Sm Hipétesis alternativa Se rechaza H, sit 2 2 Hy) of > 0) 2 2 2 Hy) of # 9) 2 a tamafio de la muestra de la que se ob- tuvo 32 m tamafio de la muestra de la que se ob- tao sf EJEMPLO 12 Ustudiar la hipétesis acerca de la igual- dad de varianzas de las variables aleatorias que intervienen en el ejemplo 10. En ese ejemplo habfamos efectuado un test de Student para la diferencia de medias, y el modelo correspondiente requiere que las varian- zas sean iguales. Utilizando las mismas notaciones que en el ejemplo 10, pondremos a prueba la hipétesis de igualdad de varianzas. Suponfamos que: X,Y NC 304) i 2 ¥ NQiy395) X, y X son independientes, y las muestras aleatorias de ellas también lo son. Debemos decidir entre 24 4 Hy) op #05 Como se cumplen las suposiciones del modelo, po- demos usar el test F para igualdad de varianzas. Aplicaremos 1a regla pr&ctica. Los valores obte~ nidos a partir de las muestras era nye 17 ny = 25 84 = 2,2 5 = 2,6 La varianza mayor se obtiene en la muestra de la variable Xj, luego: Sy = 2,6 ny = 25 =47 32 2 = Th 2 sa s97 id 2,2) mo: i 2 Rechazaremos H, si ¢, % Fyyo,ou;16 Si utilizamos a = 0,10, buscando en la tabla es: Fay232u;16 = Fo,os;2¥;16 7 277% como €, + 1,297 ¥ 2,24 nuestra conelusién es no rechazar H. [hn consecuencia, con un nivel de significacién a = 0,10, obtuvimos que no hay diferencia signi- ficativa entre las varianzas de ambas variables. Aqui tomamos a = 0,10, Como a se fija arbi- trariamente, iconvendr& tomar valores pequefios © grandes de a? En este caso la decisién fue no rechazar H, y concluimos que las varianzas son iguales. La probabilidad de que nuestra decisién sea in- correcta es: Plerror) = P( no rechazar H, y en realidad es falsa ) = P( aceptar H, siendo falsa ) = 8B y es deseable que sea lo menor posible. Si bien 8 es desconocida, sabemos que cuan- to mayor es a menor es 8. En consecuencia, en los casos como éste, en que el propésito es aceptar HJ, conviene traba- 234 jar con valores grandes de a. 7,12 TEST DE GAUSS PARA DIFERENCIA DE PROPORCIONES Hay una gran cantidad de problemas hiolégi- cos que conducen a plantear hipétesis acerca de la diferencia de dos proporciones o porcentajes, Por ejemplo, si se quiere comparar dos tra- tamientos que se utilizan para curar cierta en- fermedad, seré mis efectivo aquél con el cual se obtenga mayor porcentaje de curados. Supongamos que un médico sospecha que el tratamiento 1 es m&s efectivo que el 2. Para formular estadfsticamente el problema se eligen al azar dos grupos de n, y ny personas. Aun grupo se le administra el tratamiento 1, y al otro el tratamiento 2, Al cabo de cierto tiempo se cuenta el nGmero de curados en cada uno de los grupos. Se definen las variables alea- torias: X, = nfimero de curados entre ny personas que reciben el tratamiento 1. = nGmero de curados entre n. personas que reciben el tratamiento 2. X, © B(nysPy) 5 ~ Bi nysPp) donde: P, = probabilidad de curarse lueno de recibir el tratamiento 1 proporcién de curados entre los que re- ciben el tratamiento 1. P) = probabilidad de curarse luego de recibir el tratamiento 2 proporcién de curados entre los que re- ciben el tratamiento 2. Se puede suponer que X, y X, son indepen- dientes, pues los grupos est&n formades por personas distintas. El hecho que el tratamiento 1 sea més efec- tivo que el tratamiento 2, quiere decir que es Py? Po 235 Luego, las hipStesis que hay que plantear Por otra parte, si H, es verdadera es Py = Py + Esto indica que, la probabilidad de cu- rarse con cualquiera de los dos tratamientos es la misma, Es decir, hay una Gnica p = py = Py que Pp = probabilidad de curarse luego de recibir cualquiera de los dos tratamientos. Para estimar p, podemos utilizar las (nytn,) personas que recibieron uno de los dos tratamien- tos y contar cuntas de ellas se curaron. nGmero de _curados Xy t Xp P © QGmero de tratados ~ Ty + n> Veamos la forma general de formular el pro- blema. Suponemos dos variables aleatorias tales que: Xy% Blnyspy) : xy Blny3P9) X, y X, independientes yep, > 8 ny(i-py) > § RgsPy > 5 nj(1-p,) > 5 Las hipétesis que se pueden plantear son: Ho) Py = Po Hy) py? Pp 236 donde: Veamos cudl es la distribucién de € si Hy es verdadera, (| pas. 158 Por la propiedad 6.1 sabemos que: e Py(1-P,) BL oe NOP, 7 pp (t-p,) : plaae Bow on ; eae a B MOp.s es Si BL es verdadera es p, = py + buego por las C | par. 50 propiedades de la esperanza es: ECB, - 8) = 2B.) - r(B,) = py - Pp = 0 pag. 54 Por las propiedades de la varianza , y teniendo en cuenta que X, y X, son independientes: 8 8 3 2var(P,) = var(P, - P,) = Var(P,) + (-1)'Var(P2) = PyGi-py) Py(4-Py) By 2 SiH, es verdadera, es py pp = P > y mesulta: > Pip, Use. 7 ™ var(B, - B 7 1 237 = p(i-p) (+++): 1 2 nyt : 2 = p(iep) Ry Fp En consecuencias si i, es verdadera: BL - 8, acos [eG-m [standarizando es: By - 8 & (052) rary a* 2 p(i-p) —— Tye By Se puede demostrar, aunque no lo haremos, que si en lugar de p se pone su correspondiente estimador P , la variable aleatoria que resulta, también es aproximadamente una (031). Teniendo en cuenta esta propiedad y reorde- nando es: BL - 8 ny en Z a 32 wy N(051) Pero, esta variable aleatoria coincide con el estadistico de prueba, [n consecuencia, pode- mos decir que: sill, es verdadera , © & N(031) No determinaremos las zonas de rechazo, por- que son las mismas que las de los otros test de Gauss, y se obtienen en forma andlopa. A continuacién daremos un resumen del test de Gauss para diferencia de proporciones. 238 Test de Gauss para diferencia de propociones Modelo: Xp V B(nyspy) 5X, % BlngsPy) X4 y %y indenendientes. > n(1-py) > 5 > 5 nj(i-p,) > 5 Hip6tesis alternativa Se rechaza H) si: Hy) py > Pp 62 2, 4) Py < Po Hy) py # Py EJEMPLO 13 Los miembros de una poblacién est4n igual- mente expuestos a contraer una infeccién por virus. Un médico ensaya una vacuna que se la apli- ca a 50 voluntarios. Luego de cierto tiempo, ob- serva que 9 de ellos habfan sido infectados. Por otra parte control6, durante el mismo tiempo, otras 100 personas de la poblacién, sin aplicarles la vacuna, y cbservé que 39 de ellas fueron infectadas. Decidir, con a = 0,01, si la vacuna es efec- tiva. = nfimero de personas infectadas entre 50 que reciben la vacuna. = nfimero de personas infectadas entre 100 que no reciben vacuna. Suponemos X,% BCS0spy) 5 Ky w B(1005p,) X, y X independientes. Es: Py = proporcién de infectados entre los va- cunados. P) = proporcién de infectados entre los no vacunados. a vacuna ectiva siies py ny-Py = 90. 0,18 = 9> 5 Ry+Py = 100, 0,39 = 39> 5 ny(1-py) = 50, 0,82 = 41> 5 ny(1-p) = 100. 0,61 = 61> 5 Aunque py y p, son desconocidas, admitimos que se cumple: ny-Py > 8 n,(-py) > 5 Ry-Pp > 5 3 ny(a-p,) > 5 y podemos aplicar el test de Gauss para diferen- 239 240 cia de proporciones, £1 estadfstico de prueba es: BB mm 1 2 ce Gq 2g M(0;1) si Hy es — ae B(1-B) 1% verdadera, Rechazamos H, sie < - Z Como a = 0,01 es fy ean peceres om epee ecco oy Peay “50 + 100 © 150 7 1* 2 ooo ~ Pat Pe My te — |a aaa 1 {Rab ? 0,18 - 0,99 50. 100 [0 -9204-0,32) 50 + 100 = -2,599 Puesto que €, = -2,599 < -2,326 la conclusién es rechazar Hy Decidimos que la proporci6n de infectados entre los vacunados es significativamente menor que la de infectados entre los no vacunados, con a < 0,01. La conclueién final es: "la vacuna es efec- tiva", con P < 0,04.

You might also like