Analisis de Varianza

You might also like

Download as pdf
Download as pdf
You are on page 1of 7
SIETE 7 _ ANALISIS DE LA VARIANZA I: CLASIFICACION DE UNA VIA ue ideado por Sir Rona Woe los campos En el capitulo 7, consderamos el andisis de la varianza en donde et dni ciasificacién de los datos ese tratamiento, Estudiams el modelo lineal Is fcomponentes de [a varianza, los supuestos en que se base el anlisis dela varianza y las pracbas de signifeancia, el cundrado medio residual o err experimental y el ert de los capiulos, 9, 15, 16 y 18 se estudian otros seis y aspectos del andlsis de 7.2 El diseno completamente sleatorio. Es seo es tl cuando las unidades experimentales son esencialmente homogéreas, es ir, cuando la variacién entre ellas es pequefa y agruparias en bloques seria poco més leatorio, Este es el easo en muchos tipos de experimentos de laboratorio les que una cintidad de material esta completamente mezclada y luego se dine en porciones pequeris para formar las unidaces experimentales a las cuales se asignan los atamientos en forma aleators, o en expesin nes anbientales may pare Laake tos con animales y plantas con ndicio: aseibn, el proceso que hace apicables ls leyes del aar, se logra signan. do tratamientos alas unidades experimentales de man imponen 88 todos los aleatoria, No se jciones ala aleatorizacién como cuando se necesita que un bloque conten: atamientos. La eleccién del nero de cbservaciones que han de hacerse 132 ANALISIS DE LAYARIANZAI CLASIFICACION DE UNA VIA 133) sobre los diversos tratamientos, no x considera una restriesion 4 Ia sleatorizacion. Cada un tratamiento, e386 65, Ue ‘unidad experimental tiene Ia, misma probabildad de recibir si hay m-uniades experimentales entonces euslquiera de los n tratamientos, no toon dite rentes, claro esti, tiene la misma probabilidad de caer en calquier unidad experimental. ‘La alcatorizaciin s¢ lleva a cabo mediante el usode una tabla de nimeros alsatorios ‘Supingase que 15 unidades experimentales van a recibir inc repeticiones de cada uno de tres eratamsientos, Asignese los niimeros 1 a 15.2 las forma sonveniente, por ejemplo, en form: cen una tabla de nimeros aleato nidades experimeniales, 0 na secutiva. Localicese un punto de partiga spor ejemplo, la fila 10'y column 20 dela tabla A.1 y seleeciGnense 15 niimeros de 3 dgitos, Allecr verticalmente obtenemos: Wis 701 789 965 48 IE OL 1a 9s soB Emton: 3s se asignan rangos a los miimeros: asi, 118 es el menor, le carresponde el rango 1 1 965 el mayor, le corresponde el rango 15, Se considera que estos rangos son una perm tacién aleatoria de los nimeros de 1 a 15 y que les $ primeros son los niémeros dé unida des experimentales correspondientes al tratamiento uno. Por tanto, las unidades 1, 8, 9, 1S y 7 reciben tratamiento 1, y asi seesivamente, El procedimiento también +8 a rimero de veces, por ejemplo, 6.6 y able cusnd Hos teat nientos replican desigual Se san los nimeros de 3 digitos ya que es menos probable que ineluys empates come puede ocurtir eon niimeres de 2 2 digitos, En todo caso, los empates se pueden deshacer mediante el uso de mis nimeros, las tablas de nimeros aleatorios pueden usarse de otra manera, Por ejemplo, tos ‘nimeros de 2 digitos menores de 90 pueden dividirse por 15 y se registra el residuo, lo que da los némeros 00, 01, .... 14 com igual frecuenct obtienen otros para reemplazarlos. Los mimeros 90,91 que 00,01, ...,09, se presentarar ‘Se descartan los duplicados y se 99) no ve usan, ya.que arian mm mayor frecuencia que 16,11. 14. Si, durante el curso del experimento, todas las unidades experimentales se han de ‘atar de manera anfloga, por semplo, la ciemibra en parcelas de terreno, debe hacerse en orden aleatoria si es posible que el orden afecte los resultados.como cuando una técnica mejora debido a la prictia, El anilisis de un disetio completamente aleatorio también es aplicable a datos en os que el “tratamiento” implica simplemente une variable de clasificacién y cuando hasta Puede ser necesario suponer la aleatoritdad. Por ejemplo, se puede medir el peso de los adultor de ciertas expecies de peces obtenidos en varias Iagos (tratamientos), 9, 4 desea saber os pesos de peces adultos cambian de-un lago a.atro. Veneajos El disefio completamente aleatorio es flexible en cuamto a que el nuimero de tratamientos y de repeticiones solo esté limitado por el nimiero de unidades experimen tales disponibles. El nimero de repeticiones puede variar de un tratamiento a otro, aunque generalmente lo ideal serfa tener un nimero igual por tratamiento. El andlisis esta distico es simple ain en el caso en que el nimero de repeticiones differa con el tratamien- to y si los diversos tratamientos estin sujetos a varianzas desiguales, lo cual se conoce cee ee | Oe 134 IOESTADISTICA: PRINCIPIOS Y PROCEDIMIENTOS como b falta de homogencidad de eror er perimental, Sin embargo, las pruebas de Sent So a conaruceon del interval de conflanza requierenatencion especial canto a huerogenedad de la varianza, La senile del andsis ro se pierde s algunas unitades rey nientale 0 trtamientox enerosfaltan oe descartan, a perdi de informacin debi a estos faltantes ¢ pequeta en relaciOn oon 198 pérdides miaa on oon dia, El nimero de grados de ibertad para estimar ©'6 rerekmenal ex maximo; Xo rejor la precision del experimento Y ¢8imporians com caPerimenton peauciono sea, en aquellos en los que los grados de libertad para el error i Experimental son menos de 20 (ver sec. 6.8) Desventaias La priscipal objecién al defo completamente aleatorio¢s su frecuente ine Ramee Com la sleatorizaci6n no tine resvicciones, el error experimental incluye tods Ia ucign entre lis unidades experimentales excepto la debida a los tratamientos. En Trucs stuaciones es posible arupar la unidades experimentales de modo que I vara ‘Jon entre unidades dentro de los grupos sea menor que la variaciOn entre las unidades de diferentes grupos Clertos seis sacan ventaja de tal agrupamiento, excluyen la vaiacion {el enor experimental entre gropos y aumentan la precisiin del experimento. Agunos de texos dsefios se estan en Tos cps.9, 15 16. dls de a varianza para cualquier 73 Datos con un solo creo de clsificacion: El a rnimero de grupos con igual nimero de repetciones En la tabla 7.1 se da el contenito de nitrdgeno, en miligramos, de plantas de trébol rojo inoculdas con cultvos de Rhizobium triflli més un compuesto de cinco cepas de Rhizo- ium mello, tal como lo reporta Erdman (79), Cada uno de los cinco cultivos de trébol R.trifoli se sometiba prueba individualmente con un compuesto de cinco cepas de alfalfa, IR mellori, y un compuesto de tébol rojo también se someti6 a prueba en el compuesto de Ins cepas de alfalfa, lo que da seis tratanientos en total. El experimento se realiz6 en in imernadero empleando un diseflo completamente aleatorio coz cinco materas por Citeuos Dsponr los datos camo en a taba 7.1 Sey I obseién sims bajo Slatamient Fésino, = ot] = 1,2 Lo ales de losteatamients requ samenpindce yt total pu el tatamiento sino puede deroarse Y, donde el seaside ate dns as cborvacioes per el tratamiento (seo a han tumado pa erent ee foal La letras) e san ara designar el ndmero de tratamientos yl trmero de repeticiones de eada tratamiento, aqui f= 6) P= 5. Para cad tratamiento obenersmulinearenteY, y 2 Yeon una maquina calc. ladoa, al como sepresenvaen a nea 1 y2 elo edleulod de ta bla 7.1. Estos valtes se toaizan neg; por lo tanto Then ¥ z(z¥) zu ANALISIS DE LA VARIANZA I: CLASIFICACION DE UNA VIA 135 Tabla TA Contenido de nitrégenode plantas de trébol rojo inoculadas con combinaciones de cultivos de cepas de Rhizobium trifolii y cepas de Rhizobium meliloti, mg. Cepade R, srifolt . : 2 1 Come” Cileuto 3D0k1 3DOKS 3DOk4 3DOK7 3DOKI3 puesto Total 9417717. 73 600 RADA 194 no vs 91 mS NS 191 Bul 828K 169 30 83S 1G MD 208 Lw-% Wal 99 2 96643 HS $966 = 7. wy 428753. 2.93227 1.13942 198914 88729 1,758.71 12,994.36 yr 415296 2875.20 AOTLES 198403 879.14 1.74845 12,711.68 Ty kP 134 s or77 $4 RAS 102628293 % us MO M46 699) 3 187 En la linea 3, cada total de tratamiento se eleva al cuadrado y sé divide por r= mero de repeticiones por tratamiento. Obtener el factor de correccién FC de la ec. (7.1) y la suma de cuadrados total {(ajustada para Ia media) de la ec. (7.2), El factor de correceién es el evadrado de la suma de todas las observaciones dividido por su niimero. Para estos datos el nt (7) (596.6)? = SOO” = 11,864.38 i) Total SC = F ¥i-C (7.2) oy = 12,994.36 — 11,864.38 = 1,129.98 La suma de cuadrados atribuible a la variable de clasificacién, esto es, a los trata mientos, que suele lamarse suma de cuadrados entre grupos o suma de cuadrados de tra- tamientos se calcula asi: Hote ¥ 3 SC tratamientos = -¢ cntwe (78) = (aay + 4 35F = 11,864.38 = 847.05 | 136 BIOESTADISTICA: PRINCITIOS Y PROCEDIMIENTOS La suma de cuadrados entre individuos tratados en forma similar también se ama suma de cuadrados dentro de grupos, suma de cuadrados residual, suma de cuadrados de error © discrepancia, y generalmente se obtiene restando del total la suma de cuadrados de tratamiento, como en la ec, (7.4). Esto ¢s posible por la propiedad de aditividad de las sumas de cusdrados. SC Bnor= SC Total~ $C a) 1,129.98 — 84705 = La suma de cuatrados de error también puede encontrarse combinando las sumas de cua drados dentro de trtamientos como se indica en la ec, (7.5) Esta sumas de cuadrados ddan en ls peniltima linea de la tabla 7.1. Cada componente tiene r — 1 = 4 grados de li- bertad, La suma de las componentes es 28293. La naturalera aditva de las sumas de cua drados queda demostrada, Esta una excelente verificacion de cdlculo. Aderés, propor ciona informacién rlacionada con la homogeneidad dela varanza del eror Sc Error ry -“) as) mart) 29293 A). (rasin 22) Los resultados numéricos de un andlisis de la varianza generalmente se presentan en una tabla de andlisis de la varianza tal como la tabla 7.2, con simbolos, ola tabla 733, cjemplo, para Ios datos que se asaban de exponer. EI cuadrado medio del error se denota s° y frecuentemente se denomina término _generalicado del error ya que es un promedio de las componentes aportadas por las dife- Tentes poblaciones 0 tratamientos, Es un estimativo ée una ¢? comin, la veracién entre las observaciones tratadas en forma andloge, Que exist una o? esun supuesto,y 5? es una estimacicn valida de a? s6lo si este supuesto es verdadero. Las componentes individuales se basan en s6lo unos pocos grados de libertad, asi que pueden variar ampliamente en torno a ¢? y, porlotanto, no son tan buenas estimaciones como la estimacién combinada. EI principio es el mismo que para las medias: una media de 24 observaciones es mejor exti- rmaci6n de j que una de 4 observaciones porque la primera tiene menor varianza. Andloga mente, una varianza muestral basada en 24 observaciones es mejor estimacién de o* que tuna basala en 4 observaciones ya que la primera tiene menos varianza. La validez del su- puesto de que cada una de las componentes del error és una estimaci6n de la misma a, se puede comprobar con la prueba de homogeneidad, 7°, que s° estudia en la sec. 17.3. El cuadrado medio de los tratamientos es una estimacién independiente de a? cvan do la hipétesis nula es verdadera, Las varianzas entre medias estiman a a/r. Asi, el ren la formula de definicién de la suma de cuadrados nos asegura que el cuadrado medio de tra- tamientos estima 0? en vez de o?/r. Razonamiento parecido se aplice ala férmula de operacién donde se usan totales de los tratamientos. La aplicacin de la sec. 5.10 muestra que las varianzas entre totales (ver ejercicio 5.10.3) estiman ro?; ahora bien, es necesario un divisorr sieste célculo ha de dar una estimacién de 0? en vez de ra?. Como F se define ANALISES DL: LAWAWIANZA [:CLASIFICACION DB UNA WHA 137 Tabla.7.2. Andlisis deta varianza :clasificacin de wna vi de repeticiones (Consimbolon) com igual narmero Sumas de cundeados Cmeaton wwicin al Detinciin Opec mediost noe Tratamiento 1 eDanr E a J vor wattacetin v ‘gomo ta razon de dos estimaciones independientes de la misma © ih estimacidn del ecuadrade medio de los tratamientos medios se calcularon por cada observacién. El valor F se abt centonces es necesaria 2 Decimos que ambos cuadrados vedividiendo el cuadrado medio de hor tratamientos por el cua Oded crvoreato ex, F= 1GPAI11.9 = 14.37%. Por lo tanto, el valor de F say cuadeade medio de (vatamientos como un mltiplo del euedrado medio de} er ites cuadrades medics son comparables ya que cada uno estima le vaiacin entre ODS cas cmindviduales, ELF ealelado oe compara con cl F tabulado pata § y 24 gras de Haas pura decidir i aceptamos ono la hipotess mula de que no hay diferencia entre las anus tablacignales o aceptar la hipGtesis alterna de que hay diferencia. Los valores ta aaieaye F paras y 24 grados de libertad son 2.62 y 3:90. los nies de probabilidad ap OS » 0.01, respectivamente. Puesto que el Fcalculado excede ol 1 por ciato del F tabalado. concluimos que el experiment comprucha que hay diferencia real entre lat medias de los tratamientos. vaca wear las tablas de F para el andiss de La varianza, se buscan a To largo de la paite superior de ia tabla los grades de bested del numerador, esto cs, os gados de Fhpertad del tratamiento, y los grados de iberiad del error se buscan en el margen. Esto se tebe a que el conjunto de hipdtessalternativasséTo admite que existen diferencias ents= ratumientos y, por tanto, aumenta cl estimativo de la varianza basado en medias 0 volar ‘Tabla 73. Andlisis de la varianza de los datos de la tabla 7 Fuente de variacin el Suma de eundridor Cuxdndo medio fF 19.48 1199 Ente bos cultivos s Dentrode los cultivos 24 Toul 138 BIOESTADISTICA: PRINCIPIOS ¥ PROCEDIMIENTOS reba se juzgan sign: J error el resultado 3° les de tratamientos, asf que slo fos alres grandes del crite ieantes, ie] cuadrado medio de Tos trata Sicantes. Si iroante por pequaia que sea la azén. Une F SENET implica que las declara mo sig ontemnte slias como para indizar que Hing jento pertenece resoblaciones con una H comin. Sin embargo sans ra ous diferencias © pueden COP Gidcrar estadieticamente signifi a ee que tanto los grados de bert como las amas 00 sdrados dentro de ae ina dels valores corespondiznts on 1 ines 2 ‘onl. Los cuadrados sama eos plead de aitiidd de las sumas de cusdrados 6 or ertas operaciones abrevia medios no 5 seis experimentos bien planeados y ejecutados, Permits Fe el analisis de la varianza, como ol edteulo de ty euma de cuadrados del error restan a et an fe cuadrados tla la sua de ciadrados de Vatanscn eS) se veon la oe 5 Experimentos que no se plancany ejeutan de moO Ot jorean esa propiedad, _fapermen muchos mis cAlulos y tienen menor Precsion Pot observacién. cho de tratamiento y o de una diferencia entre medion general TE error estinda de trmamnntos se calcula, con las ect (7.6)y (7-7) texpectvaments ‘Los valores num segs corresponden a los datos de In table 7.1 [U2 2 154mg (76) 3.79) 27mg igi ay Eosestadigrafosson stiles para comparar diferencias ent medias de tratamientos, so nett el cap. 8, ¥ par. cdlelo de intervalos de confines DAE medias de tra- cor mony diferencias de medias de tratamiontos. Orras aplica jones se ven en la see. Siig elcap. 5. Elepeficiente de variacion © calevla Por 100 = 1733 por ciento (78) ge mostré ena sec 5.5 que el ands dela varlanza pod‘ ysarke oA Ot dela pre haf par comparar dos tratamientos en ls que el dieRo fers ‘ompletamente aleatori. 1a prueba de F de una cola con 1 y m srados ¢¢ libertad correspond ala f de dos colas con n grados de libertad. Esta prueba de * ne ‘specifica la direccin de la diferencia Colas edie do tratarientos para la hipotesis alterna; st s6 PCT Ja prueba de sar ce cola. que especiica cual cuadrado mediotha de s7 We resultado de diferencias de direcci6n no especificada entre tratamieht, ‘Se puede demostrar que age~ aeamente estas pruebas son equvalentes; en partioulat F. La relacién se muestra grificamente en la fig. 7.1. Valores pequenios de F ‘uando se elevan al cuadrado, se con rerten en valores pequetios de, que son positivos ‘Valores grandes de t,elevados al cua Urado, st convierten en valores grandes de F,

You might also like