Download as pdf
Download as pdf
You are on page 1of 69
Esto es porque para la posicion del valor 2 = -1,36 (véase en el capitulo anterior el aniliss de la poriciSn de un dato con zes pesto al conjunto en términos de desvia- clones esténdar) corresponde el percentil 25, y para la del valor 2 = 1.36, el percentil 975, Entre ambos qed: comprandide «) 95% del 4rea ese dues reprezenta. ‘Cuando se toma el intervalo entse x 4 25 a (cos y media desviaciones estandar auriba y por debajo de la media aritmné- se incluye a practicamente la torali- dad del area. Esto es porque eses cantidades de desviaciones estindar corresponden, aproximadamente, 2 los percentiles 05 y 995, Sin embargo, en la resoluciin mate- tea, solo se cubre la totalidad del ervalo se extiende desde inf va hatta infinito pasitive Llevado azte ala situacién de una pabla cisn sed con dstibucisn aprovimade mente gaussiana, puede decisse que de los datos incluidos en ela Gel conjunte de datee que a) Aprocimadamente el 95% tene valores entre. £2 6. bb) Apronimadamente el 99% tiene valores entre £25 0. APLICACIONES DE LA DISTRIBUCION NORMAL El conocimiento analisado antes puede aplicerse en distintas situaciones précticas Entre ellas se excuentza la postbilidad de ubicer 2 un individuo dentro de la pobla- ‘dou ala que percenece en funcidn deldaco ‘que se obturo en el para la evaluccion de tuna variable Esto es posible siempre que ese dato esté distribuido en forma gaussla- ra en esa poblacién y se conozcan los paré- metros de media aritmética y demviscion estindar correspondientes a esa distribu- don. Un elemplo de esas aplicaciones consiste an el uro de procedimientos de diagnéatica Ge capscidades o alteraciones del compar. samlento que se emplean, entre otras teni- cas,en paicometria. Coa lizan pruebas pare evaluat la “inteligencia’ ‘en bos integrantes de ura poblacdn defini- a (tango de ecad especitica). Le administracibn de esas pruebas 2 un niimero grande de individuos permite cil- cculer con grado de cereza razonable los parametros de la poblacidn. Es usual pro- sar los datos para generar una situacién en la quela media aritmética asume un va- lor 100 wun valor 10. Sia un indviduo en particularele adm. rlstea la prueba y se obtiene un resultado eterminade, 109 per ejemplo, es pesitle eterminar sl su comportamiento es ase- micjable al de le mayor parte de sus “com- ppafieros’,o si difiere delo que se espera en a mayoria, Para ello se aplica el procedimiento des- cxito en el capitulo anterior por el que se caleuls elvalor de"2", le ubicacién del dato con respecto 2 lz media en términcs de desvizeidn esténdar -2 = (& — 41) /o. En al ejemplo, 2 seri 300) / 10. Erte individuo extd deatto de une desvis- ion ertdader del valor dele medis, parle ‘que se puede estimas que es un invegrance del area “central” (véanse los ultimes parra- {os del item previo) y, por lo tanto, puede jecviaeldn artdas orion considerarselo un individuo “normal”, si se acep'a que lo més frecuente eslo “normal” En cambio, un individvo que en la misma prueba genere un dato 73 puede ser consi- derado “anormal” en términos de deficien- cia de inteligencta (suponiendo, por su- puesto, que esta variable se hays evaluado fen forma valida por arta pruaba) =: sents, para arte ease al valor de "2" ex -27 = (73 — 200) / 10, lo que significa una uubicacién por debajo [come indica el signo 99% cen:ral, el que esté entie negattvo) 1225 o, En funcién de las musmas consideracte- nes, un resultado 124 (2 = 2,4) identifica- rig aun “genio en potencie” por su ubice cion por encima del 95% central En algunos procesos de control de call- dad y en ovras aplicaciones se hace uso de las propiedades dela distribucién gaussia- na Ea todat las cane se parte de concep oz bisisos que pueden sar ranamidac en el enuncialo siguiente, referido'a le sitmaciéa, en una poblacida de dates con ext forme la "mayorla” falededor del 95%) tiene valo: de datos entre casi dos desviaciones estén dar ala izquierda ya la derecha del valor de la media aritmét 1,96) La palabra “mayorla” és una denomins- cion arbitraria y, por le tanto, discutble, aunque su significado, 95%, surge de la aplicacién matemética de une ecuscién y por ello, e mas ficil de aceptar (mis exactamente, ‘Dela misma manera, ai ce celecciona en. forma aleatovis, 22 decir, al azar, un inte gente de ana poblacién con dutebucien gaussdana, puede estimarse cual es la pro- Dabilidad de obtener un dato dentro de un dererminado rango de valores, La probabilidad, oy letra P, esté representada por la relacién centre el resultado buscado resultados posibles. Por ejemplo, la prabe- bilidad de que al dejar caer una moneda quede hacia arriba el lade denominado"ce- rei e512 05 0 50%), ye que Les al resul- tado buscado y 2 son los resultados posi- bles. Ei vsler de ls proba! vo qua ce ubica dentro del vango entee Dy 1 (o 0% y 200%, ai 22 lo expresa percentual- nents), en el cual el primer valor ponde a imposibilidad y el segunda @ ua resultado seguro, En una distribucion gaussiana los results dos posibles son infinitos y la freccion bierte por un determinado tango inter lo de valores indica la probabilidad de su slidad es un mime (Ota vez, en este caso la expresion “poco probable” és erbitrarie, aunque no al valor de D. Este valor es menor que 0,05 (0 me- shor que 5%) en el enunciado, ya cue los lores a que se hace referencia son los que cestin por fuera del rango central que abar- capsule estén, referidor al enélicis de poblaciones que ze presuponia conccidas © sazonablemente conocidas en sus pardmetios y forma de distribuctiéa. En los capitulos préximes se uchizaran los conceptos edquirides para sentar las bases para la interpretacion de los procedimientos de la estadtstica inft- renctal, es decir, los principlos del trabajo estadistico a partr de muestras comadas de ana poblacion SINTESIS CONCEPTUAL «Es de interés analizar la forma en quelos datos estén distribuidos en un conjunco. FI percentil de un dato indica que por- centaje de datos del canjunto tienen valer ink Cuando la forma de a distribucién delos Gatos aumdéricos puede ser asimilada « una distrbucién aommél o guusslana, es posible aplicar le ecuacion correspon- diente para conocer su petcentl a partir del conocimiento de le pasicion de un 0 con tespecto’ la media en :érminos de desviaciones esténdar —valor “2” del dato-. La reselucién de le ecuacién permite e tablecer que, en tado conjunto con dis- tibucién giustiana, el 95% del area debsjo dela linea (95% de las individuos de la poblacisa) tiene valores para al Gato entie 1,95 desviacione: esténder por debajo y 1,96 desviaciones esténdar or aruibs del valor de la media arlemé- t ead EJEMPLOS 6A Un alumno obiuvo un puntale de 72 en tana prueba estandarizada de biologia en le cual las pardmetros para la poblacion a le que él pertenece, son w= Gyo = 5.En tana prueba del mismo tipo, aunque sobre guimica, en Ja cual w= obra voun puntsjede 82. 2Fa cudlde linas e2 un alumno mas “destacedo"? En biologi, ya que su puntaje 72 esté 1,8, cemtaciones esandar por nama de la ‘media (valor “7'), mientras que el 82 que ebtuvo en quimica estd solo al. Si se supo- ne una distribucidn aproximadamente nor- mal deese puntaje, esto signtfice que supe- 16 amayor cantidad de sus compateros en biologia que en quimice. 62 En una poblacién de 200.009 personas del ginero mazculino la edad « le que aus inte- ante: quedan totalmente desdentadas ex td distrbutda en forma aproimadamente normal, conp = 58 flosyo = 1Zaflos. St se decide brindar un servicio de protesis completa los menores de 46 afics, :pera ‘qué cantidad de individuos deben asegt Aproximadamente pera 32000. Esto es porque le edad 46 esti uns cesviacién “indar por debsjo de la media aritmética ela pablacién (valor °2") Si entre una des- viacidn esindar por encima y por debsjo 2 encuentra el 68%; dela sands de exte valoe ( poblacién. yor fuers queda el 32%. De estes, la mitad, 16%, estardn por debajo, yell 36% de 200.000 es 32.000. 63 El costo de los tratamiento: que se brin- danenura dinica est distribuido en f razoncblemente normal con | = § 2.250 ¥O= $150. El tratamiento que necesita un raciente tiene un costo mayor que el dela mayoria ée los pecientes que son atendi- os. ;Cual ¢5 el costo del tratamiento para paciente? septa como mayorls el 950 mic a la distritucién, puede esti- ovina ailecice io “ ‘arse un costo superior a § 2.550 ya que debajo de la media aritmética) se encuentra entre este valor y $ 1950 (valores que estan ese porcentajs, segin surge de ls ecuacion, des desviaciones estinder por encima y por de Gauss. i muss) A partir de los datos registrados en estas tanidades es posible, luego. realizar inferen- sobre el canjanto coral, la pablacida, Una condicgn que debe evunir una sauestes para realizar esasinferencias es set “representative”. Esto significa que en ella deben estar representadas todas las condl- ciones presentes en la poblacion y que pue- den intluir en el dato a partir del cual se eval la variable de interés, La tepresentatividad de una muestra se garantiza por la forma de seleccién de sus componentes. Este tema se trata en el estu- dio de las técnicas de investizaci6n: la apli- cacién de les téenicas estadisticas presupo- ne que ls rnuestrs et reprerentativa Una var desidida odmo ce ve a asegurar la repeesentatividad, ce debe garansizer que, centro de la pablacién definida o dene tro de un estrato o subcoxjunto de ella. la seleccién se realice en forma alestoria Esta condicién signifies que, durante el procedi- saiente, cada uno de loz integrantes de la poblacisn tiene la misma probsbilided de ser seleccionade. “Allo largo de este capitulo se analizaré el comportamiento de las musstras tomadas en esas condiciones en si relation con los yarametres de la potlacén de origen. En primer lugar, se exeminaré la situacién para varlubles descritas mediante datos “numéri- cos” y luego se haran algunas apreciaciones paral caso de los datos nomainales. Al igual que frente a otras situaciones, los datos or- Ginalas pueden considersese como eataz6- ‘neo, dl igual que loz nominales,o, cuande ge wate de puntajes o indices euzonable- mente extandanzadcs, waterles como a smésicos, aun cuando en realidad no lo sean. ‘MUESTRAS CON DATOS “NUMERICOS" Supéngeze que s2 estd frente a una poble- ign hipetézicay pequesia de cuatro indivi- duos (N = 4) en a que os que le compo- fen Senen los siguientes datos “numer cof" pars una determizada variable: = b= Se = 3:6 = 2 Esor valores seinca. yen en la primera fla del cuadro 7. La sedis aritmética(u) en ese conjunte es 3. Si se supone que algsien ess interessdo en el valor de ese parémetro, aunque no tiene acceso ala poblacién sino solo a algu- mot detus ntagtantes, necentara tba peri ds dakensetna Se verket coil sincin In situacién que’ ne platens’ al ctlrar par a tres ona winestea de tama 02 (n = 2), Se entendera que esta siua- cin se presenta a manera de ejemplo, ye gue los pobaciones que presencan un inte- és red son de tamanos notoriamente mayores, Para seleccionar en forma aleatoria dos unidades de les cuatro de le poblacién, podsiaa colecarse custro bolillas identifica- as con les respectivas letras en un bolile- 19 ¥, por sorteo, retirar dos. Debe destacarse que en este cas0 no se est4 cumpliendo en su totilidad el requ to de alestoriedad En efecto, la posibilidad de selezcisin dela primera belie he sido de uno en cuatro (P = 1/4) mientras que en In segunda, de uno en tres (P = 1/3). Para trebajar de manera realmente alea- ‘tor es necesario obtener la muestra “con reemplazo". Esto significa que cada uni- ‘€UADRO 7-1. FESULTAOC! Poblacins rs Media aot 20 LAS NUESTRAS TOMADHS UNA POBLACION HPGTENCA DE BATOS ery ae ao bs an bed 300 oe ant = 3 one x26 een oe Sure 1a Sure: vues = vere cnetauer | wire | s rar el dato en media aritmética de una muestra. Esto no le y luego incorporarla nuevamente 2 la depende de une forma de trabajar correcta, poblacién para mantener constanteslas po- sino tan solo de la mayor © menor ‘suerte! sibilidades de seleccida. Este mecanismo, que se tenga en la seleccién cleatoria de la que hace posible que una misma unidad muestra sea seleccionada mds de una vez, no es el que se aplica en les situaciones reales y abliga 2 slgunas modifieaciones en los pra- edimientor que se desecibirda maz ade Jante. No obstants, esas modificacionas tie en un pese significative en los resultadce Por cto lado, en Ia ultima fla dal cuadeo) solo cuando él tamafio dela muescra supe- puede verse que la media aritmética, el ra dl 10% del camafo de la poblaciéa, lo promedio, de las medias aritméticas de las que fara vez sucede en las invemigaciones musstras obtenidas es 3 (el valor ce reales. Por este motivo, se trabajard aqui suma, 18, dividido por le cantidad de mues- asumizndo aleatoriedad sun cuando no trastotales, 5), valor que corresponde al del seareal, por seleccionar una muestra que, patémetro de lz poblacié 3) en al ejemplo, tiene ua tamafio (2), que Una segunda conclusion es que, debido a representa la mitad del tamafio de la po- que el valor de Is media aritmétiea de la blaciéa (2), ‘muestra tomada de una poblacién varia, Segun al ejemple, puede verse an la prime. aunque a veces selo estima bien. y otras se sa calamna del cusdeo el parimetro, de az see poaiblasmuemras que pueden ob- en promedio ce lo estima bien. senetse en las condiciones planceade ‘Al caleularse en cada una de esis mues- uaas el estadistico de rendencia central media antmetica (recuérdese que un ‘distico se celculaen una muestra, mientras que ua pardmetzo lo es en una poblacién) se obtienen los resultados que se musstran ‘ena segunda de las columnas del cuado, ‘De esos resultados surge que en dos de Jas muestras l valor del estadistico x Véase ahora en las columnas tercera y coincide con el patimetro de la poblacidn esatta dal caadva lo que suced® al tomar | = 3); en otras doz al estadiztico le co. muestra: de tamafe we: [a - 2) de la vespencié an valor meyer que el delparé- niiema poblecisn hip: metre, yen otras des un valor mienor Tembi ‘Una primera conclusion que puede estima bien, pero la magnitud de le sobre- raerse es que puede produclise Una esti- estimacida o de la subestimacion es menor macin correcta, una sobreestimacion o que cuando las muestras son de menor tunz subestimacion, al estimar la media tamafio. En efecto, cuando n = 2 el error aritmética de una poblacién a cravés de le de estimacién fue de 0,50 en més o en In cemposicion sobreestima o ce subesti sn este caso, en promedio, ci ‘menos, mientras que cuando n = 3 fuede inteprantes: a= 5 b=3.c=3d= 1. 0,33, La media aritmética (W) en este conjunto es ‘Una tercera conclusion es que le magni- también 3, aungue su dispersién es mayer. sud del error que puede cometerse al esti- Esto puede visualirarse a partir del rangoo ‘mar le media aritmética de una poblacién 2 recorrido que es 4(5 — 1), mientras que es ‘partir del correspondiente estadistico dis- 2 4 — 2) en lapoblacién del primer elem ‘minnye al aumentar el tamafo dela mues- plo de este capitulo. ea utlizads, ‘Las eonclusiones ys extra(da se aplican 2 Por dhims, véinse en el cuadvo 7.2 lor etta nueva situictin, aunque, al comparar resultados de reyetir el procedimienta en los ceultados de las dos tablas, puede ows poblaciéa de tamafio 4, aungue con observarse que para un mismo tamafio de (CUADRO7.2. RESLLTADOE EN LAS MLJESTRAG TOMMADAS OE LWA POBLACION HeCTENCA Be OATES “NUNERCOS Peblaciéa: ass bea o=3 a=1 a= ‘muestra la magnitud del error que puede cometerse en Ia estimacion es mayor en ‘Una cuarta conclustén es, por la tanto, que la magnitud del error que puede come- terse al estimar la media aritmnética de un poblacién 2 partir del correspondiente alaumentar la disper- Hea de la poblacicn de ls que se toms ls ERROR ESTANDAR ‘Los resultados de la supuesta experiencia Jdescrita en los elemplos planteados lleva 2 expreser q Expresado en términos matemticos, puede decirse que la magnitud del error es directamente proporcional Ie dispersién dele poblacién de otigen de le muestra © inversamente propercional al ests enunciado mediante la siguiente Se mula: Magnitud del error = o® / EL resultado de le formula scala diferente de la de la medi ceraie? ca (ecuerdese lo analizado en elcap. 5) por lo que es us extraer la correspondiente reiz cuadrada y asi llegar al valor de lo que se denomina error esténdar. En fermi Envoy estindar = a) Es decis, clerror estinda: puede caleulse- se al dividir el valor de la dar dela poblacién por la rala cuadrada del tamatio de le muestra unllizad: (Obsérvese que existen dos situacionas en las cuales Ja postbilidad de error es nula (error estindar igual a 0). Una de ellas se produce cuando en la poblacién original no existe dispersion, o sea, que todos sus datos sen iguales. Al ser el numersder 0, el cociente también es 0, que ete valor divide por cualquier ot arroja ere resulzado. Le segunda stuacin 22 verifica cuando Ta muestra tomada es infinitamente grande, es decks, talidad de poblacisn; en este caso, el denominador @ infinite y el reswitado de divide «1 quler valor por infini (Comp se comprende: stentes en la realidad dela investigacién. En los dates auméricos es prdcticamente imposible evitar algune dis- persién, porque no todos los individuos de tuna poblacién s2 comportan exactaments igual, o porque es casi imposible no come. an la racolaccion de dance, iia estén uando se evaia a let situaciones i las poblacionss de interés son de tamafio demasiado graade como sea posible trabajar con tedes sus sntegrantes, Debe hacerse una consideracién adicio- zal. Cuando, como en los ejemplos con que se ha trabajado, las muestras se obtuvieron sin reemplazo, la formula para el cdlculo delerror estandar debe modificarse al mul- tiplicarla por un factor de correccién. Sin embargo, ese factor de corecciéa geners tun valor de evror estindar cue puede con- siderarse que afecta los resultados de andli- sis posteriores sclo cuando el tamafio de la muestra supers alrededor del 10% del valu men de ls pablacién respectiva Esta situa. cidn eo casi inendztente en les investizacto. nes en las cieaclas de la sald, por lo que en el wabafo habitual, no se tene en cuen- tay se aplicanla séenicas estadisticas como silas muestras hubieran sido abteniéas con reemplazo DISTRIBUCIGN DE MEDIAS ARITMIETICAS DEMUESTRAS El error estindar representa una medi de Ia dispersién de la distribucién de los $84 valores de las medias de muesteas tomadat deuna poblacién, de la misma manera que la deaviscién cotindar lo cs de la disperida Ge loz datos originales Para que este valor adqulera significado en su relacion con la medida de tendencie central -la media aritmetice~ es necesario establecer, empicica o mateméticamente, cuil es] forma de distritucién de la varia ble en el caso que nos ocupa, el valor de la media aritmétice de las distintas tomadas de la poblacién, Esto permite aplicar a la distribucién de las medias de muestras los conceptos ¥ procedimiencos basados en la ecuacién cortespondiente < esa distribucion, anali- zados en el capitulo anterior, can la salve- dad de que en lugar del valor de le desvia- ign estindar debe tenerse en cuenta el éel exor estandar. En funcién de lo enuaciada, puede Gaciese que, de todae las om fa sleatoriamente a partis de una pabla- aida, el 95 snética comprendidos entre poco menos ce dos ecrores esténdar (exactamente, 4,96) por debajo y por enclna dela media aritmetica de la correspondiente pobla- Gen. Por ejemplo, si de una poblacién con 1000 y 6 = 40 se toman muestras puede esperarse que de modo aproximato el 95% de ellas tengan valores, vars su estadistico media aritmética entre y 1.016. Esto es porque el error esta dar enesta situacién es 8 (40 dividide ralz saadrada de 25) y des veces § a 16. Hlene valores de media exit ‘Tenganse presente estos conceptos pata encarar le tarea que se plantea en los capi- tulos siguientes. Asimismo, presente que, desde la ecuacion matemati- 2, cualquier valor de media aritmética de ‘una muestra es posible, ya que gaussiana genera una linea -en forma de ‘campana~ que cubre un area quese extien- de desie el valor de infinito negativo hasta infinite positive IMUESTRAS CON DATOS NOMINALES ‘Al tomar muestras de poblaciones de da tos nominales, la situacion es equivalence a la ya deserita pata los datos “numéricos’ Considérese una poblacién hipetética de 5 individuos de los cuales 4 (P = 05 0 50%) estén enla categoria “enfermos’ ‘Los resultados posibles al tomar mues- tras de tamafo custro (n = 4) se muss. wan en al cuadio 7-3 Tal como en loz ‘cazoe antesiorss, al extimar al pardmetto con el valor del extadistico en ocasiones se “asierta” y en otras se sobreestima o subes- uma, aunque, “en promedio”, se estima bien. ‘También en este caso la magnitud del ‘ertor posible en la estimacion es inversa- coshuuer oars 3 mente proporcional al tamano ¢e la mues- tra: a mayor tamafio de muestra menor error posible. La diferencia estriba en que la distibu- ‘ign no es en este caso gaussiana, sino que puede ser descrita con otra tipo de ecta- én, conacida coma bincrsial, y el valor del error estindar es la raft cuadrada del valor obtenido de: PQ-Din Esto esla raiz cuadrada del resultado del producto dela preporesén en una categoria (0,5 en la categoria “enfermas” en el ejem- lo) pore que no estaenla categeria(1 ~ 2; 5 en el ejemplo] dividido por el temato deh muestn (¥en al elemplo) (CUADRO 7.3, #E5ULTADGS 2) LAS VUESTRES TOVADES CE LW -OBLACION Hi ECA UE CATOS esa =50%6 Notese que, también en este caso, el mano de la muestra es el denominador pa- ra el caleulo del error estandar. Por ello, al fgual que con las rauestras de datos au- ‘mézicos, la magnitud éel error posible 2u- ‘menta al disminuir el tematio de la muestra 9 disminuye con su aumento. SINTESIS CONCEPTUAL + Cuando 22 toman muertras de un con junto de datos numéricos, la media arit mdtica vata entre les musstias, sungue el dato estadistico del conjunto de todas lis poubles es, en promedio, igual a la poblacién de la que fue- de esas muestras toma una forma asimi- lable al distribucién gaussiana, con una ‘medide dispersién cuantificable median- te el enor essindar. los valores estadisticos de musstras de conjuntas de datos naminales varian con ‘una distibucién deserita por la denomi ‘nade distribucién bino: Tanto en €l caso de datos numéricos como en el de datos nominates, el valor del error estandar es inversamente pro- pporcional al tamasio de las muestras, EIEMPLOS mA En una peblacién de adultos sin manties taciones de presencia de céleulos sobre sus superiicies dentarias el contenido de calcio La distribucién de las medias aritméticas 2 en saliva ene un valor de media aritmes- a de 5,6 mg/100 mL, con una desviscion estander de 0,9 mg/100 mL. GEs “poco probable’ o no (P < 0,05) que le media aritmétice de una muestra de tamafio 100 tenga un valor de 53 mg/100 ml? Es poco probatle, ye que este valor esté alejado de la media de la poblacién, 030. més de dos errores estén Gar. Eletror emindar en este casa 02 0,09 (0.9 dividide vals cuadrada de 100), que multiplicedo por 2 es 028. (¥aila mueswa hubier ‘Ro igual 207 El valor obtenido no seria “poco probable", ya que en este caso el ror éstendar seria de 020 (a3 dmdido ralz cuadrada de 20), que multiplicado por 250,40, valor mener que 0,30. ido un tama 72 En una poblaciin de adultos javenes J estatura media (medis aritméiea) es 170 mya desviacidn estindar 0.24 m, gMenor o mayor a qué valor debe ser la ae fo 64 tomada de eza poblacien para poder considerarce que ce esti frente a una situa ign “poco probable” (P < 0,05)? Eletior estindar dela disetbucn de les medias de muestras de ese tamano tomadas 2 esa poblacion es 0.03 (0,24 dividido ratz cuadrada de 64). Los vilores 164 y 176 escdn das erares estindar alejados de I ‘media. Por lo tanto, cuando la media de la ‘muestra obtenida sea menor o mayor, 1e5- pectvamente, que esos dos valores, se esta- ri frente a una situacin “poco probable” nadia aritmsri fs muertea de 8 Paeon D3 PARAMETROS Cuando se evan a cabo investigaciones desciptivas mediante metodologia cuanti- ‘tativa, al objetivo se centra en obtener el valordel pardmatra qua permits darcehie a tuna pablarion an selacién com Ia variable Geinteris, Eee pardmenro cuele estar epee sentado per una propardién o usa media ‘ariunética, segin se empleen datos aomi- rales “huméricos’,respecdivamence, para Inevaluscion de la varable. ‘Eonar Gltimas se hasan en lor conceptos ‘que 2 snulizizon en al capitulo anterior. En exte oe concluys que la media ariimés: cae la tase de Secuencia en una categorie registrada en una muestra, en promedio, esilman en forma correcta los cotrespon- lentes valores de le poblacién. ‘Esto significa que se podrfa intentar esti- ‘mar la proporciéa (e porcentaie) de datos en una determinada categoria, o la media aritmética en una poblacién, al tomar co- smo baseal conncimienta de que tiene alga sna relacidn con el valor de le proparcica de la medis aritmaética (2), caleulada en la muestra utlizads ea la lebo: de investiga- isn, sin embargo, al proceder de esta manera ino espotible tener mucha "contianza’ en la estimacién redizada. Puede haberse tenido la “suerte” suficente para excraer de la ppoblacién un subconjunto de sus integran- ‘es, une muestra, en la que se maniese es: stuscién, aunque, a menos que en la ppoblacién no haya dispersién o la muestra hhava sido infinitamente grande, también puede haberse tenido 1a “mala suerte” de ‘que esozeemtadisticos cobreesimeno aubes- ‘met: Jes parémenses dela poblacién, Ta situacion podria asemelarse ala “con- fanze” que se puede tener de “ganar un sorteo" mediante la adquisicon de uno de ‘entre todos los mimeros que se sortearin. Si estos son 100 y tenemos en nuestro po- Ger uno, podriamos decir que tenemos una ‘confianza’ de uno en cien (0,01 0 1%) ée ‘ganar el premio”. Al conseguir dos o mis de eses mimeros podemos duplicar 0 au menter nuestra “confianze”, aunque, para transformar esa “confianza" en “seguridad” de zarar seria necesario disponer en nes ro poder de la totalidad de los mimeros Ese intervalo numérico se calcula de cal forma que el investigadar puede tener una determinada confianza, aunque no la sexi eidad, de que el wilor buscade se encuentra Sentra de al En dl pedzimo sem 22 analizerdn y fan Gamentarin loz procsdimientoe a parte de jos que se calculan Jos denominados inte valos de conflanza para la estmacion de la media aritmeética de una poblacion, INTERVALOS DE CONFIANZA: DATOS “NUMERICOS” Fundamentos El cuadro 8.1 incluye una serie de mime ros Gie pueden considerarse los datos snuméricos para una dererminada variable, que correspanden a loc intagrantes de uns poblaciéa. Sie procesan extos datos tener de ello las valores 150 para le media wueden ob- ‘eitmética (uj y 19 para le desviacion estan ar (0), respectivarnente Sise toman muestras destovias de tama (a) 25 a partir de esa poblacion, se pue- ce estimar que, en ells, el valor de X ten- derd a ubicarse la mayor parte de las veces cereane 2 150. También puede estimarse quea veces superaré el valor 150 y en otras estard por debajo de él, situaciin que esté Gada por Ia distbucion de loz valores de alvededor dal valordela media dela pobla- ién oviginal. Tal como se menciond (cap. de esa disiribucién es gausdana y la medl- a de su dispersion esta dada por al “error cestandur” (Gesviacion estancar dividida por Jn raiz cuadrada del tamafi dela muestra), 35) Eso significa que, de las muchas mues- ‘ras de tamafio 75 que pueden obtenerse, el 5 de esperar que tenga valores de 5 entre 144 y 156, Estes valores correspon. Gen a dos ernarer attindar (2 x 3 por debaja y por encima dal valor de Ie smusdia de la poblacién, y dentsa de lee que li sezoluciin de Ia equacidn indica que se vubica aproximadamente el 3575 del drez otal, Recuérdese que el valor exacto pare J ecuscién gausslana serfa, en este caso, 196 (valor de z que correspande a los per~ centiles 2,5 y 975 cuando tiene signo nega- tivo 0 positive, respectivament En resumen, si se hiclera una “apuesta’ en la que se indique que al valor que se cobtendea d tomar una muestra de tamaiio 2 de la poblacién del cusdro §.1 estaré entre 144 y 156, puede fenerse tins “con- Banza” del 95% de ganarla: ce estarfa apos- tundo c un resultado quese produce el 95% de les veces, aise sepite dl procedimmiento. Sisequisren probar etupisicaments estas consideraclones, se deben selecclorar va- a forma coerce | sruucaseaninnce | = (CUADRO 81, 2872828 LNAFORLAECN CON y= SDV O= TE aw C3618 a TS te te astra vs ee a a ee a a ye 1 eM ST (Se 28 Fes ee em ee ee ee es a a a a oS Nees tees a) 1 1 TF 10 eo is ‘as veces y en forma alestoria 25 valores del cuadto §-1 (pe, al ubicar el extremo de anlipiz sobre ese cuadro) y calcular al valor de la media aritmética de cada una 4e las muestras asi cbtenidas. Pods verse que lz mayoris de las veces (casi todas) ‘sos valores estarin dentro del intervalo indicado. La situacién de exte ejemplo ex distin, somo ya se habré notads, ale que ze plan tea al realizar una investigaciéa seal. En ‘sta el nvestigador no toma muestras re- petdas de lz poblacién, sino tan solo una y de un determinado tamafo. Sin embargo, puede tener una “confianza’ del 95% ce que Ga muestra seleccionada tiene un valor de® que exté dentro de dos errores ‘stindar en menos ven mis del valor dela ‘media aritmética de la poblecién. Esto es porque, si se repitiera el procedimiento muchas veces, 95 de cada cien veces al ow 18 oS 1 ee Sees ee eee ee wee ee St es interalo construido induisia el valor det yparametro que se quiere estimar. Si procede, entonces, « restar y sumer él equivalente 2 dos errores estander al vor 21a Ze su muestra, obtendré un interva- Jo dentro del que podré decir, con un “95% 2 confianza’, que estima que se encuentra ls media aritmésica de la poblacién que ce (queda deseribie ARealice eate procedimiento con leeresul- tacos que haya obtenido al tomar muesiras ee poblacion de la tabla Es cece, sume y reste 6 (dos errores estandar) a cade valor de & que haya calculato. Les intervilos obteniées incluirén el valor 15) (media aritmética de la peblecién), excepto cuan- 6, por “mala suerte’, hays obtenide una ‘muestra con ¥ menorque 144 0 mayor que 356. Para esta stuacién planteads, el denomi- nado mangen de error calculado o: & sl sezaltade de multplicar 2 (elvalor de ola santidad de erzores Ja confianze Sada en 9500) por 3 (el valor de error estindar calculado para.el tama de muestra, que se 216 en sindar acoclads con Usodet de Student Es posible que ya se haya notedo que, al intentar aplicar el procedimienta descrio para establecer un intervalo de confianza para estimar la media artmética de una oblacién en una sitzacién real, surge una dificukad que parece ser insalvable. ‘En esa sitvacién, se toma una muestra de sane poblacién de a cual no se conece nin nana de sus parémettos. Ast, para obtener an intervale de confiansa, ce debe sumary sear al veler de Is media eritmésica de cca muestra una cantidad determinadi exrores extdndat, 1,95 (0 ce modo apiox- ‘mado 2), st se desea trabajar con una con fanz del 95%. La Gficuliad surge porque, para obtener al valor del error estander, es necesario dividir el valor de la desviacion exténdar de Ja poblacién por la raiz cuadrads del tama fo de la muestra Esta segunda cifra es conoeida par #] que amd la muestra y el nimaro de datas disponibles; el aumerados, en cambio ce deszonacide, La tnice forma de svar ese incon aiente consste en trabajar en forma exclu sive con lo Unico que se dispone los datos coruos el muestra. Se pusde caleular la desia. didn extindar de estos (recuérdese que al denominador en este caso esté dado porlos gados de Ubersad, n — 1), pero el valor resultaate no es el pardmeto que mide la Gspersion en lapoblacion, sino un estadis- tco que lo estima, Alserlotinico disponible, no parece ira oral calcular una estimacion del error esténdar real mediante le dvisi6n del valor @ ea dewiicion estindar de por la rate smmatra (2/0). Act puede caleslarse un intensle al sumarse y verter una clerta cantidad de ess Gel tamafio de ls cestimacida del error estindar a la media saritmetice de la muestra, aunque con reco- nocmiento de que la "conflanza” que se puede tener en que ese intervalo induya el parametro de tendencia central de la po- blacién no es la misma que cuando se dis- pone del valor real dela dispersién. Para recalear el concepte: sise suman y restan dos estimaciones del error esandar (calesladat a partie de ls desviseién emi dar dela muscta), 2 obtiene un intervalo quenct brings unt “condanze’ menor que 1 95% de incluir en dl la media aritmética 2k poblacion. A fin de compensar esta pérdida de con- ‘Banta, el procedimienta que se emmplea al ttabajar solo con datos de una muestra consiste en sumar y restar una cantidad mayor de errores estincar estimados, que Ii que se utilizeris de conocerse su valor real, es decir, que se ajusta el valor ée 2 empleada en el adleula, (Cuinea “mis” dele que indican loz eono- clmnientas auigidor del andlcis de la diswi bbuciin de Gauss fue algo que estudid un ‘matemitico interesado en la estadistica. Por algana rezéa denomunér alvalor que surge de una distribucion derivada de la {aussiana, pero que #5 aplicable al rabafar con muestras y, por ende, con la estima ida del ervor estindar, Ene autor decidié no publicar sus con- lusiones con su nombre, sina mediante el seudénimo ‘Student’. Todavia hay se hace referencia 2 esos valores con la denomine- sida tdeStdent. valor de que debs utlicane Elcuadto 6-2 tiene tres columnas. Laps ‘mera dene el encabezado de “grades de I bermad”. Esto significa que, delas diferentes ‘las que se mcluyen, sera necesario buscar aquella que comesponda alos grades de li- dertad dela muestra con ke que se estétre- Dajando. Pata el elemplo del item anterior, significa que se deberia buscar le informa- ida en ls fila "24", ya que las muestras con que se habia trabalaco eran de n = 25. Tas otras das columnas estin encabera- das por la letra P, que indica prebabilidad. Enlla segunda te indica 005 yen la tercera 2.01, 1b que es equivaleate a 5% 7255, ree pectivamente Esto significa que los valores sn ellas comesponden & la postbildad ée error que sees’ dspueoaaceprar. Coro se deducirs esto representa buscar el valor ‘nila columa 0,05, si se desea tener una “confianza’ de 95%. En defnitiva, sise tomara una muestra de tamafo 25 dela poblacién del cuadro S-1y solo se dispusiera delos daros de asa muss tra es decir. que no se conocizrala dest cién exvindar dela poblacén), la cansided be ecrores sotindar eatmader 4 sumar y estar a la media de la poblacén, para el 7 ES si hat seat h Bue Y i 8 35 a 2 = a 4 ca m0 6 HeGae § te q ERG EES a 4 8 a u célealo del margen de error, serfa 2.064 para eitimar Ja media artudtics de Is poblacién con una confianza de 95%. Fete indmere e: el que epatece en el cuadee £-2 ca i intexseccin de l fla comespondion- grados de Uberad (25 — 2) y la columna encabezads por P = 095. En resumen, para calcalar un intervalo de confienza para la media aritmética de ura poblacidn a partir de una muestra, el pro- cedimiento consiste en: 2) Caloularla media aritmética pla daria. idm extindar dela sauestea, Caleular la eximacién del ervor esta dar a partic dela desviaciéa estdadar de la muestra y su temena, ) Buscar el valor de “Y" corespondient, segin los grados de libertad que da la muesta y la confianza deseada en la estimacién, @) Caleular al margen de error multiple cando el valor del error estandar est- mado a partir de la muestia gorel valor Get enconteado en (6) 4) Caleular lor limites inietioe y 23 dal imervalo rectanda y sumendo dl va. ®) lor de la media aritmérica dela musstra cl valor del margen de error, Como ejemplo, al wrabajar con redondeo a cos cifras decimales, para al caso de una muestra de tamafa 15 con los siguientes valores para cada dace 655; 621; 613; 635 556; E15; G2; 613; 615; 615; 587; 66S: E35: 612 y64s, 8) Calcular Ia media ar yl demiacén exéndar = 71,3 Calctlar ef eccor estindar estimado, as 15) Dela tabla surge que el valor para 95 de contianza y 14 gradas de libertad e 245, Caleur el margen de error 2a4s = 1168. 62 3 8) 552 a) eoruoe i e} Calcul Limtemieror = 625,53 — 1.62 e168s, Limite superior 3+ 1169 4022 En resumen, se puede decir quese estima con un 95% de conflanze que el valor del parémetro media aritmética de la pobla- ‘ciéndela que se tomé la muestra esté entre GLES4y 640,23, obien que se estima que e! parémetro esté entre 62853 + 11.68. En laprictics,estas operaciones se hacen a forma auzomatzada mediante pragea sag infovnésicee pars cileulos exadietizoe y algunas planilas de cilculs, En eos ‘casos solo es necesario ingresar los cories- ppondientes dates e indicar el nivel de con ‘Banza con que se quiere caleular el interva- lo. Lo usual es trabajar con un nivel del 98%, pero es posible utilizar otro, si el in- restigador lo desea INTERVALOS DE CONFIANZA: DATOS NOMINALES aloo de utiliza datos nominalespa ale descripeiéa de la variable, el objetivo cs estimar la proporcién "p’ 0 al p Je correspondiente a una determinada categoria (proporcicn 0 porcentije de enfermas, de mujeres, de posibles votantes por un candidata, etc) Los fundamentos del procedimiento pare ‘alcular un intervelo de confianza son los ‘mismos que aquellos en los que se bas6 trabajo con datos numérices cn Was ro esgauss El trabajo se simplifica di se dispone de tablas en las que los limites inferior y supe- Hor de les intervalos de confianza para les eré ampliarse el experimento por aumen- tar el tama de la muestra Erte dato, ra. mao dela musstes, puade caleularce anter de inisiar Ia tarea y a partic de la micme informacion que se cit6 para el caso de le prueba de“ COMPARACIONES MULTIPLES El anélisis de variancia realizado para lo datos del cuadro 11-3 establece la influen- cla significative del ctor o variable utilize do para conformar los grupos. Sin embar- go, no permite establecer si entre cada une de esos grupos le diferencia es estadistica- mente significativa 0 no, Esas se bisan en establecer cul es la iferencia minima entre las medias aritmé- ticas de les grupos, que tiene una probabi- lidad de ccurir inferior a un valor critico, usualmente 5%, sila hipétesis nula es dadera, Cuando a diferencia observada entre dos de los grupos del experimento es ‘mayor que esa “minima diferencia signifi- ccotiva", se rechaza la hipéteris de igualdad cavtrva de madia aritmética entre lez courespoa- ientes peblaciones. Enel cuatio 11-3 se mucstran las medias atimétices corespondientes a los cuavo grupos del ejemplo, ordenedas de mayor a ‘menor. Liness verticales se usilizaron para indicar que entre los valores unidos por ‘una misma de ellas Ia diferencia no es esta- disticamente significativa, P < 0,05, luego de haber eplicado una prueba de compara cién muliple. En resumen, y para el caso del ejemplo, sola existe diferencia significa iva entee loc grapas Dy B Exiaten varias formas posibles de vedizar eiaz comparacionss multiples. Casi todaz cllas se conocen por el nombre del investi- gador quelasdesarroll6, Anse encuentran, dentro de las més utllizedas, las pruebas de ‘Tukey, Bonferroni Schefféy otres. Algunas son de aplicacién en situaciones determi- nadas y especificis, como a prueba ée ‘Dunnett, que permite la comparacion de cada uno de los diversos grupos experi- mente: con un grupo control. ‘De aueva, les programas informéticos de estadistica ofrecen la posibilidad de ejecu- tar una o varias de estes diferentes pruebas y dan la informacion sobre al resultado corrarpondiente ANALISIS DE VARIANCIA DE DOS ViAS Y EN DISEAOS FACTORIALES En el cato presentado como ejemplo, solo se tomaron dos origenes de variacon, dentro del experimento y el andlisis de vvariancia realizado se conoce coma de "una via’. Solo se evaltia la significencia de un factor o variable independiente En los casos de disetios erperejados, 0 cazndo en una misma unidad experimental se hacen mediciones en diferentes momen- tos (p. e}, madiciones en pacientes en con- icin basal y luego de diversos periodos de administracisn de un tratamiento), se poede ceparer y avaluarla posible varianeia orignads en diferencias entre loz diveraoe pacientes y la generada por el tiempo de aplicaciGn del watamiente. E] cuadro 11-6 muestra un ejemplo de resultados de un anilisis de variancia de “dos vias’. En este caso se tiene un valor de E para cada uno de los origenes de varia- mn. Cada uno de estos valores de F se obtiene al retaciorar, en cada caso, el valor el correspondiente cuadrado medio con el cuadrado medio entre grupos o error expe- rimental. Sein sea que ese valor resulke mayor o menor que dl “eritico”, ert menor ‘mayor que por ejemplo, 0,05 la probabi- lidad del resultado encentrado. En funcion te significativa o no la influencle del factor variable respecivo. er er ‘edo b ee ZT 7 Be o6 EE] a 8 0 H cuadro 11-7 es un ejemplo del andlisis deun disefio con dos factores. Uno de ellos (A) fue evaluado en dos grupos, por efem- plo, dos frmacos, lo que se deduce de un nico grado de libertad que corresponde 2 la variacidn de ese otigen. El otra (B), que podria representar el nivel de edad, lo fue fen tees, zeguin curge de le presencia de lor dor grades de libertad pare d. ‘Los valores que se leen en las columns F ¥y P (probabilidad) indican que es significa ‘tivo (P< 0,05) el efecto de ambos faciores y no asi el de su interaction (P > 0,05). Esto ‘timo indica que puede considerarse que el efecto de A es independiente cel efecto de B Enel ejemplo supuesto significa que el efecto de les dos farmacos evaluados se produce de la misma manera en cada unc delos niveles de edad. Por lo tanto, pueden reslizarse comparaciones miliples entre medicamentas en forma gene Si, en cambio, al efecto de la interaccion renultare significative (P < 0,05), 20 deberie evaluar el efecto de cada aivel del facto: A, de cada fazmaco en el ejemplo, dentro de cada uno de los niveles de edad. (CUADRO 117. ‘CORRELACION Y REGRESION ‘A partir de los muismos principios de par- tclén de la variancia en sus componentes, es posible realizar o:ros tipes de andliss. Dentro de ello merece ser menclonada aqui le evaluacién de la posible selecién existente entre dos o més datos “numé cos" registrados en una misma unidad 0 si- ‘ruacidn experimental Un ejempla podria ser plantear Ia evalua isn de una posible selecién entre l aumento de un dato descriptive de aded con el descriptive de la variable presién aqterlal, 0 la relacién entre la dosis de un Farmaco y el efecto que produce. En estos cases puede calcularse el ¢eno- minada cogfictente de correlacton de Pear- som, que es un niimero con un rango de entte ~1y 1. Un coeficlente 0 (cera) indica ausencia de relacién entre los datos para ‘cada variable; un coeficiente 1 (ano posii- vo) indica una relacién maxima de aumen- to de un dato pera una variable cuanda aamenta el comespandiante ala otra; an cosficiente -1 (uno negative| indica tam- bign una relacion minima, cungue en la cual elaumente de une de les dates se ve acompafiado por una disminuciéa en el ‘orzo. Los valores sntermedios indican gra- duaciones en la evaluacién de la correla Las hipétesis referidas a una correlacién entre variables se formulan con respecto a poblaciones. Si la determinscisn del coef ciente de corselacién se realize a partir de los datos, ton andlisic exeadisticn probsbilidad de obtener ase casficients 3 Ja hipstesic fueve verdadera Segin sea aze valor de probebilided, se vechazard o ne la hipétesis mediante los crterios habituales ‘Ante la existencla de corseleclon puede plantearse el ncerés en descrbir cbmo es la relacion entre los datos. Esto significa, poz ejemplo, evaluar cuanto aumenta (0 dismi- uye) el valor para una o varias variables cuando aumieata una unidad en un deter- minado dato. Asimismo, evaluer si al aumento produddo dgue una relecién lineal o de otro tipo ~cusdritica, exponen- ciel, etcétera—. Loe procedimientos que ae aplican en sos conttiniyen al denominado ancdlicis de represién, Mediante este xe pue- dea chtener las ecuaciones que dessriben la relacién entre los datos y representar va ultima en grificos, A partir del andlisis reilizado con datos de musstras, pueden aplicerse la téenicas inferenciales para esti- mar el compertemiento en la pablaciéa o prober una hipétesis con respecte 2 ela. SINTESIS CONCEPTUAL El anilisis de variancia permite realizar comparacione: entre mis de doz grupo: y esablecer sila influencia e diversos Factores es estadisticamente significativa La base del andiisis de variancia es sepa- var la variacisn total del experimento en Jos componentes que pueden zenerarle v asi estiblecer, mediante el edleulo el valor silavariancia ent graposan ‘es mayor de manera signifcativa que la generada dentie de loz grupos, + Cuando ce encuentra un efects significa tivo del factor de agrupamieato o dife- renclas signifcarhas entre grupos, el andlisis de variancia se debe completar con las pruebas de comparacien mul- tiple Las téenicas besadas en el andlisis de varizncia brindan multiples posibilic des y se emplean con frecuencia en la investigacién cientifica en las clencias de Ia salud. por efemple, en disefios facto- Hiales 0 estudios de correlacién y regre- IENPLOS m1 Se realize un experience pera evaluar 20" el afecte que sels difesenses anti- microblanos producen sobre el desarrollo e una cepa especifica. El efecto se evalué con datos “numerices” (mm de inhibicion ‘registrados en un cultivo) y se hicieron cin- co determinaciones (tamaii de la muestra) con cada uno ee los férmacos, ‘Las datos obtenidos se presentan en el cuadro 11. rabar la hipétesis nula de inexcs- tencia de diferencias entre las medias arit- tices que se obtendrfan en poblaciones eatadae con lor antimicrobiancs, e: aplica- le el andlisis de vatiancie. Loe resultados de aplicer este procedimiento mediante un programa informatco se resumen en el cudro 11-9, El valor de P indica que es posible vecha- zar lahipStesis nala para el valor usual de @ (0,05), por lo que puede establecerse que el efecto del factor en estudio, tipo de antimi- 30, es estadisticamente significatvo. ertablacer eatts cular de lor eva uados le diferencia puede considerarse sig aifcasiva, ce complete el andlisis con una prucba de comparaciones miltiples. El resultado de la prueba de Tukey llevada « cabo con esa fnalidad se muestra en el cua dro 11-10, = Los valores son las medias aritméticas de las muestres tratadas con el antimicrobia- fo que se indice para cada fila. Encre las que se muestran en una misma column las diferencias no son estadisticamente signifi- cativas (P 2 0,05) mientras que si son sig- (CURDRO 119, FESLLTADCS 06. ANAL igendelas Ty sre Quo Tot nificativas (P < 0,05) las diferencias entre las que estan en columaas diferentes. na Se desea comparat les resultados de se- Sistencia flexural de un material en MPa que se obtiene luego de procesarlo con tres técnicas distintas Pera ello, para cu encayo se remite una prozezads concada uns de las tée- ices a cuatro laboretortos Los resultades obteniios se muestran en, el cuadro 11-11 Como s estima que pueden existr dife- rencias entre los resultados obtenidos por los distintos laboratories, ademés de las que podrian existir entre las técnicas, se realiza un andlisis de variancia de dos vas ‘que permite separar la vasiacién eriginada yor cada uno de esos dos factor sesurTanes cea pruesa.oz | | qyaono ar-t1, FESGTENCk FLEWuRAL (ENN) ‘DE UN MATERIAL PROCESHDC CON THES TECNICAS 2\ DSTNTOS LABORATOROS Sy eee ip i CE ae o a a) (CUADRO 11-12, ANALIGE DE VARIANCA DE 59S aS CORAESFONEIENTE AL TLDS DE REITENOA DE hare Crone ey oy a a borest sane. 109) 0 Ere S570 * was Los resultados de ese andlisis se muestran por la diferencia entre ellos se hubiera enel cuadro 11-12. sumedo al error y, con ello, se disminuiria ‘Come puede verse, se encontré significa. la posibilidad de encontrar diferencias siz- tiva la influencia de ambos factores. De no nificativas entre téenicas En otras palabras, hhaberse tenido en cuenta la influencia de] hubiera sido menor el poder del experi. factor laboratorio, la variacién producida mento para detectarlas. 12 PRUEBA DE CHI-CUADRADO La formulaeiéa de una hipécests nula ‘cuando se rabafz con datos nominales pue- de hecerse enunciando la igualdad de las proporciones © porcentales en les pobla- ‘clones invelucradas. ara el caso de comparar das grupos, po- dria enunciarse en sfmbolos Hy: 2, ~ Ps 0; 0 sea, que es mula le diferencia entre Tas proporciones.o los poreentaies, deindi- viduos en una detenminada categorie para ‘anubas poblaciones La decision de vechazo 0 aceptacién de ‘esa hipétesis puede escogerse a partir del andlisis de la diferencia observada enwre proporciones de muestras tomadas de am- ‘bas poblaciones. El procedimiento puede ser bastante similar al de una prueba de t ‘con datos numéricos, ise dan clertas con- diciones relativas al tamafo de muestra ds se venaje con cetee ce 5 puets de = 45: prose ce f (thicuadrado), COMPARACION EN TABLAS DE 2x2 En el cuadro 12-1 se muesiran posbles resultados de Wh expertmento en el cual se inventan comparar dos situaciones exper ‘mentales con respecto 2 una variable eve- Inada mediante datos nominales dicéto- ‘Los datos representan en el ejemplo la frecuencia de “exitos’o “fracasos’, diferen- ciados en las filas, obtenidos en cada uno de los dos grupos, que padvlan estar repre. sentados por les tratumientor A y 8, dife. renciados en las columnas El objetivo es establecer ai, a partir de estos datos, puede estimarse que exista ferenca entre los dos tratamientos varts- ble independiente, en cuanto al resultado, axito o fracaso, que es la variable depen diente Teniendo presente que lz hipétesis nula 5 lb inenistencia de ese diferencia, puede determinarse cual es el resultado esperable en el experimento, siella es verdadera Ere resultado esperable ze muesta en al euairo 12-2 ‘CUADRO 12-3, TABLA22 0 Se verilice, entonces, que se ha encontra- do una diferencia entre lo ebservade y lo esperado que se muestra, para cada condl- cion de tratamiento y resultado, en el cua- dro 10-3 Puede observarse que la suma de todas esas iferencizs es cero, lo que no permite cuantificar la diferenda producida, Para posibiliter esa valoracién, se eleva al cua Grado cada una de ellas y se la relaciona con al valor experada para la eoreespen— Glance oalds ‘Asi, para el ejemplo, se muestran en el guidso 12-4 los valere: G46 = (07 / 239); 5248.5 (20 / 41). Lasuma de la totalidad de ezoe valoves obtenides, 5,73, puede ser ubicada en una distribucisn que también tiene una vinculacién con la distrbucién gausstara, La ciate dispesiaon se conoce como distribucion de chi-cuadrado (72) y en lla se puede encontrar un valor que sep2- 1a dl drea “més probable’ (95%) de a “poco probable” (5%). od a seeccionads dice una situs Al igual que para las distribuciones de *t” y de "Flos valores criticos para chi-cua- rade dependen de loc grados de ibernady lnivel de o.que oe elja. En tablas de doble entrada, los grates de Ubertad estén dados por el producto del nimero de fas menos tno, por el nimere de columnas menos ‘ano, Para eleaso en ands, las columnasy Jas lesson des, por lo que la stuacion es de un grado de libertad: (2 ~ 1) x (@— ed Bl ciaéro 12-5 muestra algunos valores de chi-cuadrado para diversos grades de libertad yP = 0,05. Se observa queparz un geado de libertad l valor critica 2384 Como al valor 72 = 5,79 cbtenida en al xpetimente supers al “cuitico", puede aceptase que P< 005, rechazarse la hupstess aula y decuse cue la duferencia enue ambos watamlentos es estedistica- ‘mente signicativa, Como en otras pruebas de hipstesis, debe establecerse de manera separada si las diferencias con valor esta- distco son relevantes para penser en su ‘waduccion en decisiones de aplicaciéa el- nica @ de oto tipo, ‘ie haberse lngad 2 na stsscién con vearia, Po a 0,05, deberia analizarse ciel ‘CUADRO125, ALGUNGS VALORESOELA coma ts ae poder del expersmento 5 eladecuato y, en 450 contratio, calcularse cxénto debe au- mentarse al amano de la muestra para ase- gurar un nivel razonable de error de Tipo IL CCOMPARACIONES EN TABLAS Fx C En el cuadro 12-6 se muestran los resul- tados de un posible experimento enel cual ‘s¢ comparan cuatro grupos (fas) en fan- en de una variable evaluada con datas nominees con dae categoriae posible: (colusanas) El procedimiente de cilcule del valor de ‘hi-cusdrado para el experimento 6 el ya escrito para las tablas de 2 x 2. Se calcu- ik el valor esperado segua la hipotesis para cada celde, valor que se muestra entre pa- réntesis en cada una. Comoeneste caso las smuestras no son de igual tamafi, los valo- es esperados son proporcionales al tama- fo de la correspondiente muestra (CUADRO 12-6, DATOS Y CHLCLADAADO PARA Ps celda el valor de chi-cuadrado es igual alcuadrado de la diferencia entre lo ‘observado y lo esperado diviéo por el correspondiente valor esperado. La suma de todas elles (22,1) esel valor de chi-cua- drado total, que se compara con el crtico segin los grados de libertad que, en este segundo sjemplo, son tes: (2 ~ 1) por le wltplicado por 2 - 1) rporlac custo fas El valor significative del cjemple indica que existen diferencias estadisticamente significanvas entre las poblaciones de las cuales se obtuvieton lot cuatro grupos. St se quiere avanzar en establecer entre cuales de ellos esa diferencia es significativa y entze cuéles no, debe continuarseen la par- ‘ela delvalor dechi-cuadrado de manera similar 2 como se particiona le suma de cuadrados en el caso del andlisis devvarian- cia. Exe iltimo procedimiento se conduce yporel que practics sl andlisisy no ce zeal. automisiea por loz programas {cdleslaa el velor glo- ‘estedictices,los que bal de chi-cuadrato, ‘CONSIDERACIONES ADICIONALES ‘La prueba de chi-cuadrado tiene algunas lumsaciones que tmaposibilitan su empleo en algunos casos. Evra, come cu novbre lo indica, petmize ecublecer con excettad ai ze extd frente a tuna situaciéa que otlenta hacia el sechazo oaceptacion della hipotesis nula, de acuer- do conel nivel de a elegido. Algunos autores recomiendan también, para el caso de un grado libertad, realizar ‘una correcciin al valor de chi-cuadrada cobtenigo en el experimento; s* ra comteccidn ce Yates, y algunos progra- mas estadisticos la hacen de maners 2ato- Cuando 2e trata situaciones con mdz de ua grado de Mbertad, tables def ¢ no Gebe aplicarse la prucba si existe alguna Ccelda en le que el valor esperado sea mener que 1, © sien més del 20% de allas ese valor es menor que 5. En estos casos, se agrupan ‘cateqorias para cambiar la situacion, Algunas modiicaciones al procedimmien- to bisico permiten realizar la prueba de upétesis en algunas condiciones diferentes de las ejernplifcadas aqui Ad, por ejemplo, pueden valorarse los star nominales obtenicos en disafios con grupos empareiadas, no independientes, mediante el chi-cusdsado de McNemsr o, cuando se veloran varios factores, mds de una vatiable independieate, con el uso del cchu-cuadrado de Mancel-Haenszd. SINTESIS CONCEPTUAL La prucba de chi-cuadrado es la de uso mis frecuente para la prueba de una hhip6tesis cuando se trabaja con datos de categorizacidn que se resumen en fre- A partir de las diferencias entre las fre- cuencias cbservades y las esperadas, en funcién de la hipétesis aula, se calcula \r que se puede ubicar en la distri. icién conocida coma distribucén de chi-cuadeade ‘+ Sepia a elvalor de chi-cuadrado obteni- de supers © a0 un valor exitioa accrde con elnivel de significancta, se rechazala hipotesis nula planteada o no. «La prueba de chi-cuadrado esaplicable a situaciones de tablas con cualquier nii- meco de columns (6) yeualguier nime- ro de Blas (6) + La pructa de probabllidad exacts de Fisher es aplicable cuando en tables de 2 x 2alguno de los valores esperadoses menor que 5. EJEMPLOS 1a ‘ars extablecer la conveniencis 0 ao de seemplatar un procedimiento cerapéatico ‘ya conocide con une de reciente desa:rallo se llevd a cabo un exper Wister, Con allas se conformaron dos grupos, cada uno tratade con uno de los procedi- mientos @ comparar, respectivamente. El resultado se evalué registranda después de tun lepso preescablecido sila unidad exper mental, rata, habia sobrevivido o no. Los resultados fueron los siguientes: oar La pruzbs de chi-cuadrado posibilita pro- bar la hipétesis nula deinexistencia de aso- ciacién entre el tratamiento aplicado y el resultado obteni¢o. Para este cato, el valor de chi-cuadrado calculado es 2.508 (sin correccién). Como sitvacdn ar de selo un grado de lberead, y elvalor ez menor que aqual al que le caress como onde una probabilidad de 005, no debe rechazarse la hupetests aula. No se pudo encontrar diferencia estadisticamente sig- rificativa entre los resultades obtenides ‘con antbos tratamientos 22 En otro experimento se aplicaron uno de os bactericidas 0 uno de tres bacterlosté- ‘eeor en grupos de unidades experiments. Jes. En total se constituyeron, en conse cuencis, cuatro grupos, y en cada ano de cles ge regizs positiva © neg: smentales ‘Los resultados fueron: sie habis logredo efscto vo en les unidades exper En aite caso loz grado: de libertad con 2y dl valor de chicuadrade que surge de lee cdlcalos es 11,85. La probabllidad asoctada con éles menor que 0,05, por eclararse que existen diferencias signiice- ‘vas entre lo observado y lo esperado oque las diferentes sustancias evaluadas producen un resultedo signifcativamente diferente Un posterior anilisis indicaria que le di- ferencia entre los resultados obtenidos con bactericidas y bateriostéticos es significati- mientras que no existe sigifcaci ertadistics en las diferencia: dentro de ead ‘uno de az02 dos tipes de suztanciae 13 ESTADISTICA NO PARAMETRICA ‘as prichas de "P ylaz relacionadas con al andlisis de varlancia <2 utlizan para al ‘ribsjo con datos “numnétices”. Ambas tée -nicas ae beta ea le suposiciga de que lor datos con que se trabaja estén distribuidos ‘en forma gausslana en les respectivas po- lactones, Lashipotesis que se prueban con ells in- ‘luyen alguns suposicioa con respecto 2 parémetros como la media aritmética o le variancia; por este motivo, se las conoce como pruebas paramétricas, y « su estu- dio y derarcollo como estadistica paramé- trea. Existen stuaciones en queesa suposicién mnencionado en & no 6 da, como ‘capital 6 aun cuande ce trate de dato: “numésicos’ continues, Cuando los dator ton dlzcretosy, més ain, cuando se trate de datos ordinales, como {ndices o puntsles, es todavia més diffed suponer normalidad ‘en la distrbucion. Tengese en cuenta que Iacurva de Gauss es una linea continua, le que no se puede obtener en estas tltimas Sila distribucion se ales de manera muy significativa dele gaussiana, y especislmen. ‘te cuande las mnusstras son selativamente pequefiaz en tamafio, el empleo de prashar cectadisticas besadaz en eza dietbueién puc- de no ser convenieate Hacerle podria e- ‘yar anineles de error en la toma de decisio- nes superlores a los establecides en teoria ‘Una altemativa para esos casos puede ser “ransformar’ los datos calculanda su lega- ritmo, 1aiz cuadrada o mediante algun ‘wa funcién matemética. Si con los detos asi transformados se ebtiene una distrbu- ‘ign que no se aleja de manera significativ de la gaussiana, as posible aplicar pruebas paramétrices (Ota alternativa es formuler hipétesis que no inelyan en su enunciada la peasen- Gia de parimetsos como la media arismétl cao la variancia

You might also like