Download as pdf
Download as pdf
You are on page 1of 33
36 Organizacién de los datos para reducir al minimo el error estadistico ee Introduccion 36 Contral del error de muestreo 37 -Estimacin estaistia cuidadosa contra adivinacién oestimacign apresureda 40 ‘Error de muestreo y su manejo con Tateorfade Is probabilidad 41 Control del error de medicién 42 [Niveles de medicién: seloccién cuidadosa de los procedimientos estadisicos 42 Medicion 42 Variables nominales 43, ‘Variables ordinales 44 Variables de itervalo 44 Variables derazén 45 (Cémo mejorar el nivel de medicién 47 Distineién del nivel de medida yunidad de medida 47 Codiicacién y conteo de observaciones 48 : Introduccién Distribueiones de frecuencias 50 Estandarizai6n de distribuciones de puntaciones 51 Cotlfcecién y conteo de datos deintervalofrazén 52 ‘Redondeo de las observaciones deintervalokaz6n 53 ‘Los limites reales de puntuaciones redondeadas 53 Distribucienes de frecuencias de proporiones y de poreentajes para variables de intervalofrazén 55 Distribuciones de frecuencias de porcentajes acumulados 56 Percentiles y cuales 58 ‘Agrupactén de datos de intervalofaaén 60 Insensatez y falacias estadisticas: J importanciade tener una muestra representativa 61 ‘Ast sea realizada para la investigacién cientffica, 1a mercadoteenia de tn producto, un pro~ néstico meteorol6gico o una simple apuesta, la predicci6n del futuro es un pasatiempo co- imiin, Los cientificos realizan predicciones empiricas para probar la exactitud de sus ideas. Por ejemplo, zcudl es la probabilidad de que seas vietima de un delito en tu érea de trabajo? ‘Madri2 (1996) encontré tres factores de predicciGn basados en la idea de que el riesgo de ‘er victima de un delito puede reducirse por medio del estudic cuidadoso de actividades ru- tinarias. Un primer factor de riesgo es Ja exposiciOn, o vulnembilidad circunstancial, como ee yuY Conuol delerorderauesteo 37 wwabajar solo por la noche en una tienda. Un segundo factor es la proximidad a delincuentes potenciales, como trabajar en tna tienda ubicada en una zonacon un alto indice delictivo. Un tercero es el atractivo del objetivo, es decir, desear la propiedad de una victima, por ejemplo: tener grandes cantidades de dinero disponibles. Si el duefio de una tienda pusiera a sus empleados en riesgo innecesario, un robo asesinato no serfa un suceso aleatorio o una equivocacién; serfa un error. En el capitulo 1 notamos que los errores son grados conocidos de imprecisién. Conocer la relacién entre Jas circunstancias y la probabilidad de un robo permite realizar mediciones preventivas que reduzean las oportunidades calculadas para que los “errores* ocurran. Las mediciones para Ja reducci6n del riesgo podrian incluir tener al menos dos erapleados presentes, cerrar a las 11:00 p.m. ubicarse en un lugar de trénsito denso, manejar pequelias cantidades de dinero es hasta qué punto todos los segmentos de una poblaci6n realmente estéa incluidos en la muestra: la representatividad de Ja muestra. Una muestra representativa es aquella en la que todos los segmentos de la po- blacién estén incluidos en la muestra en sus proporciones correctas respecto a la poblacidn. Por ejemplo, si una poblacién del campus realmente es 54 porciento hombres y 46 por ciento mujeres, una muestra representativa tendré que acercarse a 30s porcentajes. Muestra representativa Muestra en la que todcs los segmentos de la po- blacién estan incluidos en la muestra en sus proporciones correctas respecto a la poblacién, ‘Una muestra no representativa es aquella en la que algunos segmentos de la poblacién estén representados en exceso 0 con defecto en la muestra. Este es un tipo riesgoso de error dde muestreo porque puede generar resultados totalmente engaflosos. Supongamos, por ejem- plo, que la administracién del campus desea encuestar a estudiantes sobre su apoyo para am- pliar el estadio de fdtbol. Los voluntarios de la asociaciGn estudiantil de enfermeria Hevan & ‘cabo la encuesta y se les pide registrar el voto de cada décimo estudiante; en cambio, ellos re- aistran los votos de cada décimo estudiante que sale del edifisio de enfermeria, Sin sorpresa, a Capitulo? Orgariacién de los datos para educr al minim el eror estate los resultados muestran que s6lo 23 por ciento de estudiantes estin a favor de la ampliacién. {Por qué? Porque los miembros de la asociaci6n en realidad encuestaron a la poblacién de estudiantes de enfermerfa, que en su gran mayorta son mujeres y, por tanto, no es represen tativa del campus en conjunto, Dirfamos que esta muestra estd sesgada por una porcién muy desproporcionada de mujeres. Tal muestra no representativa permitié que un segmento de la poblacién tuviera més “votos” de lo que les correspondfa sobre una cuestién. Hay una variedad de disefios de muestreo, pero uno de los més empleados es la muestra aleatoria simple, Una muestra aleatoria simple es aquella en le cual cada persona (u obje- to) de la poblacién tiene la misma oportunidad de ser seleccionado(a) pare formar parte de a muestra. (En términos técnicos, decimos que todos en la poblacién tienen una misma pro- babitidad de inclusién en la muests,) Este disefio es como unatrifa o loterf, en Ia que cada persona de la poblaci6n sélo entrarfa una vez. Una muestra aleatoria de tamafio suficiente produciré normalmente una muestra representativa. Muestra aleatoria simple Mvestra en la cual cada persona (u objeto) de la poblacién tiene ta misma oportunidad de ser seleccionadola) para formar parte de Ja muestra, Control del error de medicién ‘Ademds de evitar los errores de muestreo, debemos definir con precisi6n cémo se harén Jas mediciones y cémo se codificarén las respuestas una Vez que se recopilen los datos. El Conjunto de procedimientos u operaciones para medir una variable se llama definicién ope- ‘racional. Por ejemplo, supongamos que utilizamos datos del censo de Estados Unidos para dirigir un estudio sobre la pobreza urbana, con una muestra de 300 ciudades. Existen varias formas de operacionalizar una medida de la pobreza. El desaffo consiste en seleccionar la ‘manera que represente con mayor precisién cudntos hogares en una cindad estén habitados ‘por familias pobres. Una medida es el porcentaje de hogares que reciben vales de alimentos, Uni segunda es la tasa de desempleo en Ia ciudad. Una tercera seria el porcentaje de hogares que viven abajo del nivel de pobreza que se define en el émbito federal (ingreso especifico justo para el tamafio de la familia), De hecho, la tercera opcién generalmente se reconoce ‘como la mejor aproximacién hacia la pobreza para una comunidad, y por ello la escogerta- ‘mos como nuestra definicién operacional. Una gufa eficaz parala eleccién de una definicion coperacional consiste en identificar los tipos comunes de error de mediciGn y hacer todo lo posible para minimizarlos. 7 Niveles de medicién: seleccién cuidadosa de los procedimientos estadisticos ‘Medicién La medicin es la asignacié de simbolas, tanto nombres coro niimeros, a las diferencias (que observamos en las cualidades 0 cantidades de una variable. La medicién de un sujeto particular de la muestra en una variable es 1a puntuaci6n del sujeto para esa variable 0, para user terminologfa computacional, un c6digo. Supongamos por un momento que la clase de estadistica constituye una muestra."Podriamos registrar las varibles de edad, semestre, ‘género, promedio y raza. Para una estudiante, Juana, estas puntuaciones son 20 en edad, pri- rer ingreso en Semestre, femenino en género, 3.25 en promedio y blanca en raza; para ot, BIJ Niveles de medica: sloccién cuidadoss de oe procedimients extadsticos 43 Rubén, las codificaciones respectivas son 19 afios, estudiance de segundo semestre, mascu- lino, 3.48 en promedio y afroamericano. Utilizaremos los términos puntuacién y cédigo indistintamente, El valor de una puntuaci6n es su cantidad, Como esta simple ejemplificacién revela, no todas las variables se miden de la misma forma, Algunas se registran con nombres 0 categories que identifican diferencias en tipo 0 calidad, como afroamericano y blanco pare la variable raza. Otras variables permiten distin- ciones de grado o distancia entre cantidades, como las varizbles de edad y promedio. Estas variables tienen una unidad de medicién, un intervalo deierminado o distancia entre las cantidades de las variables. Las anotamos numéricamente, como Jas marcas numeradas en ‘una regla como en una cinta métrica, La unidad de medicién para una escala de temperatura es un grado; para el peso, un kilogramo; para la altura, un centimetro, y asf sucesivamente, Para comprender las finas distinciones entre las propiedades de medicién de las va- riables, usamos un esquema lamado niveles de mediciGn, El nivel de medicién de una variable identifica las propiedades de medicién, las cuales determinan el tipo de operacio- ‘nes matemdticas (suma, multiplicacidn, etc.) que pueden usarse apropiadamente con dicho nivel, ast como las formulas estadisticas que se utilizan para probar las hipétesis teéricas. Estos niveles se aman nominal, ordinal, de intervalo y de raz6n, El nivel de medici6n de una variable es una gufa importante para seleccionar frmulas estadisticds y procedimientos. Nivel de medicién de una variable tdentitia las propledades de me- dicién de la variable y determina el tipo de operaciones matamticas (zuma, mul- tipicacién, etc.) que puede usarse apropladamente con dicho nivel, aé{ como las formulas estadisticas que utiiza para probar is hipétess tesricas. Variables nominates Las varlables nominales son aquellas en las que los c6digos sdlo indican una diferencia en categorta, clase, calidad o tipo, La palabra nominal viene del vocablo latin para nombre y estas variables tienen categorfas de nombre, Algunos ejemplos incluyen lugar de nacimiento (Chicago, Atlanta, Monterrey, etc), sabor favorito de helado (vanilla, chocolate, galletas y crema, etc.), marca de automévil (Ford, Lexus, Pontiac, ete) y carrera académica (psicolo- fe, quimica, ingenierfa eléctrica), Las variables nominales no admiten puntuaciones numéricas ordenadas significativa- ‘mente, No obstante, gracias a que las computadoras procesan nimeros con mayor eficacia, & ‘veces numeramos las categorfas de estas variables en cédigos computacionales. Por ejemplo, para la variable género asignarfamos los cédigos como O= hombre y 1 = mujer. La eleccién de niimeros para tales o6digos es arbitraria; también hubiéramos podido codificar 0 = mujer y 1 = hombre. Ademés, las categorfas de una variable nomiral no pueden clasificarse signi- ficativamente en orden de magnitud (de elevado a bajo) aun cuando se asignen cédigos a los ‘imeros ordenados. Por ejemplo, codificar mujer como 1 y hombre como 0 no implica que Jas mujeres tengan una puntuacién de 1 0 mAs que los hombres. No existe ninguin sentido de grado con las variables nominales. Una persona es hombre 9 es mujer, y en cualquier caso no tiene un grado, Incluso algunas puntuaciones numéricas en apariencia son realmente va- lables nominales. Por ejemplo, el nimero del seguro sociales, de hecho, una categoria y no tiene sentido calcular su promedio, Puesto que muchas variabies nominales tienen s6lo dos categories, existe un nombre especial para ellas. Una variable dicot6mica tiene sélo dos categor(as. Una variable dico- “ CCaptsio2 Orguntzacin de los datos par educa minim el error estadstico ‘émica comiin en las encuestas es cualquiera con las respuestas “sf” y “no” y, en disefios de jnvestigacion de Iboratorio, aquelia que ditingue la “presencia” (el grupo experimental) 0 Ja “ausencia” (el grupo de contro). Par ejemplo, al probar la efecividad de un nuevo medi- camento contra la fiebre de beno, al grupo experimental se le administra la nueva droga ¥ se registra como 1. Al grupo de control se le da una droga de imitacisn (0 placebo) y se registra como cero. En la computadora llamamos GRUPO a esta variable. Cuando deseamos aislar al grupo experimental para el andlisi, damos instrucciones a la coraputadora para que busque los c6digos de GRUPO y seleccione dichos casos con el cédigo 1. Variables ordinates ‘Al igual que las variables nominales, las variables ordinales de:ignan categorias, pero tie- nen la propiedad adicional de permitir clasifcar las categortes desde 1a mayor hasta la menor, de la mejor a la peor o de la primera a la sltima, Las variables ordinales comunes incluyen clasificaciGn de clase social (alta, media, baja, indigente), nivel de clase educative (Gttimo afio, primer ingreso, etc.) y calidad de vivienda (esténdar, insuficiente, en ruinas) Las preguntas de estudio que miden actitudes y opiniones a merudo emplean puntuaciones drdenadas. Por ejemplo, la variable “‘actitd hacia el aborto legil” podria ordenar el grado de acuerdo mediante el uso de categorfas de respuesta: totalmerte de acuerdo, de acuerdo, no sabe, en desacuerdo, totalmente en desacuerdo. Este conjurto de cédigos ampliamente utilizado se denomina escala de Likert, en honor a su creado, Rensis Likert (1932). Variables de intervalo Las variables de intervalo tienen las caractersticas de las variables nominales y ordinates y ‘ademés una unidad numérica de medicién definida, Las variables de intervalo identfican las. diferencias en monto, cantidad, grado o distancia y se les asiguan puntuaciones numéricas uy tiles. Los ejemplos incluyen la temperatura (registrada al grado térmico més cercano) yyel coeficiente de inteligencia (CI), que va desde cero hasta 200 punios. Con las variables de interval los intervalos 0 distancias entre las puntuaciones son las mismas entre cualquier par 4de puntos en laescala de medicin. Por ejemplo, com Ia variable temperatura, la diferencia entre 10y 11 grados Fahrenheit es la mismaqne entre 40 y 41. Un conjento de unidades de medicion ordenadas hace posible sumar, restr, multiplicar y dividir puntuaziones y caleular promedios. ‘Las variables de intervalo dan un sentido de “cuénto” o “ée qué tamafio”, qué tan ca- liente, qué tan obstinado, qué tan conservador, qué tan deprimido, qué tan largo y qué tan pesado. Con las variables de intervalo pensamos en términos de distancia entre las puntua- ‘ciones sobre una linea recta, Por ejemplo, si el promedio de las calificaciones de un grupo en tuna prueba es 80 y Carlos obtuvo 85 y Berta 90, entonces la puntuacién de Berta estuvo dos ‘veces més arriba del promedio que Ia puntuacién de Carlos. Ademés, los mérgenes de error con las variables de intervalo estén ms definidos y son mis ficiles de manejar porque las puntnaciones numéricas pueden redondearse, ‘Comparar las propiedades de variables de intervalo y variables ordinales es informativo, ‘A diferencia de las variables de intervalo, las variables ordinalss carecen de una unidad de ‘medicién determinaéa, aun cuando las eategorfas ordenadas seaa numeradas. Por ejemplo, la posicién final en una carrera de caballos (1, 2,3, etc.) es slo ordinal; simplemente indica qué caballos eruzaron la linea final en primero, segundo y tercer luge, y as{ sucesivamente, pero ro aclara qué tan separados terminaron unos de otros. Ademés, la resta entre nimeros de posicién de tna variable ordinal proporciona s6lo diferencias entre los lugares que ocupan, no distancies entre sus posiciones. Por ejemplo, si los caballos llamados “Piemas Lergas” [iveles de medica: selecein cudadosa dos procedimientasexdislons 45 y “Problemas en el Puente” terminan en tercero y sexto lngar, respectivamente, entonces “Piemnas Largas” lleg6 tes posiciones adelante. Estos caballos podiian haber Uegado a la ‘meta separados por unas cuantas pulgadas 0 cientos de yardss. Mientras las variables ordina- Jes permiten algunos célculos, como diferencias en posiciones y posicién promedio, tienen utilidad matemiética limitada, Las variables de intervalo po:een ulilidad matemética mucho ‘mayor que las variables ordinales, Variables de razén ‘Las varlables de razén poseen las caracteristicas de las variables de intervalo y un punto cero verdadero, donde una puntuacién cero significa “ninguno” o ausencia de atributo. Peso, estatura, edad, distancia, tamafio de la poblaci6n, duracién en tiempo y promedio son ‘ejemplos de variables de razén, ‘Comparar variables de raz6n con variables de intervalc resulta informativo porque am- bbs tienen intervalos establecidos en su unidad de medicin; pero sdlo las variables de razén incluyen un punto cero con significado. Algunas variables de intervalo pueden tener una pun- ‘tuacién de cero, pero el punto cero es arbitraro; es deci, podria colocarse en cualquier punto dentro del rango posible de una variable porque el cero no significa “ninguno”. Por ejemplo, Ja temperatura cero no significa ausencia de temperatura. Asf, en la escala Fahrenheit esté ubicado en 32 grados abajo del punto de congelacin, mieatras que en Ia escala Celsius se ‘encuentra en el punto de congelacién. Los puntos cero verdaderos de las variables de razn permiten incluso mayor flexibili- dad en Jos eéiculos y el andlisis estadfstico. Al igual que las variables de intervalo, las varia- bles de razén pueden multiplicarse y dividise, pero también podemos calcular razones, de ah{ su nombre. Una razén es la cantidad de una observacidn con respecto a otra. Pot ejem- plo, si Juan come tes rebanadas de pizza y Esther come ura, la razén es tes a uno, que se eseribe como 3:1. Con una variable de nivel de razén, la respuesta para una razén calculada tiene sentido, mientras que con una variable de intervalo no la tiene, Por ejemplo, un joven de 40 kilogramos es dos veces més pesado que tno de 20 kilogramos, una razén de 2:1. Pero no tiene sentido afirmar que tna variable de intervalo temperatura en Miami, donde hay 80 grados, es cuatro veces més calurosa que en Nueva York, donde hay 20 grados. Nueva York ‘no €s calurosa en absoluto. Entonces, una manera de determ:nar si una variable tiene un cero verdadero es intentar interpretarlo como una razén. Si le razén no tiene sentido, la variable std, si acaso, en un nivel de intervalo y su punto cero es arbtrario. Debido a las similitudes de los procedimientos estadisticos aplicados a Iss variables de intervalo y alas de raz6n, a menudo agrupamos estas distinciones refiriéndonos a estas varia- bles como intervalo/raz6n, De igual modo, nos referimos a les variables nominales/ordinles. La tabla 2-2 resume las propiedades de los cuatro niveles convencionales de mediciGn. En resumen, para determinar el nivel de medicién de una variable, formula estas pregun- tas y sigue el diagrama de rbol que presentamos a continuacién: 1, {Se marca Ia varjable si se usan nombres de categorfa como “masculino” o “femenino”? Sies asf, entonces el nivel de medicién es nominal, Estes nombres de categorfa gpueden Clasificarse de bajo a alto, por ejemplo clase baja, clase obrera, clase media y clase alta? Sies asf, entonces el nivel de medicién es ordinal. 2. {Se marca la variable si se usan valores numéticos, per ejemplo 1, 2, 3, etc., pero las puntuaciones simplemente designan posiciones, por ejemplo primero, segundo y terce- 10? Sis asi, entonces el nivel de medicién es ordinal. 46 Capftolo_Organizai6n 6 os datos pare redocir al misimo el enor estaitico TABLA 2-2 | Caracteristicas de los cuatro niveles de medic TABLA 22 | Caracterisicas Soe ee ———————— ‘ive ‘Gperaciones medicién —__Ejempios Cualiites ‘atomdticas permitidas, ‘Nominal ‘Genero, raze, preferercia eligiosa, _lasfcacién en dos Conte del mmero estado civil catagories: denominacién _ de casos (es deci, ce categorias frecuencia) de cada ‘categoria de la variable: ‘comparacin da tamatios de categories Ordinal Rangode clase social, preguntas Casifieacién de oda lo anterior mss de scttud y opiniin categories: ordenamiento cio de mayor que y derangos decategorles menor que, y céleuios de de bajo a ato Aiterencias y promedios se rangos Intervato ‘Temperatura indices resumidos, Todo lo anterior mas Todo lo anterior més cescalas de eatiud y opinion ) Siuna familia tiene tes vehiculos registrados, ccuél es el rango percentilar de Ja familia? Interpreta tu respuesta. A continaacién veamos una lista de calificaciones de examen de medio curso para tun grupo de 14 estudiantes graduados. Nombre dot estudlan Callficaciin de examen de media curso onattan 7 ‘Susan 2 Jason 98 Andres 62 Ket 64 onaitar 94 James 19 rian 88 Wiliam 6 Carosine 96 Patricia °0 Kevin 98 Mark 88 efitey 92 4) Calcul el rango percentilar de Jeffrey con bas del examen presentado, ») Calcula el rango percentilar de Brian, el conjunto de calificaciones 6 Ccaptslo2 Organiznein dels datos para educa mimo e enor estado Conjunto de problemas 2B 2B-L. Indica el nivel de medici6n de ls variables siguientes. Nombre Definiotén operacional y coditicacién ‘Nivel do Wevariable _(cémo se mide y registra la variable) rmediclén 8) PESO Peso fsico en bras b) DENSIDAD —_Poblacién (ndrnero de personas que resigen er una zona dafinda) por mila cuadrada de drea ©) TASAMORT —Tasa de mortalidad infant: nomero de muertes en {el primer afo de vida por 1 000 nacimientos 0) ESTUDIANTE —Sttuacién estudlantl: 1 = pasante; 2 = graduads: 3 = espacial 2) ESTIMA ——_Evaluacién de autoestima: escela de resumen de 15 renglonas con calficacionas de 0 a 60 f) SATISTRAS —Salisfacclén en el trabajo: O = muy insatistacha: inctistecho; 2 = salisfecho; 3 = muy satisfecho 1g) EXPECVIDA —_Expactativa de vida: ndmero promedio de afios que recién nacidos pueden esperar vivir (usualerte ajustado a cexo y edad) —_——oarL—YLYIr,— 28-2, En un estudio de cuidadores de miembros mayores de familia, 293 mujeres son ‘entrevistadas respecto al estrés de cuidar y mantener empleo al mismo tiempo. entifica los niveles de medici6n de cada una de las variables siguientes de este estudio. Nombre Datinicion operacional y codlficacion Nivel do de (cémo 80 mide y registra la varlablo) madioién Verlables de culdador @) DISTANCIA Distancia desde casa al rabajo en miles 'b) EDADCUID Edad de! culdacior en arios 2)SALCUID —_Punlusclén de salud indicada: + = mala; 2 regular; 3= buena; 4 = excelente Variables de quien recibe cuidados 2) GENERO ——_Géner0: 0 = masculina; 1 = fernenino @) ACTDIA —_—_Acividades arias: nirmero de actividades que pueden hacer sin ayuda, pe. bafarse y Vestise 1) SATVIOA —_Satislaccibn con la vidar escala de 12 ems con un rango de puntuaciones de 0 a 36 ———ar”"r— _ sec 28-3, “Tmagina que a un grupo de cuidadores se les hacen las siguientes preguntas en un cuestionario. Con las categorfas de respuesta que se dan, jcada vatiable sigue los principios de inclusividad y exclusividad? Si no es asf, e6mo pueden mejorarse para estar de acuerdo con estos principios? PES ee EU Eye

You might also like