Download as pdf
Download as pdf
You are on page 1of 463
METI Te Ua RUFINO MOYA CALDB CONTENIDO 1 ESTADI{STICA 2 ORGANIZACION Y GENERALIDADES... 1 CLASIFICACION DE 35 1a {Qué es estadistica? 1 1.2 Divisién de la estadistica 2 21 Introduccién... 35 1.2.1 Estadistica descriptiva . 2 | 22 Revisién y correccién de Jos 1.2.2 Estadistica inferenci: 3 .- 35 13 Poblacién y muestra 7 23 Tablas de distribucién. de. 14 Usos de la estadistica. 12 frecuencias ... 36 14.1 Laestadfstica en el desarrollo 23.1 Datos de variables discretas 36 de la investigaci6n 13 2.3.1.1 15 El método estadfstico 14 1.6 Recoleccién de los datos 16 2.3.2 Datos de variables continuas 52 1.6.1 Algunos procedimientos y 2.3.2.1 Limites reales de clases ...... 69 métodos para recolectar datos 17 | 2.3.2.2 Simetria de una tabla de 1.6.2 Principales procedimientos distribucién de frecuencias. 73 para recolectar informac.sn 23.3 Datos de variables en ciencias sociales, salud, cualitativas .... 18 | 23.4 — Diagrama de hojas y tallos. 79 17 21 =| 23.4.1 Ventajas de los diagramas 1.8 _ Disefio 0 elaboracién de de hojas y tallos ... 81 formularios ww 25 | 2.3.5 Problemas de repaso 2A..... 82 18.1 Principios bisicos que se 2.4 — Representacién tabular y deben tener en cuenta en la F confeccién de formularios.. 26 24.1 19 Ventajas del empleo de 2.4.1.1 Partes de un cuadro muestras estadistico .. 89 1.10 Desventaja del empleo de 2.4.1.2 Elaboracién de un cuadro. muestras .... a) estadistico ... we 91 L1L Condiciones de una buena 2.4.1.3 Enrores de la ‘presentacién muestra .. de cuadros.... en 1.12 Tipos de muestras 2.4.1.4 Pasosa nope al leer un 1.12.1 Métodos para obtener : muestras probabilisticas ..... 24.2 — Representacién gréfica 92 1.12.1.1 Muestreo aleatorio simple 2A21 Veuajas ydeaveatajas del 1.12.1.2 Muestreo sistematico 2422 93 1.12.13 Muestreo estratificado .. 2423 1.12.1.4 Muestreo por conglomerados 33 trazado de gréficas lineales. 93 Principales tipos de gréficos 94 Graficos de Darras wuss 95 Grafico de barras dobles, multiples ... 97 2.4.2.7 Grafico de barras compuestas o proporcionales 100 Pictograma o pict6grafos..... 102 Graficos de sectores 0 pastel 103 Diagrama de frecuencias .... 109 Histograma de frecuencias . 111 Polfgonos de frecuencias .... 114 Poligonos de frecuencias acumuladas. Ojivas 114 2.4.2.14 Grdficas de linea ... 3 METODO PARA EL ANALISIS DESCRIPTIVO DE DATOS CUALITATIVOS. .. 130 3.1 Introduccién.. 130 32 33 3.4 3.5 Porcentajes... 3.5.1 Porcentaje de Cambi 134 3.5.2 Porcentaje de error. 135 3.6 Tasas.. 137 3.6.1 Tipos de tasas 138 4 METODO PARA EL ANALISIS DESCRIPTIVO DE DATOS CUANTITATIVOS ....seecee 141 4.1 Introduccién... a 141 42 Estadigrafos de posicién.... 142 4.2.1 Media aritmética.. 4.2.1.1 Media de la poblacién 4.2.1.2 Propiedades de la media aritmética ..... 4.2.13 Métodos abreviados de 4.2.1.4 4.2.15 4.2.1.6 4.2.17 4.2.1.8 4.2.2 4.2.2.1 4.2.2.2 4.2.2.3 423 423.1 4.23.2 4.23.3 4.24 4.24.1 425 42.6 4.2.6.1 4.2.6.2 4.2.63 42.6.4 42.65 4.2.7 428 4.2.9 4.2.9.1 4.2.10 4.2.10.1 4.2.11 cdlculo de la media aritmética .. Media aritmética de , distribuciones simétricas .... Media aritmética a partir de submuestras 159 164 165 Media aritmética ponderada 170 Ventajas de la media aritmética 176 Desventajas de la media aritmética ... Media geométrica Desventajas de la me geométrica .. a Aplicaciones ha la media geométrica .. a Propiedades de la media geoménica ... Media arménica Propiedades de la media Ventajas y desventajas .. Aplicaciones de la media arménica .... Media cuadratica .. Propiedad de la media cuadritica ... Media de potencias 176 177 Mediana..... CaAlculo de la mediana ........ 192 Método gréfico para obtener la mediana... a Propiedades de la mediana . 205 Ventajas de la mediana....... 208 Desventajas de la mediana.. 208 Cuantiles Cuartiles Deciles ... Clculo de los deciles Percentiles... CAlculo de los percentiles 4.2111 4.2.11.2 42.113 4.2114 4.2.12 42.13 43 43.1 43.2 433 43.4 43.4.1 43.4.2 43.4.3 4344 Calculo de 1a moda de datos tabulados .. Moda de una distribuci simétric: Ventajas de la moda Desventajas de la mod Relacién entre moda, media y mediana en distribuciones simétricas y asimétricas ...... 238 Problemas de repaso 4A ..... 240 Estadigrafos de dispersién.. 256 Introduccién...... . 256 Desviacién media absoluta. 258 Desviacién mediana absoluta..... » 261 Varianza y desviacién tfpica 262 Férmulas de trabajo para el cAlculo de la varianza . 267 Propiedades de la varianza . 270 Varianza calculada a partir de submuestras ... see Métodos abreviados de cAlculo de Ja varianza ......... Desviacién tipica o desviacién estandar.... Propiedades de la desviacién tipica . Interpretacién y aplicaciones de la desviacién tipica ........ 286 Verificacién del célculo de la desviacin tipica 289 Ventajas de la desviacién tipica .. Correccién Sheppard .......... 290 Relaciones empiricas entre las medidas de dispersin ... 290 Medidas de dispersién telativa 291 Momentos . 298 Relaciones entre momentos 305 Problemas de repaso 4B ..... 307 Medidas de concentracié6n .. 322 45.21 Curva de concentracién ...... Indice de concentracién ...... 324 Concentracién y dispersién 328 Medidas de forma de la distribucién .. 332 332 Coeficientes de Asimetria .. 333 Medidas de apuntamiento 0 curtosis .. 341 Formas de medir la curtosis 341 5 DISTRIBUCIONES BIDIMENSIONALES ........ 354 SA 5.2 iblas estadisticas bidimensionales 355 5.2.1 Frecuencias relativas . . 357 5.2.2 Distribuciones marginales .. 359 5.3 Representacién gréfica ....... 363 54 Distribuciones condicionadas .. . 369 3.5 Descripcién numérica de las variables estadisticas cuantitativas bidimensionales 55.1 Medias y varianzas marginales 5.5.2 Covarianza 5.5.3. Varianza y covarianza 5.6 Diagrama de dispersion . 57 Correlacién lineal ... 5.7.1 Otros coeficientes de correlacién 58 Correlacién y causalidad 59 Regresién lineal simple .. 5.9.1 Estimacién por el método de minimos cuadrados..... 6 SERIES CRONOLOGICAS ... 6.3.1 6.3.2 63.3 6.3.4 64 64.1 6.4.2 643 644 Introduccién.. om Concepto y tipos de series cronolégicas.. see 394 Tipos de series cronolégicas 396 Componentes de una serie cronolédgica .. Tendencia secular 398 Movimientos cfclicos. 399 Movimientos estacionales .. 399 Movimientos irregulares 0 al azar ot Anilisis de las series cronolégicas...... Estudio de la tendencia. Método de mano alzad: Método de Ios semipromedios.. a Método del movimiento medio ..... Método de mfnimos cuadrados ... - 394 397 7 NUMEROS INDICES ........ 414 Wa TAA Definicién y clasificacién... 414 Indices simples .... 415 7.1.2 Indices compuestos...... 416 7.1.2.1 Indices compuestos no 7.1.2.2 Indices compuestos ponderados.... 72 Indices de precios, de 7.21 7.22 723 73 Cambio de base 7.3.1 Empalme de indices 14 Indices en cadena.. 75 Indices de precios al consumidor (IPC) - 439 76 Deflacién estadistica. . 440 7.6.1 Salario real... 7.6.2 Indice mensual y acumulado .... 5 77 Problemas de repaso 7A ..... APENDICE A (Sumatorias) os 451 BIBLIOGRAFIA TABLA DE NUMEROS ALEATORIOS... 457 ESTADISTICA GENERALIDADES 1.1 ,QUE ES ESTADISTICA? La palabra “estadistica” como muchas otras palabras tienen varios significados. En el Ienguaje comin, el término “estadistica” significa un poco mds que datos o informaciones numéricas y se emplea generalmente en plural. Por ejemplo, el cronista deportivo, mientras comenta las incidencias de la primera etapa de un partido de fiitbol puede decir, estas son las estadisticas para la primera etapa; equipo A: disparos al arco diez, errados nueve y acertado uno, tiros de esquina seis, etc., equipo B: disparos al arco ocho todos errados, tiros de esquina siete, etc. Los comentaristas de radio otelevisién informan diciendo: las estadisticas del Producto Bruto Interno (PBI) de la Industria Manufacturera pasaron de un 15.3% en 1988 a un 11.7% en 1990. Entre Marzo del 88 y Agosto del 90 los sueldos han tenido una caida del 60%. Segin el Instituto Nacional de Estadistica e Informatica (INED), el nivel acumulado de inflacién durante el primer semestre del presente afio lleg6 a 230.5%. Una persona cualquiera puede preguntar: jhas visto las iltimas estadisticas acerca del empleo?, etc. Naturalmente, encada uno de estos comentarios, las personas est4n usando la palabra “estadistica” en forma correcta, sin embargo, cada uno la usa en una forma diferente para un propdsito también diferente. El término “estadistica” también se emplea para designar un drea de estudio, una disciplina; por ejemplo, cuando se emplea esta palabra en el titulo de un libro o cuando nos referimos a los cursos de estadistica de la curricula de una profesién, etc. Sin embargo ambos significados de “estadistica” estén muy relacionados debido a que las “estadisticas” consideradas como datos numéricos en gran parte son Ja “materia prima” de la “Estadistica” como disciplina. La evoluci6n y desarrollo de la “Estadistica” en el mundo actual, es tal que seria dificil dar una definicién precisa de este concepto. A riesgo de agregar una més a las tantas existentes daremos la siguiente. DEFINICION 1.1 La Estadistica es una ciencia que proporciona un conjunto de métodos que se utilizan para recolectar, resumir, clasificar, analizar e interpretarelcom- portamiento de los “datos” con respecto a una caracteristica materia de estudio o inves- tigacién. En primera instancia se encarga de obtener informacién, describirla y luego usa esta informaci6n a fin de predecir “algo” respecto a la fuente de informacién. La Estadistica actual es el resultado de la unién de las disciplinas que evolucio- naron independientemente hasta confluir en el siglo XIX: la primera es el “cdlculo de probabilidades”, que nace aproximadamente en el siglo XVII como teoria matematica de los juegos de azar; la segunda es la “Estadistica” 0 ciencia del estado, del latin status (aunque sobre este significado etimolégico de estadistica no hay un criterio unico de los autores, pues para unos se deriva del gricgo statera que significa balanza, para otros se deriva del alem4n staat que significa estado) que estudia la descripcién de los datos y tiene raices mds antiguas. La integracién de ambas lineas de pensamiento da lugar aesta nueva ciencia: 1.2. DIVISION DE LA ESTADISTICA El campo de la Estadistica generalmente estd dividido en dos grandes reas: Estadistica Descriptiva y Estadistica Inferencial. 1.2.1ESTADISTICA DESCRIPTIVA De la definicién de Estadistica, el lector notard dos aspectos bien remarcados, él primero: obtener informacién, procesarla y describirla, es lo que constituye la Estadis- tica Descriptiva. Precisaremos con la definicién siguiente. DEFINICION 1.2 Estadistica Descriptiva es el conjunto de métodos que implican larrecolecci6n, presentaci6n y caracterizacién de un conjunto de datos a fin de describir en forma apropiada las diversas caracteristicas de estas. Es decir, un estudio estadistico se considera “descriptivo” cuando sélo se analiza y describe los datos. EJEMPLO 1.1 Un gerente de personal desea conocer las aptitudes de cinco secretarias que trabajan en una dependencia particular de una compafiia. Se aplica una prueba de aptitudes a las cinco secretarias y las calificaciones son 85, 90, 93, 82 y 95 puntos. Supongamos que la medida estadistica que emplea el gerente de personal es la aptitud 2 promedio o media aritmética, la cual cs la suma de los valores observados dividida entre el nimero de observaciones. Entonces, la calificacién promedio es: 85 + 90+ 3 + 824 95 = 48 = 89 puntos El resultado se limita a los datos obtenidos en este caso particular y no implica ninguna generalizaci6n acerca de las aptitudes de las secretarias de otras oficinas de la misma compaiiia. Es decir, el gerente estd usando estadistica para describir aptitudes de las secretarias de esa oficina. Este método es de naturaleza descriptiva, debido a que cl promedio condensa y describe la informacién obtenida. Los graficos, tablas y mapas que muestra datos de tal forma que sean mis faciles de entender son todos ejemplos del uso de Estadistica Descriptiva. 1.2.2 ESTADISTICA INFERENCIAL El segundo aspecto de la definicién de Estadistica es: predecir “‘algo” con respecto ala fuente de informacién, es lo que constituye la Estadistica Inferencial o Inferencia Estadistica, la definiciOn es la siguiente. DEFINICION 1.3 LaInferencia Estadistica es el conjunto de métodeso técnicas que posibilitan la generalizacién o toma de las decisiones en base a una informaci‘sn parcial obtenida mediante técnicas descriptivas. Es decir, un estudio estadistico, se considera inferencial cuando se pretendeinferir o predecir conclusiones que atafien a toda Ja fuente de informacién de donde proviene los datos. Ahora bien esta prediccién se hace con un cierto grado de confianza; este grado de confianza se mide por la “probabilidad”. Por tanto, el cAlculo de probabilidades, piedra angular de la inferencia estadistica estA como puente entre las dos partes de la Estadistica. Aunque la Estadistica descriptiva es importante para caracterizar y presentar in- formaci6n de los datos, sin embargo, el desarrollo de 1a Inferencia Estadistica es lo que ha conducido a la gran expansidn en la aplicacién de los métodos estadisticos. EJEMPLO 1.2 Suponga ahora en el ejemplo 1.1, que el gerente de personal desea conocer la aptitud promedio de todas las secretarias de la compajiia, pero carece de tiempo c de los recursos para aplicar una prueba de aptitud a todas ellas. Entonces decide usar Ja aptitud promedio de las cinco secretarias para estimar la aptitud promedio de todas las secretarias de la compafiia. El proceso de estimar esta aptitud promedio global serd un problema de Inferencia Estadistica. EJEMPLO 1.3 Un fabricante de medicinas afirma que una nueva vacuna contra el catarro desarrollada por su compaiiia tienc una efectividad del 95%, estoes, en promedio 95 de cada 100 personas que emplean la vacuna pasardn el invierno sin contagiarse de ratarro. Como resulta imposible probar la vacuna en todas las personas, consideremos que 40 personas han recibido la vacuna, que de las 40, 35 no se contagiaron de catarro. Vemos que si la afirmaci6n del fabricante es correcta se esperaria que 38 personas (40 x 0.95 = 38) pasaran el invierno sin catarro. Puesto que el ntimero observado es 35, lo cual es inferior al ntimero esperado 38, gdeberd rechazarse la afirmacién del fabricante en base a la evidencia? El proceso de decisién de rechazar 0 no la afirmacién del fabricante es un problema de Inferencia Estadistica, EI problema también puede plantearse como sigue: La proporcién de personas no contagiadas, la cual es el cociente del mimero de personas observadas que no se contagiaron entre el nimero total de personas observadas. Es decir, la proporcién de Personas no contagiadas es: esia proporcién expresado en porcentaje es 100(0.88)% = 88%. Entonces la evidencia indica s6lo un 88% de efcctividad de la vacunaen cuestién, quees menora la Afirmacién del fabricante. El proceso de decidir, se rechaza 0 no la afirmaci6n del fabricante es un problema de inferencia estadistica. EJEMPLO 1.4 Cuatro bombillas de marca A dejaron de funcionar después de 1100, 980, 900 y 1020 horas de uso continuo. Cinco bombillas de marca B dejaron de funcionar después de 960, 1050, 1065, 845 y 980 horas de uso continuo. Se llega a las siguientes conclusiones: a. Laduracién promedio de las cuatro bombillas marca A es de 1000 hs, mientras que la duracién promedio de las cince bombillas marca B es de 980 hs. b. La duracién promedio dc todas las bombillas marca A es mayor que la de todas las bombillas marca B. ¢. La diferencia entre los dos promedios es de 20 hs. a. La diferencia entre los dos promedios es demasiado pequefio para llegar a la conclusi6n de que las bombillas marca‘A son mejores que las bombillas marca B. ¢. Sise selecciona y prucba otra bombilla marca A, probablemente durara més que el promedio de las bombilias marca B. f. Ud. decide comprar bombillas marca A en vez de bombillas marca B. ‘les de las conclusiones provicnen de la Estadistica Descriptiva y cudles de la Estadistica? SOLUCION: a. La duracién promedio de las cuatro bombillas marca A es 100 1 200 O80 + 1020 400 = 1.000 hs. La duracién promedio de las cinco bombillas marca B es 1050 + 960+ 1065 + 845 + 980 4200 ~ 80 hs como se est4 usando Estadistica para describirel comportamiento s6lo de los datos observados y no para una generalizacién, la conclusién proviene de Estadistica Descriptiva. b. Puesto que se esta generalizando, que la duracién promedio de todas las bombillas marca A es mayor que todas las bombillas marca B, la conclusién proviene de la Estadistica Inferencial. c. Vemos que: 1000 - 980 = 20 hs, es decir la conclusién proviene de la Estadistica Descriptiva. d. Seestdusandolos promedios de los datos observados para inferir sobre la diferencia de todas las bombillas. Por lo tanto, es Inferencia Estadistica. e. Se hace una generalizaci6n de que cualquier bombilla marca A duraré mds que el promedio de las bombillas marca B, proviene de Inferencia Estadistica. f. Ud. esta generalizando que las bombillas marca A duran mas que las bombillas marca B. Por lo tanto, es Inferencia Estadistica. PROBLEMAS 1-1 1. En una prueba de aptitud, cuatro trabajadores recibieron calificaciones de 85, 90, 82 y 83. Cuatro trabajadoras recibieron calificaciones de 88, 87, 89, 92. De las siguientes declaraciones realizadas con base en estas calificaciones, identificar aquellas que se derivan de métodos descriptivos y aquellos que se derivan de Inferencia Estadistica. a. La calificacién promedio de los cuatro trabajadores es 85, y la calificacién promedio de las cuatro trabajadoras es 89. b. La aptitud promedio de todas las trabajadoras es probablemente mayor que lade los trabajadores. ¢c. En la siguiente prueba de aptitudes, probablemente los trabajadores reciban calificaciones mds bajas que las trabajadoras. 4. 5. Cinco neumiaticos para automévil de marca A y cuatro neuméaticos de marca B se prueban para determinar su duraci6n en servicio. La duracién para los neumaticos marca A, son: 36 000, 29 000, 33 000, 37 000 y 40 000 km; para la marca B, son: 29.000, 31 000, 33 000 y 35 000 km. De las siguientes declaraciones hechas en base a estas cifras, identifique las que provienen de métodos descriptivos y las que provienen de inferencia estadistica. a. La duraci6n promedio de los cinco neuméticos marca A es mayor que la de los cuatro neumiticos marca B. b. Probablemente, la duracién promedio de todos los neumaticos marca A sea casi 35 000 km, mientras que la de los neumAticos marca B sea aproximadamente de 32.000 km. c. Siel precio de los neumaticos marca A es el mismo que de los neumdticos marca B, Ud. recomendaria los neumdticos marca A a todos sus amigos y parientes. En cuatro pruebas de matemiatica, Juana recibié calificaciones de 17, 18, 15 y 14; mientras que Juan recibié calificaciones de 14, 13, 16 y 13. A partir de estos datos sc llcga q las siguientes conclusiones, gcudles de éstas incluyen el método descrip- livo y cuales se obtienen mediante la inferencia estadistica?. a. El promedio de las calificaciones de Juana es 16 y el promedio de las califica- ciones de Juan es 14. b. Juana es mejor estudiante que Juan. c. Probablemente en la siguiente prueba, Juana obtenga calificaciones mds eleva- das que Juan. d. La diferencia entre los dos promedios es 2 puntos. 4En qué contexto se emplea gencralmente la palabra “estadistica” en radio y televisi6n? Clasifique cada una de las afirmaciones siguientes ya sea como inferencias 0 métodos descriptivos. a. El afio pasado, en la Universidad Nacional del Callao, el puntaje promedio del examen de admisién fue 85. b. El Dr. Garcia, un écdlogo, informé que en cierto rio de la selva la carne de los peces conticnen un promedio de 300 unidades de mercurio. c. La compafiia “RM” predijo quién seria el ganador en una eleccién presidencial después de conocer los resultados de las votaciones de 25 mesas de sufragio de las 2 800 mesas que hubo en total. 1.3 POBLACION Y MUESTRA La palabra “poblacién” igual que sucede con el término “estadistica” tiene varios significados. En el uso comin, se refiere‘a todas las personas de una regi6n, localidad pais. (La poblacién de Limaes 6 millones; la poblacidn de China es 900 millones, etc). El concepto de “poblacién”, estadisticamente hablando, es un concepto mds amplio de loque se tiene al referirsea los habitantes de un Departamento o un Pais; poblacién desde el punto de vista estadistico se define como sigue. DEFINICION 1.4 Poblacién es la coleccién de todos los individuos, objetos u obser- vaciones que poseen al menos una caracteristica comin. Los términos poblacién y universo, suelen usarse indistintamente. EJEMPLOS 1.5 Las edades de los estudiantes del Peri. Las edades de los alumnos del sistema univertario peruano. Los didmetros de la produccién diaria de tuercas. Los pesos de los melones de una cosecha de la cooperativa los “meloneros”. Las placas de los automéviles que circulan en un pais. Los pacientes con poliomiclitis sometidos a una determinada terapetitica de rehabilitaci6n. g. Los enfermos de SIDA, tratado con uno de tres tratamientos diferentes. Peangsp En cada uno de los ejemplos anteriores, existe al menos una caracteristica comin para todos los elementos integrantes de la poblacién. Y cada situacién diferente implica una poblacidn diferente. En el ejemplo 1.5g, en lugar de una poblaci6n, se tiene tres poblaciones diferentes, cada poblacién esté definida por cada uno de los tres tratamien- tos que se utilizan. Es importante definir la poblaci6n de acuerdo a la naturaleza y extensién del problema bajo estudio. AI hablar de naturaleza, entenderemos la caracteristica materia de estudio; es decir, si quisiéramos estudiar los pesos, alturas y edades de las personas, la poblacién estard formada por los pesos, alturas y edades respectivamente. Y al hablar de extensién definimos la poblacién tan extensa como sca necesario; es decir, si quisiéramos estudiar las caracteristicas anteriores en los alumnos del sistema universi- tario peruano, Ia poblacién estar4 referida al sistema universitario peruano; y si estuviéramos interesados en estudiar éstas caracteristicas en los alumnos de las universidades de Lima, la poblacién estard referida solamente a ellas. Al referirnos a la naturaleza del problema, optamos también por distinguir entre lo que podemos Ilamar poblacién “objeto” y poblacién “objetivo”; entendemos por poblacién objeto, el conjunto de elementos materia de estudio y por poblacién objetivo las diferentes 7 medidas de la caracteristica que nos interesa de la poblacién objeto. Aclaremos esto con el ejemplo siguiente: al estudiar el rendimiento académico de los alumnos en el sistema universitario; la poblacin objeto estar constituida por los alumnos del sistema ylapoblaci6n objetivo, por lasnotas, que miden el rendimiento académico. Es necesario ademés anotar que: (a). Toda poblacién debe definirse de manera que la ubicacién en ella de cualquier elemento pueda decidirse de manera inequivoca. (b). Toda poblacién puede ser real o virtual. Por otro lado obsérvese, por ejemplo, al hablar de los “‘alumnos del sistema uni- versitario”, definimos una poblacién acotada, por Jo tanto finita. En cambio al hablar de los “pacientes con poliomielitis, sometidos a una determinada terapéutica de rehabili- taci6n” definimos una poblacién no acotada, por lo tanto virtualmente infinita, cuyos elementos son, tanto las personas que ya han sido sometidos a la referida terapia, como los que sean en el futuro. Es decir, la poblaci6n puede clasificarse como finita o infinita. POBLACION FINITA Unapoblaci6n finita es aquella que tiene un némero limitado de elementos. Por ejemplo, las estaturas de todos los estudiante que actualmente estudian en las universidades del Peni. Notacién: El tamaiio de la poblaci6n finita lo denotaremos por.“N”. POBLACION INFINITA Una poblacién infinita es aquella que no tiene limite o cotas, es decir, tiene un nimero infinito de elementos. Por ejemplo, la calidad de todas las unidades producida mediante un proceso manufacturero. DEFINICION 1.5 Parametroes una medida resumen que describe una caracteristica de toda la poblacién. Los pardmetros son caracteristicas medibles de una poblacién y naturalmente para determinar su valor es necesario utilizar la informacién de toda la poblacién. Por ejemplo, la edad promedio de los escolares del primer afio de secundaria de los colegios del Pert, es una caracteristica medible (por tanto un parametro) de la poblacién formada por las edades de todos los escolares del primer afio de secundaria del pais; es pués la media de la poblacién. Similarmente, la proporcién de todos los telespectadores que ven un cierto programa dominical a cierta hora, es una caracteristica medible (por tanto un pardmetro) de la poblacién formada por todos los telespectadores de ese programa dominical; es la proporcién de la poblacién. Los pardmetros mds usados son: - Lamedia poblagional = 41 (que se lee mu) - Proporcién poblacional = p (que s¢ lee pe) - Desviacién tipica poblacional = g (que se lee sigma) Obviamente es imposible calcular el verdadero valor de cualquier parametro de una poblaci6n infinita. En la mayor parte de los casos iampoco resulta practico (0 eco- némico) calcular el verdadero valor de cualquier pardmetro de una poblaci6n finita. Por tanto, resulta necesario realizar inferencias acerca de los pardmetros de la poblacién, a partir de la informaci6n contenida en una parte de la poblacién. DEFINICION 1.6 Muestra es una parte o un subconjunto representativo de la poblacién. Y al proceso de obtener la muestra se llama muestreo. Notacién: El nimero de observaciones (0 tamafio) de la muestra se denota por “n”. Desde luego, el ntimero de observaciones en una muestra es menor que el nimero de observaciones posibles en la poblacién, de otra forma, la muestra seria la poblaci6n misma. La seleccién y el estudio de una muestra, tiene por objeto la extraccién de conclusiones que sean v4lidas para la poblacién del cual sé obtuvo dicha muestra. En otras palabras, nuestro propésito es conocer la poblaci6n, para lo cual se extrae una muestra de ésta. Por ejemplo, si se desca estimar el gasto promedio anual de los estudiantes universitarios del Peri, se extraeria una muestra formada por cierto nimero de estudiantes, en seguida se determinaria cl gasto anual correspondiente a cada uno de ellos y después se obtendria el promedio de estos gastos. Se utiliza una muestra debido aquesimplemente no se tiene el tiempo y los recursos para establecer contacto con todos los estudiantes universiiarios del pais, aun cuando es posible hacerlo. En base al promedio de la muestra (promedio muestra!) obtenido de esta forma, se realiza una inferencia acerca del gasto promedio de todos los estudiantes universitarios del Peri. Hemos expresado, también que es imposible calcular el verdadero valor dv cualquier pardmetro de una peblacién infinita, es pués necesario emplear una informa- cién muestral. Por ejemplo, para determinar la proporcidén de partes defectuosas producidas en cierto proceso de fabricacién, los técnicos de control de calidad examinan un lote de unidades producidas para determinar el nimero de defectuosas contenida cn él. (Generalmente un lote de este tipo, el cual constituye una muestra, se toma ;1 intervalos regulares de tiempo). La proporcién de la poblacién, lacual es un parametre que se desconoce, es la proporcién de todas las unidades defectuosas producidas en cf proceso; se estima mediante la proporcién ce la muestra, la cual es la proporcidn d= las unidades defectuosas contenida en la muestra. Asi, si en un lote de 300 unidades producidas en cl proceso, el ingeniero de control de calidad encuentra 45 defectuosis, entonces la proporcién de defectuosas en la muestra seré 45/300 = 0.15 (15%). Obsérvese, que tanto el promedio de la muestra, como la proporcién de la muestra en los ejemplos considerados en el parrafo anterior son caracteristicas medibles de las mucstras, lo cual da lugar a la definici6n siguiente. DEFINICION 1.7 Estadistico o Estadigrafoes una medida resumen que describe una caracteristica de la muestra. Por ejemplo, el C.I. (cocficiente de inteligencia) promedio de una muestra de escolares de primer grado seleccionada de entre todos los estudiantes de primer grado del Peri, es un estadistico; pués se trata de una caracteristica de la muestra. Similarmen- te, la proporcién de una muestra de telespectadores de un cierto programa a cierta hora, es también un estadistico; ya que se trata de una caracteristica de la muestra de telespec- tadores. EJEMPLO 1.6 Suponga que los ingresantes al primer afio de su universidad consta de 3 000 estudiantes, todos los cuales han dado un examen tnico de seleccién que se aplicé a todos los estudiantes que han ingresado a primer afio de universidad en el pais. Explique las circunstancias bajo las cuales las calificaciones recibidas por los estudian- tes ingresantes al primer afio de su universidad puede considerarse como: a. una muestra, b. una poblacién. SOLUCION: a. Puede haber mds de una circunstancia. Por ejemplo, si-se quiere conocer, la calificaci6n promedio de todos Ios ingresantes a las universidades del pais, la poblacién estaria formada por las calificaciones de todos los ingresantes a primer afio de universidad en el pais, entonces las calificaciones de los ingresantes a su universidad seria una muestra. b. También puede haber varias circunstancias. Por ejemplo, si se desea conocer la calificacién promedio de todos los ingresantes a su universidad. La poblacién estarfa compuesta por Jas calificaciones de todos los ingresantes a su universidad. Tendremos asi, una circunstancia en la cual las calificaciones recibidas por los estudiantes ingresantes a primer afio de su universidad se consideran como poblacién. EJEMPLO 1.7 Se realiza una votaci6n preliminar para determinar las preferencias de los electores en una eleccién presidencial. Con este fin se entrevistan 1500 electores registrados y entre ellos 860 estén a favor del candidato A. Responda lo siguiente: a. zQué constituye la muestra? b. zQué constituye la poblacién? c. ¢La poblacién es finita o infinita? d. © 4Cudl es el parémetro de la poblacién? e. ¢Cuél es el estadistico de la muestra? 10 SOLUCION: a. b. c d. e La muestra est4 constituida por las respuestas de 1 500 electores registrados. La poblacién esta constituida por las respuestas de todos los electores registrados. La poblacién es finita. El pardmetro de la poblaci6n seré la proporcién de tédos los electores registrados que est4n a favor del candidato A. El estadistico de la muestra es la proporcién de los 1 500 electores registrados que estan a favor de! candidato A. Es decir 860/1 500 ~ 0.57 (57%). PROBLEMAS 1-2 1. 2. Durante cicrta semana, en un restaurante se atendié a 2 300 clientes. Explique las circunstancias bajo las cuales estos 2 300 clientes puedcn considcrarse como: a. una muestra y b. una poblacién Supéngase que el 60% de todos los electores registrados en un pais son integrantes de un partido A y el 40% no. A partir de una mucsira de 500 electores, sc encuentra que 250 pettenecen al partido A. Responda lo siguiente: . {Cual es la proporcién de electores en Ja muestra que pertenccen al partido A? . {Cua cs la proporcién de electorcs cn la poblacion que pertenccen al partido A? . Cual es la poblacién? ges finita o infinita? . {Cual es cl parimetro de la poblacién? e. gCual cs el cstadistico de la muestra? aeoce Establezca la veracidad o falsedad de cada una de las proposicionés siguientes. Reemplace cada enunciado falso por la proposici6n verdadera correspondicnt: a. La poblacién es una coleccién de todos los elementos que estamos estudiand.. b. Un estadistico es una caractéristica de la poblacién. c. |. Inferencia Estadistica, formula infcrencias con respecto a una mucstra. Se realiza un muestrco de opinion para determinar si las amas de casa de Lim: preficren un detergente de una marca A con respecte a vira. Con este fin se entrevistan 2 000 amas de casa y entre cilas 1 506 prcficron la marca A. Respond: lo signicnte: a. (Qué constituye a la muestra? b. {Qué constituye a la poblacién? c. jLa poblaci6n es finita o infinita? d. {Cual es cl parémetro de la poblacién? e. (Cual es el estadistico de la muestra? u $. Para cada una de las siguicnwes proposicioncs, definase la poblacién que se esta 8 D mucstreando y describa cl pardémetro de Ia poblacién y cl estadistico muestral. a. Se entrevista a 800 estudiantes universitarios acerca de sus opiniones (respucs- tas si o no) sobre la legalizacién del aborto. b. Sc entrevista a 300 trabajadores no sindicalizados para determinar sus opiniones (respuestas si 0 no) acerca de la sindicalizacién. ¢. Se selecciona una muestra de los tornillos producidos por una maquina automé4- tica y se prueban para determinar la proporcién de defectuosos. d. Se selecciona una muestra de los becerros nacidos en Cajamarca en 1989 y se lleva un registro de sus pesos al nacer. 6. Defina poblaciones apropiadas y a partir de ellas seleccione las muestras siguien- tes: a. Se Ilamé por teléfono a personas de 200 hogares de cierta ciudad y se les pidié mencionar el nombre de su candidato para la alcaldia. b. Se probaron 200 pares de un nuevo tipo de zapatos para futbolistas en un torneo profesional y, en promedio duraron 4 meses. c. Encincoocaciones diferentes, aun Ingeniero le tomé6 21, 26,24, 22 y 21 minutos conducir su auto de su casa en las afueras de la ciudad hasta su oficina en el centro de la ciudad. 1.4 USOS DE LA ESTADISTICA La Estadistica proporciona un conjunto de métodos aplicables en todas las dreas cientfficas donde se acumulan, se analizan y se interpretan datos. Resulta, pués muy dificil nombrar areas donde no se aplica. Citaremos aqu{ brevemente algunos campos en los cuales los métodos estadisticos juegan un papel principal, como: Salud y Medicina, Biologia, Economia, Administracién, Contabilidad, Ingenieria, etc. y en la investigacién Cientifica. &N SALUD Y MEDICINA: Las estadisticas de salud incluyen toda informacién numérica relacionada de modo directo con los problemas de salud, concebidos en una escala social. Podemos citar muchos ejempios que muestran lo necesario que son las estadisticas de salud, lado a lado con los métodos para su andlisis e interpretaci6n para omentar y desarrollar una politica sanitaria adecuada. Las siguientes interrogantes y muchas mas, que encuentran respuesta en las estadisticas de salud, son una muestra de ellos: 12 iCudl es la causa més importante de muerte én ésta regién: el cAncer?, la tuberculosis?, los accidentes de trnsito?. iA qué edad resulta més alta la mortalidad y por cual enfermedad? {En qué zona, determinado tipo de enfermedad presenta una incidencia mucho mds elevada que la incidencia promedio? ; Qué condiciones prevalecen en esas zonas? jExisten algunas reas especificas o algunas épocas en que se registran preferen- temente brotes de alguna enfermedad? Algunos usos principales de las estadisticas de salud son las siguientes: - Describir el nivel de salud de una comunidad. - Diagnosticar las enfermedades de una comunidad. - Encontrar soluciones a los problemas de salud. - Determinar prioridad para los programas de salud, etc. También en salud publica, pueden presentarse problemas que reclamen estudios de cardcter expcrimental y por tanto, la planificacién de disefios experimentales, que se llevan a cabo segtin determinados principios estadisticos: la evaluaci6n de la eficiencia de una vacuna como medic: de prevenir o atenuar el efecto de una epidemia de una enfermedad dada, o la comparacién de una nueva terapia basada en la rehabilitacién fisica y el consejo psiquiatrico a pacientes cardiovasculares, con la terapia tradicional sintomatica, con vistas a la aplicacién masiva de aquella que evidencia su superioridad. Finalmente el proceso cientifico en Medicina, que tiene lugar (como en todas las ciencias) como resultado de lainvestigacién, encuentra también en laciencia Estadistica un instrumento de incalculable valor. EN ECONOMIA: La estadistica constituye uno de los pilares de la aplicacién de la teoria.econémica. Se utiliza en la descripcién de fenédmenos econémicos, en la estimacién de las relaciones econémicas, en la verificacién de las teorias econémicas y en la prediccion y previsi6n de las variables econémicas. EN BIOLOGIA: La estadistica se puede utilizar para estimar el tamajio real de la poblaci6n de una especie animal particular, la propagacién de bacterias, en mejorar la raza de los animales. 1.41 LA ESTADISTICA EN EL DESARROLLO DE LA INVESTIGA- CION El desarrollo del conocimiento en la ciencia, se caracteriza porque su« jecucién se lleva a cabo segiin un método: “El método cientifico”. La aplicacidn de est: método es lo que diferencia al conocimiento cientifico del conocimiento ordinario. 13 Las etapas del método cientifico, segiin el matematico filésofo Bertrand Russel son tres: 1. La observacién del fenémeno que se estudia. 2. La formulacién de una (0 de varias) hipdtesis mediante la cual puedan explicarse los hechos observados. 3. La verificacién de las hipétesis mediante nuevas observaciones. Esta divisi6n en etapas, sugiere, que el método cientifico esté definido por un proceso de observacién, de racionalizacién y de experimentaci6n. La estadistica desem- pefia un papel importante en cada una de las tres etapas de que consta el método cientifico de investigacién. En la primera etapa interviene, mediante la presentacién, en forma sindptica y resumida, de los resultados de la observacién, facilitando su andlisis¢ interpretacién. En esta primera etapa, la Estadistica cumple una funcién esencialmente descriptiva. En la segunda etapa interviene, proporcionando el lenguaje adecuado para la for- mulaci6n rigurosa de las hipotesis de investigaci6n. En la tercera etapa, la utilizacién del método estadistico es decisiva, no sdlo en cuanto a la planificacién y adecuado disefio del experimento, sino también en la seleccién del procedimiento de andlisis, y en la interpretacién de los resultados que se obtenga al aplicar dicho procedimiento. “El papel de la Estadistica en la investigacién es, entonces, funcionar como una herramienta en el disefio de investigacién, en el andlisis de datos, y en la extraccién de conclusiones a partir de ellos. Dificilmente puede preverse un papel mayor y mds importante. . .” (BERNARD OSTLE, Estadistica Aplicada. Ed. Limusa, Wiley, S.A.). Otras aplicaciones: Control estadistico de calidad como ya hemos indicado, en politica se puede utilizar para orientar la estrategia electoral de un partido politico; en educaci6n, ayuda a interpretar un test de inteligencia; en los negocios, ayuda a juzgar respecto a la demanda potencial de un producto mediante un estudio de mercado; en la industria, ayuda a decidir si un proceso industrial funciona 0 no adecuadamente de acuerdo con las especificaciones; también por ejemplo a prever las averias de un taller y disefiar el equipo de mantenimiento. Es obvio que en cada campo se aplican o desarrollan procedimientos especificos, como aplicaciones particulares o variantes de la teoria general. En este libro se estudiaran los métodos estadisticos descriptivos de mds ampliaaplicacién y por lotanto, de uso mas frecuente en los diferentes campos técnicos y cientificos, asi como algunos de uso menos frecuente. 1.5 EL METODO ESTADISTICO El método cientifico de investigacién se basa en dos tipos de razonamiento: el deductivo y el inductivo. El método deductivo procede de lo general a lo particular y 14 utiliza especialmente el razonamiento matematico: se establecen hipétesis generales que caracterizan un problema y se deducen ciertas propiedades particulares por razonamientos légicos. El método inductivo realiza el proceso inverso: a partir de ‘observaciones particulares de ciertos fenémenos se intenta deducir unas reglas genera- les aplicables a todos ellos. La investigacién estadistica se desarrolla utilizando el ciclo deductivo-inductivo en las siguientes cuatro etapas: Planeamiento del problema. Recoleccién de la informacién. Organizacién y clasificacién de los datos recogidos. Anilisis e interpretacién de los resultados. aere a. PLANEAMIENTO DEL PROBLEMA El primer paso de la investigacin es definir claramente los objetivos del estudio y relacionar este objetivo con los valores numéricos de las variables observables. La investigacién cientifica es una actividad con propésito (finalidad, meta) y como tal para quedar entcramente caracterizado debe dar respuesta a las siguientes interrogantes fundamentales: 1. En qué consiste el problema objeto de investigacién? 0 bien gqué se quiere conocer? Por qué o para qué se plantea su investigacién? {Sobre quién recac la investigaci6n? {Cémo se va a investigar? {Quién va a realizar la investigacién? {Dénde se va a realizar? jCudndo se va a realizar? NAVAN S6lo cuando se est en condiciones de dar respuesta a todos y cada una de esas interrogantes se puede redactar cl protocolo de un trabajo de investigacién, que es el documento basico. Los objetivos surgen al contestar la pregunta acerca de para quése va a realizar la investigaci6n, y estén directamente vinculados a la justificacién ¢ importancia de la investigacién proyectada. La hipétesis, es una conjetura (0 un supuesto, o proposicidn) acerca de determinados hechos que va mds alld (trasciende) ac los datos (cvidencia empirica) que intenta explicar. Es decir, que una hipétesis es una herramienta en la tarea cientifica, que pretende explicar o interpretar ciertos hechos, pero que va mds all4 de los mismos, aspirando a dar cucnta explicativa o predecir también algunos hechos independicntes de aquellos que los originaron. 51) Cuaniiv se ha considerado un problema cientitico y se ha logrado formular una hipétesis en relacidn al mismo, la labor investigativa posee un grado de lucidez y de claridad considerablemente mayor. Es precisamente esta claridad la que permite definir los objetivos con mucha mayor precisién y orientar la realizacién de los experimentos © la prictica de las observaciones con un alto grado de especificidad. b. RECOLECCION DE LA INFORMACION La recoleccién correcta de los datos es de extrema importancia para el investiga- dor,-que tiene que ser realizada o vigilada por éste. Para remarcarlo los investigadores han acufiado el término inglés “GIGO”, entrada de datos invalidos-salida de datos invalidos. Esta etapa consiste en: determinar los métodos de recoleccién adecuado, preparar los instrumentos de recoleccién, prueba del método y de los instrumentos de recoleccién seleccionados, y realizar la recoleccién de los datos. Algunos de los principales métodos de recoleccién se abordard en detalle en 1.6. c. ORGANIZACION Y CLASIFICACION DE LOS DATOS Aqui se debe hacer un andlisis de consistencia y ajuste de los datos. Se trata de asegurar la validez y confiabilidad de los datos recopilados. Luego se debe clasificar y tabular los datos y finalmente presentarlos en cuadros estadisticos y graficas. En el cap. 2 presentaremos en detalle cada uno de estos aspectos. d. ANALiSIS E INTERPRETACION DE LOS RESULTADOS En esta etapa se calculan indicadores y medidas resumen que describen al conjunto de datos. También se establece relaciones entre variables de modelos estadis- ticos que nos permitiran aceptar o rechazar los modelos. En este texto por tratarse de la Estadistica Descriptiva, s6lo abordaremos los primeros, que debido a su importancia sern tratacos en los capitulos 3 y 4. 1.6 RECOLECCION DE LOS DATOS Desarrollaremos aqui, la segunda etapa del método de investigacién estadistica, que comprende la recoleccién de la informacién, y fundamentalmente los principales procedimientos y métodos que son utilizados para recolectar la informacién necesaria para un estudio determinado. 16 1.6.1 ALGUNOS PROCEDIMIENTOS Y METODOS PARA RECO- LECTAR DATOS Existen tres métodos basicos con los cuales el investigador pucde obtencr los datos deseados: en primer lugar, el investigador puede recurrir a datos ya publicados por fuentes gubernamentales, industriales 0 individuales; en segundo lugar, puede disefiar un experimento para obtener los datos necesarios, y en tercer lugar, puede efectuar una encuesta. FUENTES DE INFORMACION Esel lugar, la instituci6n, la persona donde estan Jos datos que se necesitan para cada una de las variables 0 aspectos de la investigacién. Las fuentes de datos pueden ser: 1, FUENTEDEDATOSINTERNOS Esla informacién recopilada por lacmpresa (ola institucién) de los resultados de su propia gestién. Son pues las observaciones queconstantemente realizan los departamentos, administrativos, contables, comer- ciales, técnicos, etc. Estas pueden ser por ejemplo: a. Reportes financieros. b. Reportes de operaciones, que estan dadas por la informacién de la produccién, ventas, compras, estados de pérdidas y ganancias. c. Reportes especiales, es informacién adicional para andlisis especifico. 2. FUENTE DE DATOS EXTERNOS Son informaciones estadisticas claboradas por instituciones de investigacién, ya sean publicos o privados, o dependencias es- pecializadas, generalmente requeridos a nivel nacional o sectorial. 3. FUENTES PRIMARIAS Cuando la informacién estadistica es obtenida direc- tamente de la unidad de observacién. Por ejemplo, los resultados de los censos de poblacién y vivienda, indices de precios al consumidor, etc. 4. FUENTES SECUNDARIAS Cuando se obtiene informacién estadistica elabo- tada a base de los datos de fuentes primarias. El organismo oficial fundamental de datos estadisticos es el Instituto N::cional de Estadistica e Informatica (INEI). Se encarga de formular y desarrollar el sistema Estadistico Nacional, levanta los censos nacionales de poblacién y vivienda cada 10 afios y los censos econdémicos ¢ada diez afios, etc. EI Ministerio de Industria Turismo e Integracién, elabora estadistica como: indice de volumen fisico de producci6n, producto bruto interno, etc. EI Ministerio de Economia y Finanzas, através de sus organismos especializados lleva y-elabora estadistica de comercio al por mayor y al por menor, comercio exterior (importacién y exportacién), etc. 17 En general todos los ministerios tienen una oficina especializada de Estadistica. DISENO DEEXPERIMENTO Unsegundométododerecoleccién dela informacién escon un disefio de experimentos. Los disefios experimentales deben utilizarse siempre que sea posible cuando se desee construir modelos explicativos, y sus estudios suelen ser materia de textos mds avanzados, ya que implican procedimientos estadisticos complejos. ENCUESTAS Es el proceso de recopilar informacién a través de una muestra (en el punto 1.6.2 veremos con mayor detalle). 1.6.2 PRINCIPALES PROCEDIMIENTOS PARA RECOLECTAR INFORMACION EN CIENCIAS SOCIALES, SALUD, EDUCA- CION, ETC. Toda informacién tiene dos aspectos fundamentales: Fuente de obtencién, y métodos para su recoleccién. FUENTE DE OBTENCION La fuente de obtencién puede ser: primarios y secun- darios. PRIMARIOS Como ya hemos dicho, se recogen directamente de su origen. SECUNDARIOS Cuando no se recogen directamente de su fuente de origen. METODOS DERECOLECCION Cuando es utilizada una fuente primaria para re- colectar informacién se distinguen dos procedimientos fundamentales a saber: la obser- vacion y el interrogatorio. DESVENTAJAS DE LA OBSERVACION - Requiere personal especializado. - Puede resultar ser un método demasiado care: -. Noes conveniente cuando se estudia grandes masas humanas. Una cuestién que invalida la observacién es cuando se requiere investigar: - Lasmanifestaciones subjetivas de los individuos. Por ejemplo, saber si un paciente tiene apetito. - Ensu comportamiento pasado. Por ejemplo, enfermedades que ha padecido, - Susactitudes futuras. Por ejemplo, qué habitos higiénicos observard cuando esté de alta. 18 VENTAJAS DEL INTERROGATORIO Como podrd observarse las limitaciones de la observaci6n son ventajas del interrogatorio, ya que cuando se indaga el pasado o futuro, asi como las condiciones subjetivas del individuo ofrece resultados satisfacto- Tios. DESVENTAJAS DEL INTERROGATORIO - Se apela a la memoria y/o a la buena fe del interrogado. - Produce diferentes resultados seguin el tipo de preguntas y a la manera de formular- los. Para evitar errores en la segunda desventaja debe observarse los siguientes aspectos: - Las preguntas deben ser claras y concisas. - — Las preguntas no deben ser capciosas ni ambiguas. - Las preguntas no deben presuponer hechos. - Las preguntas no deben sugerir respuestas. METODOS DE INTERROGATORIOS El interrogatorio puede hacerse mediante dos métodos: Método directo (se efecttia por medio de entrevistas) Método indirecto (se efectiia por medio de cuestionarios) La entrevista tiene una ventaja principal que la acentiia, y es que puede completarse con la observacién directa, también tiene como principal desventaja el hecho que la personalidad, posicién social, la inflexién de la voz, la manera de hacer las preguntas, etc. pueden hacer variar las respuestas. El cuestionario tiene como ventaja principal el ser mas barato. Como desventaja solo es posible para preguntas sencillas y también en ocasiones no es devuelto por el individuo encuestado, 0 no Ilena con todos los requisitos adecuadamente. FRECUENCIA PARA LA RECOLECCION DE LOS DATOS Los procedimientos para recoger la informacién, por su frecuencia, pueden clasificarse en: - Métodos de recoleccién ocasional: las encuestas. - Métodos de recoleccién periédicas: los censos. - Métodos de recoleccién continuas: los registros. Estos métodos se diferencian entre sien una serie de aspectos importantes y que son: 19 - Frecuencia de recoleccién. - Los aspectos de cobertura. - Los aspectos de temporalidad. - Los aspectos de propésitos. Veremos que la encuesta tiene una amplitud parcial, mientras que el censo y el registro la tienen universal. Otro aspecto muy importante es que el censo y la encuesta tienen un cardcter transversal, es decir se realiza en un determinado momento, mientras que el registro tiene un cardctér longitudinal, o sea, se recoge la informacién a lo largo del tiempo. Finalmente diremos, que el censo es un procedimiento que tiene objetivos generales, mientras que el registro y la encuesta tienen objetivos especificos. ENCUESTA Es el procedimiento de obtenci6n de informacién estructurada segun criterios previos de sistematizacién, que se efectiia con un propésito especifico (y que tiene alcance restringido) en un sector de la poblacién. Ejemplo_ Encuesta nacional de propésitos multiples (ENAPROM) realizada por el INEI en 1977 y 1978, y publicadas en 13 fasciculos por ésta institucién. TIPOS DE ENCUESTAS:; Encuesta retrospectiva, encuesta prospectiva. ENCUESTA RETROSPECTIVA En este tipo de encuestas se parte de datos que se conoce y la investigacién consiste en descubrir caracteristicas de su historia. Por ejemplo, se coge un grupo de personas afectadas con cdncer en el pulmén y vamos a recoger en su historia retrospectivamente si tiene antecedentes de: hdbito de fumar, riesgos industriales, etc. ENCUESTA PROSPECTIVA. Comienza con una muestra de la poblacién estudian- do una o més caracteristicas a uavés del tiempo. Por ejemplo, se coge un grupo de personas, y vemos la caracteristica de hdbito de fumar: observamos si en el transcurso del tiempo se desarrolla cancer al pulmén. CENSO DE POBLACION Se llama al proceso de recolectar, completar y publicar datos demogrdficos, econémicos y sociales pertenecientes a un tiempo especifico y datos de todas las personas en un pais o un territorio determinado. EI propésito principal de un censo de poblacién nacional consiste en satisfacer ciertas necesidades de informacién estadistica concernientes a la totalidad de los habitantes de un pajs con vistas a: planificacién de una serie de aspectos como son los Tequerimientos de alimento, los mimeros de escuelas y hospitales, asi como su ubicacién, etc. 20 REGISTROS Son los procedimientos que se siguenpara conocer adecuadamente los cambios y las estructuras de: - Cambios en el numero de la poblacién. - Aumento de la poblaci6n por nacimiento. - Aumento de la poblacién por inmigracién. - Reduccién de la poblacién por emigracién. - — Reduccién de la poblacién por fallecidos. Mediante los sistemas de registros se establecen asi, un proceso continuo que sigue sin pausa los movimientos de cambio en la poblacién. 1.7 TIPOS DE DATOS Sea cual fuere la fuente de la que obtenemos la informacién, esta pucde estar referida a caracteristicas cualitativas o cuantitativas. Las primeras se refieren a cualidades tales como, color: blanco, azul, etc.; estado civil: casado, soltcro, etc.; profesién: economista, ingeniero, etc.; calidad de un producto: bueno, regular, etc. Los segundos se refieren a cantidades tales como: estatura en cm., salario en soles, nimero de hijos de una familia, nimero de dormitorios por vivienda, etc. Con cada caracteristica materia de investigacién, asociamos una variable; asi, podemos dar la definici6n siguiente. VARIABLE Es una caracteristica de la poblacién que se va investigar y que puede tomar diferentes valores. Asi, por ejemplo una variable seria, las horas extras trabajadas por los trabajadores de una empresa y los valores de esta variable vendrian dadas por las diferentes horas trabajados por cada trabajador fuera de 1a jornada normal: ninguna, una, dos, tres, .. .. Notacién: Las variables se denotardn por X, Y, etc. Las variables se clasifican en: cualitativas y cuantitativas. VARIABLE CUALITATIVA Se Ilama asi, cuando la variable esté asociada a una caracteristica cualitativa. Es decir, son variables cuyos valores son cualidades que presenta la poblacién. Por ejemplo, la variable “profesién” puede adoptar las modalidades: Ingeniero, Médico, Bidlogo, Economista, etc. Las variables cualitativas se clasifican en: nominales y ordinales. 21 VARIABLE CUALITATIVA NOMINAL Son aquellas que establecen la distincién de los elementos en las categorias sin implicar orden entre ellas. EJEMPLO 1.8 Clasificar un grupo de individuos por sexo: masculino, femenino; por” su estado civil: soltcro, casado, viudo, etc. VARIABLE CUALITATIVA ORDINAL Son aquellas que agrupan a los objetos, individuos, en categorias ordenadas, para establecer relaciones comparativas. Es decir, son suceptibles de ordenacién pero no de medicién cuantitativas. EJEMPLO 1.9 a. Clasificar a un grupo de personas por su hbito de fumar. Se procede asf: No fumadores Fumadores leves Fumadores moderados Fumadores severos b. Clasificar un grupo de individuos por su grado de instruccién. Se procede como sigue: Analfabeto Primaria Secundaria Superior VARIABLE CUANTITATIVA Sc llama asi, cuando la variable esta asociada a una caractcristica cuantitativa. Es decir, estas surgen cuando se puede establecer cudnto 0 en qué cantidad se posce una determinada caracteristica. EJEMPLO 1.10 Son variables cuantitativas: ingreso por familia, mimero de acciden- tes de transito, longitud, tiempo, etc. Las variables cuantitativas se dividen en discretas y continuas. VARIABLE DISCRETA Son aquellas que surgen por el procedimiento de conteo. Es decir, las variables estadisticas discretas suelen tomar valores enteros. Por cjemplo, el némero de hijos por familia; el némero de estudiantes por colegio; el numero de automéviles que pasan por una avenida en una hora; el nimero de habitantes por distrito; etc., son variables discretas. 22 VARIABLE CONTINUA Son aquellas que surgen cuando se mide alguna caracte- ristica. Es decir, las variables continuas, pueden tomar al menos teéricamente cualquier valor dentro de un intervalo. Por ejemplo, el peso, la estatura, la tension arterial de las personas, los ingresos, el tiempo de servicio, etc., son variables estadisticas continuas. No significa que el ntiimero asignado a cada peso, estatura, etc., pueda tomar en la prdctica cualquier valor real de un intervalo (aunque tedricamente sea asf) porque la imprecisién de nuestras mediciones hard que en definitiva éstas vengan representadas por valores discretos. Pero es el cardcter de posibilidad que tiene todo ntimero real de ser asignado a una de estas variables lo que las define como continuas. En general, todas las magnitudes relacionadas con el tiempo (edad, duracién de un fendmeno, . . .), la masa (volumen, peso, . . .), el espacio (longitud, superficie, . . .) © una combinacién de estos (velocidad, densidad, capacidad, . . .) son variables continuas. EJEMPLO 1.11 Clasifique las siguientes caracteristicas en variables cualitativas, continuas, discretas. a. Tiempo de servicio de los empleados de una empresa. b. Numero de cheques girados diariamente en un mes. c. Niimero de acciones comunes vendidas cada dia en la Bolsa de Valores de Lima. d. Lugar de nacimiento de las personas que viven en Lima, e. Nivel educacional y religién de las limefias. f. Temperatura y humedad diaria de Lima. g. Nivel educacional, estatura y color de ojos de las cajamarquinas. SOLUCION: a. El tiempo que cualquier persona presta servicios a una empresa esta comprendida generalmente de acuerdo a ciertas leyes entre 0 y 30 afios. Es decir, puede ser cualquier punto del intervalo [0, 30], al menos en teoria. Por tanto es una variable cuantitativa continua. b. Elniimero de cheques girados diariamente en un mes, puede ser: ninguno, uno, dos, .. Es decir, es una variable cuantitativa discreta. ¢. También es una variable cuantitativa discreta. d. Las personas que viven en Lima, pueden haber nacido en cualquier distrito o lugar del pais o del extranjero. Por tanto, es una variable cualitativa. e. El nivel educacional es una caracteristica cualitativa ordinal y la religién es cualitativa nominal. Por tanto, las limefias son clasificadas por las variables ‘cualitativas, nivel educacional y religién. f. Latemperatura y la humedad son variables cuantitativas continuas. Luego, Limaes clasificada por las variables temperatura y humedad ser una variable continua. 23 g- Nivel educacional y color de los ojos son variables cualitativas; la estatura es una variable cuantitativa continua. Por tanto, Jas cajamarquinas son clasificadas por las caracteristicas cualitativas: nivel educacional y color de sus ojos, y la variable continua estatura. UNIDADESTADISTICA Esel elemento u objeto indivisible de la poblacién que sera analizado. Por ejemplo, si se quiere estudiar la demanda del detergente X en Lima Metropo- litana, la unidad estadistica serdn las familias. DATOS. Son los valores recopilados como resultado de Jas observaciones de una caracteristica o variable. Llamados también series estadisticas. Como hay dostipos de variables: cualitativas y cuantitativas, diremos también que hay dos tipos de datos: datos cualitativos y cuantitativos. Los datos cuantitativos, se pueden considerar también como datos discretos y datos continuos. PROBLEMAS 1 - 3 1. ~Puede ordenar a las personas por su estado civil: soltero (a), casado (a), viudo (a), divorciado (a)? Justifique su respuesta. 2. En una carrera de caballos, Saltarin leg6 primero, Pintado, segundo y Ronco, tercero. {Puede encontrar la distancia entre los caballos?. Justifique su respuesta. 3. Clasifique las siguientes caracteristicas, en variables cualitativas, cuantitativas continuas y discretas. a. Consumo de corriente (kw) mensual en un afiv. ‘». El nimero de tornillos de cada caja producidos en un mes. c. Estado civil, opinién piiblica, lugar de nacimiento de las personas que viven en el Callao. d. Marca y pais de procedencia de los automdéviles vendidos durante el afio en el Pond. 4. Silos tinicos valores posibles para una variable X son: 1/2, 1/3, 1/4, .. ., entonces X es una variable continua. 5. En cada aparato que produce una empresa de equipos eléctricos se incluye una poliza de garantia para el cliente. Ademés de validar la garantia y proporcionar a la compaiifa cl nombre y domicilio del cliente, la péliza pide otra informacién com- plemeni.::ia que sc empleaen los estudios de mercado. Para cada uno de los blancos numeracs de la péliza, determine las caracteristicas mas probables de las catego- rias que utilizard la compaiiia para registrar la informacion. En particular: a. {Scrdn cuantitativas o cualitativas? b. {Continuas 0 discretas? Nombre Estado civil @ Domicilio EE iD6nde se compré el equipo? Ciudad Estado. Cédigo Postal __._________ {Por qué compré el equipo? Edad @ Ingreso anual @ 6. 4Cudldelos siguientes enunciados representa el esquema mds exacto paraclasificar datos? a. Métodos cuantitativos. b. Métodos cualitativos. c. Una combinacién de métodos cuantitativos y cualitativos. d. El esquema se determina sélo mediante la informacién concreta sobre la situacién. 7. Para cada uno de los siguientes enunciados, identifique la unidad estadistica: a. Elalcalde de una ciudad desea estimar el porcentaje de votantes en su distrito que estard a favor de la aprobacién de una ley municipal. b. Unacadena de supermercados desea conocer la opinién de sus empleados acerca de un plan de seguro médico patrocinado por la compaiiia. c. Unejecutivo de mercadotecnia de una compaiiia desea hacer una encuesta entre los compradores para determinar su actitud hacia una nueva linea de productos. 8. Enlossiguicntes enunciados identifique usted: la poblacin, la muestra, la variable, el tipo de variable, la unidad estadfstica, el parametro y dé una observacién. a. Se vaa realizar un estudio de la cantidad de azticar vendida por semana, en un supermercado de cierto sector de Lima, para el aiio 1990; para lo cual se utilizara el promedio de ventas de ese afio, los registros se hacen en kgs. por semana. b. Una firma industrial, comprometida en la produccién de aceros, produce tornillos para los cuales existen estrechos margenes de tolerancia con respecto a la anchura, se selecciona un nimero de tornillos de la producci6n diaria y se mide cuidadosamente. 1.8 DISENO O ELABORACION DE FORMULARIOS En toda actividad de cardcter cientifico, lo que se hace en tiltima instancia, es dar respuestas a ciertas preguntas. De acuerdo con esto, necesitamos un documento donde plantear preguntas y registrar sus respuestas, resultando asi que una de las primeras y realmente mas decisiva etapa en cualquier investigaci6n es la confeccién de formula- T1os. 25 DEFINICION 1.8 Bajo la denominacién genérica de formularios, se incluye toda forma impresa destinada a la recoleccidn de datos. EJEMPLO 1.12 Las historias clinicas; las fichas epidemioldgicas, etc. Los formularios recogen dos clases de datos: Datos administrativos o de identificaci6n. Datos sobre el problema que se estudia. Los primeros ayudan a identificar las unidades estadisticas de observacién o incluyen cl nombre de la persona, su edad, sexo, residencia 0 ubicacién, fecha de realizacién del estudio, etc. Los segundos se reficren especificamente al problema que Antes de claborar el formulario debe considerarse: 1. El propésito para el cual serd utilizado. 2. Circunstancias bajo las cuales se recogeran la informacién. Lo primero tiene importancia para decidir sobre los datos que se recogeran y lo segundo para la determinacién del tamaiio y del material mds conveniente. 1.8.1 PRINCIPIOS BASICOS QUE SE DEBEN TENER EN CUENTA EN LA CONFECCION DE FORMULARIOS 1. DECIDIR SOBRE LOS DATOS QUE SERECOGERAN Entodo formulario se debe recoger séio los datos utiles y adecuados al estudio. Formularios muy extcnsos conspiran contra la exacta recoleccién de los datos. Es pués, entonces convenicnte: a. Hacer una lista de todos los datos que sean necesario recoger de acuerdo a la finalidad del estudio. b. Considerar cudles datos son factibles de recoger de manera fidedigna y exacto. c. Limitar a aquellos datos practicos a recoger y que se usard. ‘JEMPLO 1.13 Averiguar si una persona es 0 no adicta a drogas, puede ser una informacién deseable a recoger, pero es raro que las personas estén dispuestas a suministrarlo. 2. DECIDIR SOBRE EL ORDEN EN QUESE ACEPTARANLOS DATOS Las preguntas deben hacerse de manera l6gica y ordenada. Por ejemplo, preguntas sobre ocupacién, educacién, vivienda y otras referentes a condiciones econdémicas y sociales no deben estar separados. 3. CONSIDERAR COMO SE HARAN LAS PREGUNTAS: a. Considerar si hay alguna ambigiiedad en la pregunta como consecuencia de la respuesta recibida. 26 EJEMPLO 1.14 Si queremos recoger el dato edad, debemos tener en cuenta si se recogerd en afios cumplidos o en el cumple afios mas préximo. b. Toda pregunta debe tener respuesta ya que seria imposible saber si una persona posee o no cierta caracteristica, si no se obtuvo la informacién al respecto. Asi, cada pregunta necesita una categoria final para asegurar que se dé alguna respuesta ya sea ella desconocida, no informa, no especifica u otra. EJEMPLO 1.15 Al preguntar si ha padecido de rubeola durante el embarazo, no solamente debe preguntar si o no, sino también si se desconoce. c. Debe usarse un lenguaje claro y poco técnico. EJEMPLO 1.16 Si queremos saber si una persona padece de cefaleas frecuen- tes, debe preguntarse si padece de dolores de cabeza frecuentes. d. Evitar respuestas inducidas. EJEMPLO 1.17 Ud. nunca ha padecido de tuberculosis. Con esta pregunta estamos induciendo a la persona a que su respuesta sea negativa. PLANEAR COMO SE ANOTARAN LAS RESPUESTAS EI espacio que se deja debe ser adecuado para las respuestas que se esperan y siempre que sea posible se adoptard el sistema que exige el menor esfuerzo. EJEMPLO 1.18 a. Sexo 3b. Sexo_______ Femenino ——______ Masculino En cl inciso (a),.se pone nombre y en el (b), se marca con una cruz, este ultimo es de menor esfucrzo. Puede usdrse otro. método que sea la utilizacién de un cédigo, por ejemplo, ,debe existir una revisién periédica del salario minimo? 1. Si 2.No 0. No sabe o no opina ELECCION DE VARIAS RESPUESTAS _Debe procurarse que sc pueda elegir entre varias respuestas, evitando ambigiiedad u omisién de datos. EJEMPLO 1.19 Enfermedades que usted ha padecido. incorrect. Aqui se deja a libre eleccién la respuesta, siendo un método incorrecto. Es.2 debe hacerse de la siguiente manera: sarampién varicela bronquitis_______.__== ete. 27 El entrevistado marca entonces sélo las enfermedades que ha padecido y las cuales se desca recoger. 6. DETERMINAR LAS CARACTERISTICAS DEL FORMULARIO Decidir sobre la forma, tamaiio, color, etc., del formulario de acuerdo a algunas interrogan- tes como: {Quién recogerd la informacién? {De quién se recogerd la informaci6n? ;Cudndo y d6nde se registrard los datos? 4C6mo se procesar la informacién? 7, REALIZAR ESTUDIO PILOTO Debe realizarse un estudio piloto antes que el formulario sea impreso de manera definitiva, con el fin de probarlo y ver la operatividad del formulario y para darse cuenta de las fallas que pueda tener y hacer las correcciones necesarias. 8. REDACTAR LAS INSTRUCCIONES NECESARIAS Aunque se debe tratar que cada pregunta sea autoexplicativa, de ser necesario, debe redactarse las instruc- ciones de cémo anotar las respuestas. Estas pueden imprimirse en el mismo formulario o aparte cuando son muy extensas. 19 VENTAJAS DEL EMPLEO DE MUESTRAS En ocasiones, el muestreo es una necesidad, como cuando estamos en presencia de poblaciones virtuales o infinitas, o poblaciones finitas grandes. También es obligado en situaciones como las que se presentan, digamos, en el control decalidad de productos farmacéuticos, en que el examen del producto hace que haya que desechar luego de efectuado el control. En otras ocasiones, muestrear constituye una alternativa frente al estudio de todo el universo. La alternativa de muestrear es generalmente favorable, porque ella significa un ahorro en tiempo, recursos y esfuerzo. * 1.10 DESVENTAJA DEL EMPLEO DE MUESTRAS Una de las principales desventajas, es que el empleo de muestras introduce el llamado error de muestreo, que tiene su origen en la variabilidad de los elementos que componen la poblacién, muestras del mismo tamafio arrojan resultados diferentes. Supongamos, por ejemplo que tenemos una poblacién formada por cuatro personas, Cuyas estaturas en centimetros son 158, 160, 166 y 172, respectivamente. La talla promedio de las personas de esta poblacién es de — 158+ 160 + 166 + 172 4 Si no se conociera dicho promedio poblacional, podriamos estimar esta estatura promedio con una muestra, por ejemplo de sélo dos individuos. Los resultados seria como se muestra en el cuadro siguiente. uw = 164 centimetros 28 valores muestrales estatura promedio 18+ 160 _ 159 158 + 166 _ 169 2 158 +172 _ 158+ 172 - 160 + 166 _ nore 160+ 172 _ +17 166 + 172 2 158, 160 158, 166 158, 172 165 160, 166 163 166 160, 172 166, 172 = 169 Como vemos, a cada muestra correspende un valor promedio diferente, y diferente a su vez, del verdadero promedio de la poblacién. Esta diferencia entre el valor promcedio que arroja la muestra y el valor promedio de la poblacién, se llama error de muestreo. Nota: Es importante sefialar, que el término “error”, como puede apreciarse en el ejemplo anterior, no se usa como sindénimo de equivocaci6n, sino que ticne una con- notacién completamente diferente. Aunque el error de muestreo no puede conocerse exactamente (porque para ello habré que conocer el valor poblacional, y en ese caso no seria necesario seleccionar muestra alguna), si puede calcularse indirectamente por procedimientos estadisticos. El error de muestrco, desde luego, sdlo puede estimarse a condicién de que la muestra sea adecuadamente seleccionada, y ademas, puede disminuirse tanto como se desce, aumentando el tamaiio de la muestra. Este hecho hace que el mucstreo sea un arma muy poderosa y por consiguiente, una alternativa a valorar particularmente cuando se trata de poblaciones grandes cuyo estudio exhaustivo es dificil y costoso. 1.11 CONDICIONES DE UNA BUENA MUESTRA Aunque cualquier parte o subconjunto de una poblacién constituye una muestra, parece intuitivamente evidente que no cualquier mucstra resulta util para hacer inferen- cias adecuadas en relacién con la poblacion, Las muestras deben cumplir determinadas condiciones. Podriamos decir que estas son dos: 29 1. La relativa al tamafio muestral, y 2. La calidad muestral Delo que sc trataa menudo es pues, de tener una muestra suficientemente grande, pero no mayor de lo necesario. Esto depende generalmente de la frecuencia con que el fendémeno 0 caracteristica en estudio se encuentre en la poblacién y de la variabilidad de ésta. Sin embargo, el tamaiio por si solo no puede garantizar que la muestra sea Util 0 adecuada. Por ejemplo, pensemos lo que ocurriria si para estudiar la presencia de “el célera” en la poblacién de la ciudad de Lima, tomarfamos una muestra del cercado de Lima. Esta muestra, atin cuando fuese tan grande que cubriera toda la poblacién del cercado, no seria una muestra representativa de la poblacién. Entonces, la condicién de calidad s6lo se garantiza con muestras representativas, que son las que reproducen las caracteristicas esenciales que posee la poblacién que se desea estudiar, y con muestras exentas de errores sistematicos, que son originados al no tener en cuenta determinados principios de seleccién. 1.12 TIPOS DE MUESTRAS Existen basicamente dos clases de muestras: muestra no probabilfstica y muestra probabilistica. MUESTRA NO PROBABILISTICA Llamada también muestras de convenienciao de juicio, se basan en el conocimiento y la opinién personal para identificar los elementos de la poblacién que van a incluirse en la muestra. Una muestra seleccionada a juicio se basa en el conocimiento de la poblacién por parte de una persona que generalmente es un experto en la materia. MUESTRAS PROBABILISTICAS Son aquellas en que todos los elementos de la poblacién tienen una posibilidad (una probabilidad conocida) de ser incluida en la muestra. Naturalmente noes necesario que todos tengan la misma posibilidad, basta que tengan alguna posibilidad. 1.12.1 METODOS PARA OBTENER MUESTRAS PROBABILISTICAS Ya sabemos que las muestras probabilisticas son aquellas en que todos los elementos de la poblacién tienen una probabilidad conocida de ser seleccionados. A continuacién veremos algunos de los procedimientos mas usuales para la seleccién de muestras probabilisticas. Existen al menos cuatro métodos cominmente utilizados: Muestreo aleatorio simple, Muestreo sistemdtico, Muestreo estratificado y Muestreo por conglomerados. 30 1.12.11. MUESTREO ALEATORIO SIMPLE Este método o esquema de muestreo, se caracteriza porque todos los elementos de Ia poblacién tienen Ia misma probabilidad-de ser incluidos en la muestra, 0 en otros términos, porque todas las posibles muestras de un tamaiio fijo son igualmente probables. Una manera sencilla aunque poco practica de obtener una muestra aleatoria es la técnica “de la urna” (0 de la pecera). Consiste en colocar en una urna o pecera, fichas con los nombres o niimeros de cada elemento de la poblacién y luego de mezclarlos ade- cuadamente, se extrae tantos elementos como haya de tener la muestra que se ha deci- dido escoger. Debido a esta mezcla cuidadosa antes de cada extraccién, cada elemento tiene la misma posibilidad de ser seleccionado. TABLA DE DiGITOS ALEATORIOS Otro procedimiento ae extraer una muestra aleatoria simple, es empleando una tabla de digitos aleatorios, e! cual puede construirse, empleando e! método de la urna con 10 tarjetas numeradas: 0, 1,2,... ,9. Después que se mezclan las tarjetas, se extrae aleatoriamente una taryeta y se registra su nimero. La tarjeta se reemplaza antes de la extraccién siguiente, se mezclan bien las tarjetas y asi, sucesivamente. En la practica, esto se realiza mediante una computadora, por un procedimiento completamente al azar. Cada pagina de estas tablas contienen los digitos agrupados en filas y columnas para facilitar su eleccién. . USO DELA TABLA DEDIGITOS ALEATORIOS Para utilizar esta tabla, se hace Jo siguiente: 1. Seenumera los elementos de la poblacién con igual némero de digitos queel tamafio N de la poblacién. Por ejemplo, si tenemos 120 empleados de una compaiiia y deseamos entrevistar una muestra de 20 de ellos seleccionados al azar. Entonces, primero debemos enumerar la poblacién N = 120 con ntimeros de tres digitos: 001, el primer elemento de la poblacién, 002 al segundo, y asi sucesivamente, el nimero 119 al 119 avo y 120 al N-ésimo. 2. Conel propésito de extraer la muestra al azar, se establece un punto de partida al azar en la tabla de niimeros aleatorios (TABLA I al final del libro). Un método es cerrar los ojos y rayar con un lapiz la tabla y empezar de ese punto la Icctura de la muestra, hacia arriba, abajo, derecha o hacia la izquierda. Supongamos que se Siguié ese procedimiento y se seleccioné como punto de partida la fila 19, y columna 3. Suponga también que se decidié leer hacia abajo; y leemos sdlo los tres primeros digitos de cada rengl6n. Notese que nuestro primer nimero usando éste método sera 055, el segundo 048, el tercero 069, y asi sucesivamente: 041, 020, 066, 074, 054, 035, 059, 079, 102, 034, 081, 099, 073, 101, 097, 090 y 031. Note que se descarta toda la sucesién de nimeros de tres digitos mayores que N (en nuestro caso mayores que 120). 31 Si en el proceso de eleccién se repite el ntimero (de tres cifras en este caso), se volver a incluir en la muestra el elemento de la poblaci6n correspondiente a ese nimero, si el muestreo es con reemplazo y se descarta si el muestreo es sin reemplazo como en nuestro ejemplo. 1.12.12, MUESTREO SISTEMATICO En éste procedimiento, se selecciona una muestra, tomando cada k-ésima unidad de la poblacién una vez que las unidades de muestreo estén numeradas 0 arregladas en alguna forma. El nimero k es la raz6n de muestreo; esto es ia razén del tamafio de la poblacién N al tamaiio de la muestra n(k = N/n). Por ejemplo, si se vaa seleccionar una muestra de 50 unidades a partir de una poblaci6n de tamafioN = 1000 unidades, entonces k = 1000/50 = 20. Luego la muestra se obtiene tomando cada 20-esima unidad de la poblacién. Se puede utilizar el procedimiento de la urna para determinar con cudl de las primeras 20 unidades empezar. Si se selecciona la unidad- 15 ésima como inicio aleatorio, entonces la muestra incluird a las unidades 15, 35, 55, 75,. .. 995 - ésimas. Por razones obvias, este procedimiento sistematico s6lo se puede aplicar cuando el marco de muestreo es homogéneo. 1.12.13 MUESTREO ESTRATIFICADO Esta se usa cuando la poblacién no es homogénea, sino que pueden en ella identificarse clases definidas por algiin atributo o caracteristica relacionada con la variable que se estudia. Este procedimiento implica djvidir fa poblacién en clases o grupos homogéneos relativos a las caracteristicas que van a estudiarse, llamados estratos. Después se toma una submuestra de cada estrato de una de las formas posibles: O bien seleccionamos al azar en cada estrato un nimero especificado de elementos a la proporcién del estrato de la poblacién total o bien extraemos un nimero igual de elementos de cada estrato y damos un peso a los resultados de acuerdo con la proporcién del estrato en la poblacién total. En uno y otra forma, el muestreo estratificado garantiza que todos los elementos dela poblacién tengan una posibilidad de ser seleccionados. Algunas veces las unidades ena muestra de cada estrato estd relacionado inversamente con la homogeneidad de las unidades en el estrato; mientras mas homogénea sea el estrato, menor serd la proporcién incluida en la muestra. La raz6n es que cuando las unidades en un estrato son mds homogéneas, resulta suficiente una submuestra m4s pequefia para asegurar la represen- tatividad. En consecuencia el costo del muestreo se reduce. Las ventajas del muestreo estratificado sobre el aleatorio simple son fundamen- talmente dos: 1. Se obtiene informaci6n separada para cada uno de los estratos. 32 2. Se evita el riesgo de que determinado estrato quede inadecuadamente representa- do. 1.12.14 MUESTREO POR CONGLOMERADOS Se usa en poblaciones grandes y muy dispersos desde el punto de vista geografico, y en las cuales el muestreo aleatorio simple seria poco econémico debido a que daria lugar a muestras igualmente dispersas. En este tipo de muestreo, en lugar de seleccionar directamente los elementos de la poblaci6n se hace una seleccién inicial de grupos o conglomerados, que son agru- paciones de elementos que deben ser lo mds heterogéneo posible a diferencia de los estratos, de suerte que cada una de ellas resulte una réplica reducida de la poblacion, la muestra general esta formado por todas o por una submuestra de las unidades en cada conglomerado. Estos tipos de muestras se emplcan solos 0 combinados, en etapas multiples, con restricciones y en consideraciones tales como el costo. El uso de uno 0 de otro, depende de las caracteristicas de la poblacién y de las condiciones en que se encuentre, buscando siempre la mayor representatividad de la muestra y la simplificacién del trabajo, de forma que haga,posible la realizacién del mucstreo con calidad y a un costo moderado. PROBLEMAS 1-4 1. Conteste si es verdadero o falso cada una de las siguientes proposiciones: a. Cuando una muestra contiene las caracteristicas relevantes de cierta poblacién en la misma proporci6n en que figuran en esta ultima, se dice que es una muestra representativa. b. Cuando los elementos incluidos en una muestra se basan en el juicio del indi- viduo que toma la muestra, se dice que es no aleatoria. c. Un plan de muestreo que seleccione miembros de una poblacién a intervalos uniformes en el tiempo, orden o espacio recibe el nombre de muestreo estratifi- cado. 2. Son representativas las siguientes muestras? Explique: a. El editor de una revista desea predicir el resultado de la siguicnte eleccién presidencial y con esta finalidad entrevista a 1000 suscriptores de su revista para determinar sus preferencias al votar. b. Se entrevista a los estudiantes de una clase de estadistica acerca de sus actitudes hacia la legalizacién del aborto; sus respuestas se utilizaran para predecir la opinion de la comunidad universitaria en lo referente a este problema. 3. Unaorganizaci6n no lucrativa esta efectuando una encuesta domiciliaria de opinion sobre los servicios que presta la municipalidad a la comunidad. La organizacién ha 33 34 ideado un esquema para realizar el muestreo aleatorio de las casas y planea efectuar fa enc uesta los dias laborales de las 12 del dia a las 5 de la tarde. Producird este esquema una muestra aleatoria?. {Dcberia utilizarse muestreo estratificado o muestreo por conglomerados, y cémo para obiener una muestra aleatoria en cada una de fas siguientes situaciones? a. Se realiza un estudio para determinar el patron de gastos familiares en cierta ciudad, b. Sc realiza una encucsta para determinar la actitud de los estudiantes universita- rios del Peri, con respecto a la pena capital. El centro de estudiantes de la Facultad de Ingenieria Mecénica informa que el 50% de las alumnas de la Facultad se han casado con sus profesores, {Existe algin defecto en tal informacién?. Explique.

You might also like