Professional Documents
Culture Documents
Medidas de Dispersión
Medidas de Dispersión
Medidas de Dispersión
Actividad 2
MATRICULA: ES1921008576
GRUPO: LT-LEBA-2001-B1-004
21 DE MARZO DE 2020
UNIVERSIDAD ABIERTA Y A DISTANCIA DE MÉXCIO
Unidad 3. Muestreo, medidas de tendencia central y de dispersión.
ÍNDICE
Tabla de contenido
ÍNDICE.................................................................................................................................................................................... 1
INTRODUCCIÓN..................................................................................................................................................................... 2
DESARROLLO......................................................................................................................................................................... 3
RECAPITULACIÓN:...............................................................................................................................................................10
CONCLUSION....................................................................................................................................................................... 11
REFERENCIAS........................................................................................................................................................................... 11
INTRODUCCIÓN
En esta actividad generaremos medidas de dispersión y realizaremos muestreos aleatorios para crear y
consolidar proyecto de ingeniería.
Además retomaremos el tema que elegimos en la actividad anterior junto con la base de datos que utilizamos.
Generaremos las medidas de dispersión: rango, varianza y desviación estándar.
Realiza un muestreo aleatorio simple para obtener una muestra estadísticamente representativa. (UnADM, Estadística
Básica, 2020)
DESARROLLO
En la base de datos de la figura 1.1, la cual explicamos en la evidencia de aprendizaje de la unidad 1, podemos
ver que hablamos del total de personas que habitan en cada uno de los 84 municipios que conforman al estado
de Hidalgo. Estos datos fueron recabados y obtenidos de la página oficial del INEGI.
MUNICIPIO TOTAL POBLACIÓN MUNICIPIO TOTAL POBLACIÓN
Eloxochitlan 2,667 Tlahuelilpan 19,389
Juárez Hidalgo 3,108 Xochiatipan 19,752
Pacula 5,139 Atlapexco 19,902
Nicolás Flores 7,031 Acatlán 20,077
Xochicoatlán 7,706 Metztitlán 20,111
Mineral del Chico 9,028 Alfajayucan 20,332
Agua Blanca de Iturbide 9,116 Huautla 21,244
San Agustín Metzquititlán 9,437 Progreso de Obregón 23,451
Lolotla 9,461 Chapulhuacán 23,961
Omitlán de Juárez 9,636 Yahualica 24,173
La Misión 10,139 Huehuetla 25,989
Tlanalapa 10,342 Atotonilco el Grande 27,433
Tlahuiltepa 10,376 Tlaxcoapan 28,490
Tepetitlán 10,932 Atitalaquia 29,683
Molango de Escamilla 11,587 Tepehuacán de Guerrero 30,750
Tetepango 11,624 Zacualtipán de Ángeles 34,720
Metepec 11,801 San Salvador 35,547
Jaltocán 11,818 Francisco I. Madero 35,872
Almoloya 12,410 San Agustín Tlaxiaca 36,079
Villa de Tezontepec 12,413 Santiago Tulantepec de Lugo Guerrero 37,292
Jacala de Ledezma 13,399 Tecozautla 37,674
Chapantongo 13,789 Atotonilco de Tula 38,564
Huazalingo 13,986 San Felipe Orizatlán 38,952
Mineral del Monte 14,640 Tlanchinol 39,772
Epazoyucan 14,693 Zimapán 40,201
Emiliano Zapata 14,825 Acaxochitlán 40,583
Tianguistengo 15,122 Apan 44,576
Singuilucan 16,235 Zempoala 45,382
Tasquillo 16,403 Huichapan 45,959
Tolcayuca 16,733 Mixquiahuala de Juárez 46,224
Nopala de Villagrán 16,896 Tezontepec de Aldama 53,009
Santiago de Anaya 17,032 Actopan 54,299
Calnali 17,163 Tepeapulco 54,373
Pisaflores 17,379 Cuautepec de Hinojosa 58,301
Huasca de Ocampo 17,728 Tepeji del Río de Ocampo 87,442
Chilcuautla 18,169 Ixmiquilpan 93,502
Ajacuba 18,320 Tula de Allende 109,093
Cardonal 18,347 Tizayuca 119,442
Zapotlán de Juárez 18,748 Huejutla de Reyes 129,919
Tenango de Doria 18,766 Mineral de la Reforma 150,176
El Arenal 18,807 Tulancingo de Bravo 161,069
San Bartolo Tutotepec 18,986 Pachuca de Soto 277,375
Figura 1.1 Base de datos ordenada y clasificada por municipios. Fuente obtenida de: https://www.inegi.org.mx/
1. En base a nuestra base de datos describe los siguientes elementos:
1.1 - TAMAÑO DE MUESTRA
Antes que nada, analicemos nuestra base de datos (véase figura 1.1) e identifiquemos a qué tipo de población
pertenece nuestra base de datos, todo esto para determinar el tamaño de nuestra muestra.
Existen dos tipos de población:
Población finita: Está formada por un número limitado de elementos.
Población infinita: Está formada por un número extremadamente grande de componentes, donde no se pueden
contabilizar todos sus elementos, ya que existen un número ilimitados de estos.
Figura 3.1 Fórmulas para determinar un tamaño de muestra con variables cualitativas.
Fuente obtenida de: https://www.youtube.com/watch?v=1xZAa4jbMqc
Si una base de datos cuantitativa supera los 100,000 individuos, familias o elementos se debe de usar la
fórmula población infinita, pero si es menor a los 100,000 utilizaremos la fórmula de población finita.
Ahora ya que sabemos como calcular y determinar nuestro tamaño de muestra y a la vez nuestro muestreo
aleatorio simple.
Empecemos identificando la fórmula que nos ayudar a calcular el tamaño de la muestra que deseamos y nos
plantearemos el siguiente problema para calcular nuestra muestra.
EJERCICIO:
Vamos a calcular el tamaño de muestra para una población de 427,857 niños y niñas de 6 a 14 años,
consumidores de comida chatarra “x”, dónde el investigador asigna un nivel de confianza del 98% y un
margen de error del 2%. Dónde se desconoce la probabilidad “P” del evento. Ver figura 4.1
n=?
N=427,857
Z=2.330
e=2.00% - 0.02
p=50.00% - 0.5
q=50.00% - 0.5
n = (427,857*2,33*2,33) * (0.5*0.5)
(0.02*0.02) * (427,857-1) + (2,33*2,33) * (0.5*0.5)
n = 3,366.37 Dónde redondeamos el resultado.
“n” = 3,366
Así que el tamaño de nuestra muestra, la cual obtuvimos con nuestro muestreo aleatorio simple es de 3,366.
2.2 – CALCULA LAS MEDIDAS DE TENDENCIA CENTRAL (MEDIA, MODA Y MEDIANA) PARA DATOS NO
AGRUPADOS.
Media aritmética (promedio): Valor obtenido al sumar todos los datos y dividir el resultado entre el número
total de datos y se representa por el símbolo: Χ y se obtiene con la siguiente formula.
Χ = Media aritmética
∑ = Sumatoria
Χi = Cada valor en la base de datos
N = Número total de el resultado de la muestra.
Χ = ∑Χi Χ = 54,371+55,684+54,776+55,684+49,782+52,104+51,178+54,278
N 8
Como el total de datos son números pares, entonces procedemos a sacar el promedio entre los dos números
centrales.
54,278 54,371
A diferencia de las medidas de tendencia central que miden acumulaciones mediante un solo punto, las medidas
de dispersión miden el grado de separación o alejamiento que tiene una variable estadística en torno a una
medida de posición o tendencia central. Dicho grado de separación indica lo representativa que es la medida de
posición con respecto al conjunto total de datos. A mayor dispersión menor representatividad de la medida de
posición y viceversa.
Las medidas de dispersión más comunes son: el recorrido, la varianza y la desviación estándar.
2.1 Varianza
La varianza mide la mayor o menor dispersión de los valores de la variable respecto a la media aritmética.
Siempre es mayor o igual que cero y menor que infinito. Se define como la media de los cuadrados de las
diferencias del valor de los datos menos la media aritmética de éstos. (UnADM, Estadística Básica, 2020)
Para obtener la varianza se realiza la sumatoria de cada valor menos la media y se eleva al cuadrado y el
resultado se divide ya sea entre el valor poblacional (N), o bien el muestral menos 1, que corresponde a: n-1.
Ahora procederemos a calcular la varianza de nuestros datos, para empezar vamos a identificar si estamos
trabajando con una muestra o una población.
R. Como seguimos trabajando con el ejercicio de la actividad pasada, deducimos que es una muestra de la
población.
También identificaremos si estamos trabajando con una base de datos agrupados o no agrupados.
R. En una base de datos con datos no agrupados.
S = 6,453.78220828502
2.3 Rango
Una forma rápida de conocer la dispersión de los datos determinando el rango o recorrido de la variable
aleatoria.
(UnADM, Estadística Básica, 2020)
R=X –Xn 1
R = rango
X = el menor valor
1
X = el mayor valor
n
n Xi habitantes Xi - X Xi - X
1 49,782 49,782 – 53,482 = -3,700 3,700
2 51,178 51,178 – 53,482 = -2,304 2,304
3 52,104 52,104 – 53,482 = -1,378 1,378
4 54,278 54,278 – 53,482 = 796 796
5 54,371 54,371 – 53,482 = 889 889
6 54,776 54,776 – 53,482 = 1,294 1,294
7 55,684 55,684 – 53,482 = 2,202 2,202
8 55,684 55,684 – 53,482 =2,202 2,202
TOTAL 427,857 ∑ = 14,765
Fuente obtenida de: https://ceit.unadmexico.mx/contenidos/DCEIT/BLOQUE1/TC/EBA/U3/descargables/
EBA_U3_Muestreo_medidas_tendencia_central_disp.pdf
RECAPITULACIÓN:
Al terminar esta unidad hemos podido tener una visión general de la importancia que tienen las medidas de
tendencia central y de dispersión para comprender el comportamiento de los datos y poder ubicar qué tan
cercano o alejado se encuentra un valor cualquiera de las medidas de tendencia central, así como la variabilidad
y dispersión de los datos en conjunto de una distribución, de manera que puedas interpretar mejor tu problema
prototípico. (UnADM, 2020)
REFERENCIAS
UnADM, U. A. (2020). Estadística Básica. Obtenido de Unidad 3. Muestreo, medidas de tendencia central y de dispesión:
https://ceit.unadmexico.mx/contenidos/DCEIT/BLOQUE1/TC/EBA/U3/descargables/
EBA_U3_Muestreo_medidas_tendencia_central_disp.pdf