Medidas de Dispersión

You might also like

Download as docx, pdf, or txt
Download as docx, pdf, or txt
You are on page 1of 12

MEDIDAS DE DISPERSIÓN

Actividad 2

NOMBRE: VICTOR HUGO FRAGOSO FLORES

MATRICULA: ES1921008576

GRUPO:  LT-LEBA-2001-B1-004

ASIGNATURA: ESTADÍSTICA BÁSICA

CARRERA: INGENIERÍA EN LOGÍSTICA Y


TRANSPORTE

DOCENTE: OFELIA ALCARAZ MIRANDA

21 DE MARZO DE 2020
UNIVERSIDAD ABIERTA Y A DISTANCIA DE MÉXCIO
Unidad 3. Muestreo, medidas de tendencia central y de dispersión.
ÍNDICE

Tabla de contenido
ÍNDICE.................................................................................................................................................................................... 1
INTRODUCCIÓN..................................................................................................................................................................... 2
DESARROLLO......................................................................................................................................................................... 3
RECAPITULACIÓN:...............................................................................................................................................................10
CONCLUSION....................................................................................................................................................................... 11
REFERENCIAS........................................................................................................................................................................... 11
INTRODUCCIÓN

En esta actividad generaremos medidas de dispersión y realizaremos muestreos aleatorios para crear y
consolidar proyecto de ingeniería.
Además retomaremos el tema que elegimos en la actividad anterior junto con la base de datos que utilizamos.
 Generaremos las medidas de dispersión: rango, varianza y desviación estándar.

 Interpreta las medidas de dispersión.

 Realiza un muestreo aleatorio simple para obtener una muestra estadísticamente representativa. (UnADM, Estadística
Básica, 2020)
DESARROLLO
En la base de datos de la figura 1.1, la cual explicamos en la evidencia de aprendizaje de la unidad 1, podemos
ver que hablamos del total de personas que habitan en cada uno de los 84 municipios que conforman al estado
de Hidalgo. Estos datos fueron recabados y obtenidos de la página oficial del INEGI.
MUNICIPIO TOTAL POBLACIÓN MUNICIPIO TOTAL POBLACIÓN
Eloxochitlan 2,667 Tlahuelilpan 19,389
Juárez Hidalgo 3,108 Xochiatipan 19,752
Pacula 5,139 Atlapexco 19,902
Nicolás Flores 7,031 Acatlán 20,077
Xochicoatlán 7,706 Metztitlán 20,111
Mineral del Chico 9,028 Alfajayucan 20,332
Agua Blanca de Iturbide 9,116 Huautla 21,244
San Agustín Metzquititlán 9,437 Progreso de Obregón 23,451
Lolotla 9,461 Chapulhuacán 23,961
Omitlán de Juárez 9,636 Yahualica 24,173
La Misión 10,139 Huehuetla 25,989
Tlanalapa 10,342 Atotonilco el Grande 27,433
Tlahuiltepa 10,376 Tlaxcoapan 28,490
Tepetitlán 10,932 Atitalaquia 29,683
Molango de Escamilla 11,587 Tepehuacán de Guerrero 30,750
Tetepango 11,624 Zacualtipán de Ángeles 34,720
Metepec 11,801 San Salvador 35,547
Jaltocán 11,818 Francisco I. Madero 35,872
Almoloya 12,410 San Agustín Tlaxiaca 36,079
Villa de Tezontepec 12,413 Santiago Tulantepec de Lugo Guerrero 37,292
Jacala de Ledezma 13,399 Tecozautla 37,674
Chapantongo 13,789 Atotonilco de Tula 38,564
Huazalingo 13,986 San Felipe Orizatlán 38,952
Mineral del Monte 14,640 Tlanchinol 39,772
Epazoyucan 14,693 Zimapán 40,201
Emiliano Zapata 14,825 Acaxochitlán 40,583
Tianguistengo 15,122 Apan 44,576
Singuilucan 16,235 Zempoala 45,382
Tasquillo 16,403 Huichapan 45,959
Tolcayuca 16,733 Mixquiahuala de Juárez 46,224
Nopala de Villagrán 16,896 Tezontepec de Aldama 53,009
Santiago de Anaya 17,032 Actopan 54,299
Calnali 17,163 Tepeapulco 54,373
Pisaflores 17,379 Cuautepec de Hinojosa 58,301
Huasca de Ocampo 17,728 Tepeji del Río de Ocampo 87,442
Chilcuautla 18,169 Ixmiquilpan 93,502
Ajacuba 18,320 Tula de Allende 109,093
Cardonal 18,347 Tizayuca 119,442
Zapotlán de Juárez 18,748 Huejutla de Reyes 129,919
Tenango de Doria 18,766 Mineral de la Reforma 150,176
El Arenal 18,807 Tulancingo de Bravo 161,069
San Bartolo Tutotepec 18,986 Pachuca de Soto 277,375
Figura 1.1 Base de datos ordenada y clasificada por municipios. Fuente obtenida de: https://www.inegi.org.mx/
1. En base a nuestra base de datos describe los siguientes elementos:
1.1 - TAMAÑO DE MUESTRA
Antes que nada, analicemos nuestra base de datos (véase figura 1.1) e identifiquemos a qué tipo de población
pertenece nuestra base de datos, todo esto para determinar el tamaño de nuestra muestra.
Existen dos tipos de población:
Población finita: Está formada por un número limitado de elementos.
Población infinita: Está formada por un número extremadamente grande de componentes, donde no se pueden
contabilizar todos sus elementos, ya que existen un número ilimitados de estos.

Figura 3.1 Fórmulas para determinar un tamaño de muestra con variables cualitativas.
Fuente obtenida de: https://www.youtube.com/watch?v=1xZAa4jbMqc

En donde: NC: Nivel de confianza (Tabla Z)

 Si una base de datos cuantitativa supera los 100,000 individuos, familias o elementos se debe de usar la
fórmula población infinita, pero si es menor a los 100,000 utilizaremos la fórmula de población finita.
Ahora ya que sabemos como calcular y determinar nuestro tamaño de muestra y a la vez nuestro muestreo
aleatorio simple.

Empecemos identificando la fórmula que nos ayudar a calcular el tamaño de la muestra que deseamos y nos
plantearemos el siguiente problema para calcular nuestra muestra.

En el estado de Hidalgo, en el 2015 había un total de 2,858 millones de habitantes.

EJERCICIO:
Vamos a calcular el tamaño de muestra para una población de 427,857 niños y niñas de 6 a 14 años,
consumidores de comida chatarra “x”, dónde el investigador asigna un nivel de confianza del 98% y un
margen de error del 2%. Dónde se desconoce la probabilidad “P” del evento. Ver figura 4.1

AÑOS Número de niñas Número de niños Población total de niños

07 años 27,561 26,810 54,371


08 años 27,887 27,147 55,684
09 años 27,524 27,252 54,776
10 años 28,535 27,149 55,684
11 años 25,232 24,550 49,782
12 años 26,417 25,687 52,104
13 años 25,810 25,368 51,178
14 años 27,310 26,968 54,278
Figura 4.1 Tabla ¿Cuántos son como tú?
Fuente obtenida de: http://cuentame.inegi.org.mx/monografias/informacion/hgo/poblacion/comotu.aspx?tema=me&e=13

n=?
N=427,857
Z=2.330
e=2.00% - 0.02
p=50.00% - 0.5
q=50.00% - 0.5
n = (427,857*2,33*2,33) * (0.5*0.5)
(0.02*0.02) * (427,857-1) + (2,33*2,33) * (0.5*0.5)
n = 3,366.37 Dónde redondeamos el resultado.
“n” = 3,366
Así que el tamaño de nuestra muestra, la cual obtuvimos con nuestro muestreo aleatorio simple es de 3,366.

2.2 – CALCULA LAS MEDIDAS DE TENDENCIA CENTRAL (MEDIA, MODA Y MEDIANA) PARA DATOS NO
AGRUPADOS.
Media aritmética (promedio): Valor obtenido al sumar todos los datos y dividir el resultado entre el número
total de datos y se representa por el símbolo: Χ y se obtiene con la siguiente formula.
Χ = Media aritmética
∑ = Sumatoria
Χi = Cada valor en la base de datos
N = Número total de el resultado de la muestra.

54,371 55,684 54,776 55,684 49,782 52,104 51,178 54,278

Χ = ∑Χi Χ = 54,371+55,684+54,776+55,684+49,782+52,104+51,178+54,278
N 8

Χ = 427,857 = Χ = 53,482.125 Χ = 53,482


8
Mediana: Es el lugar que ocupa el lugar central de todos los datos (cuando están ordenados). Y se representa
con el símbolo: Me y se obtiene depende si son datos pares y datos impares.
54,371 55,684 54,776 55,684 49,782 52,104 51,178 54,278

Primero como son datos no agrupados, sería ordenarlos de menor a mayor.


49,782 51,178 52,104 54,278 54,371 54,776 55,684 55,684

Como el total de datos son números pares, entonces procedemos a sacar el promedio entre los dos números
centrales.
54,278 54,371

Χ = ∑Χi = Χ = 54,278+54,371 Χ = 54,324 Me = 54,324


N 2
Moda: El o los valores que más se repiten y se representa con el símbolo: Mo
49,782 51,178 52,104 54,278 54,371 54,776 55,684 55,684
Mo = 55,684
2. MEDIDAS DE DISPERSIÓN

A diferencia de las medidas de tendencia central que miden acumulaciones mediante un solo punto, las medidas
de dispersión miden el grado de separación o alejamiento que tiene una variable estadística en torno a una
medida de posición o tendencia central. Dicho grado de separación indica lo representativa que es la medida de
posición con respecto al conjunto total de datos. A mayor dispersión menor representatividad de la medida de
posición y viceversa.
Las medidas de dispersión más comunes son: el recorrido, la varianza y la desviación estándar.

2.1 Varianza
La varianza mide la mayor o menor dispersión de los valores de la variable respecto a la media aritmética.
Siempre es mayor o igual que cero y menor que infinito. Se define como la media de los cuadrados de las
diferencias del valor de los datos menos la media aritmética de éstos. (UnADM, Estadística Básica, 2020)

Las fórmulas de la varianza para datos no agrupados son:

Para obtener la varianza se realiza la sumatoria de cada valor menos la media y se eleva al cuadrado y el
resultado se divide ya sea entre el valor poblacional (N), o bien el muestral menos 1, que corresponde a: n-1.

Ahora procederemos a calcular la varianza de nuestros datos, para empezar vamos a identificar si estamos
trabajando con una muestra o una población.
R. Como seguimos trabajando con el ejercicio de la actividad pasada, deducimos que es una muestra de la
población.
También identificaremos si estamos trabajando con una base de datos agrupados o no agrupados.
R. En una base de datos con datos no agrupados.

54,371 55,684 54,776 55,684 49,782 52,104 51,178 54,278

S2 = ∑in = (Xi – Χ) 2 S2 = (54,371+55,684+54,776+55,684+49,782+52,104+51,178+54,278 – 53,482) 2


n–1 3,366 - 1

S2 = 140, 156, 640,625 S2 = 41, 651,304.79197623


3,365

2.2 Desviación típica o estándar


La desviación típica muestra qué tan alejado está un dato del valor de la media aritmética, es decir, la diferencia
que hay entre un dato y la media aritmética. Se denota como S o , según se calcule en una muestra o en toda la
población, respectivamente. Se define como la raíz cuadrada positiva de la varianza. Las fórmulas de la
desviación típica o estándar para datos no agrupados son: (UnADM, Estadística Básica, 2020)
Es decir que al valor de la varianza, ya sea poblacional o muestral, se le aplica la raíz cuadrada y se obtiene la
desviación típica o estándar.
Retomemos la actividad nuevamente, como ya sabemos estamos trabajando con una muestra de la población y
datos no agrupados.

S = √S2 = √∑in = (Xi – Χ) 2 S = √ 41, 651,304.79197623


n–1

S = 6,453.78220828502

2.3 Rango
Una forma rápida de conocer la dispersión de los datos determinando el rango o recorrido de la variable
aleatoria.
(UnADM, Estadística Básica, 2020)

R=X –Xn 1

R = rango
X = el menor valor
1

X = el mayor valor
n

54,371 55,684 54,776 55,684 49,782 52,104 51,178 54,278

R=X –Xn 1 R = 55,682 – 49,782 R = 5,900


R = 5,900
2.4 Desviación media
Es la suma de los valores absolutos de todas las desviaciones divididas entre el número de datos u observaciones.
Su fórmula matemática es: (UnADM, Estadística Básica, 2020)

DM = ∑in = Xi DM = 427,857 = 53,482


n 8
DM = ∑in = (Xi – Χ) DM = 14,765 = 1,845.625
N 8
DM = 1,845.625

54,371 55,684 54,776 55,684 49,782 52,104 51,178 54,278

n Xi habitantes Xi - X Xi - X
1 49,782 49,782 – 53,482 = -3,700 3,700
2 51,178 51,178 – 53,482 = -2,304 2,304
3 52,104 52,104 – 53,482 = -1,378 1,378
4 54,278 54,278 – 53,482 = 796 796
5 54,371 54,371 – 53,482 = 889 889
6 54,776 54,776 – 53,482 = 1,294 1,294
7 55,684 55,684 – 53,482 = 2,202 2,202
8 55,684 55,684 – 53,482 =2,202 2,202
TOTAL 427,857 ∑ = 14,765
Fuente obtenida de: https://ceit.unadmexico.mx/contenidos/DCEIT/BLOQUE1/TC/EBA/U3/descargables/
EBA_U3_Muestreo_medidas_tendencia_central_disp.pdf
RECAPITULACIÓN:

Fuente obtenida de: https://ceit.unadmexico.mx/contenidos/DCEIT/BLOQUE1/TC/EBA/U3/descargables/


EBA_U3_Muestreo_medidas_tendencia_central_disp.pdf

Es así como hemos venido trabajando en esta unidad.


CONCLUSION

Al terminar esta unidad hemos podido tener una visión general de la importancia que tienen las medidas de
tendencia central y de dispersión para comprender el comportamiento de los datos y poder ubicar qué tan
cercano o alejado se encuentra un valor cualquiera de las medidas de tendencia central, así como la variabilidad
y dispersión de los datos en conjunto de una distribución, de manera que puedas interpretar mejor tu problema
prototípico. (UnADM, 2020)

REFERENCIAS

UnADM, U. A. (2020). Estadística Básica. Obtenido de Unidad 3. Muestreo, medidas de tendencia central y de dispesión:
https://ceit.unadmexico.mx/contenidos/DCEIT/BLOQUE1/TC/EBA/U3/descargables/
EBA_U3_Muestreo_medidas_tendencia_central_disp.pdf

UnADM, U. A. (2020). PLANEACIÓN DIDÁCTICA. Obtenido de file:///C:/Users/vfragoso/Downloads/Planeaci%C3%B3n.pdf

Imagen obtenida de: https://www.inegi.org.mx/


Imagen obtenida de: http://cuentame.inegi.org.mx/monografias/informacion/hgo/poblacion/comotu.aspx?
tema=me&e=13
Imagen obtenida de: https://ceit.unadmexico.mx/contenidos/DCEIT/BLOQUE1/TC/EBA/U3/descargables/
EBA_U3_Muestreo_medidas_tendencia_central_disp.pdf

You might also like