Download as docx, pdf, or txt
Download as docx, pdf, or txt
You are on page 1of 44

1

Tema:

HERRAMIENTAS Y MÉTODOS QUE SE UTILIZAN PARA EL ANÁLISIS DE

DATOS CON CRITERIOS ESTADÍSTICOS. (ETAPA 1)

Integrantes:

Cristhian Javier Cevallos Rosado


Keyla Elizabeth Arévalo Vernaza
Sully Elizabeth Martínez Aguilar
Juan Carlos Lynch Gonzales
Danny Alfredo Ronquillo León

TECNOLOGICO UNIVERSITARIO ARGOS

CARRERA:

Seguridad laboral y prevención de riesgo laboral

MATERIA:

Estadística I

PERIODO LECTIVO:

2022- 2023
2

Índice
Tema:..............................................................................................................................1

Introducción....................................................................................................................5

Objetivo general..........................................................................................................6

Desarrollo...................................................................................................................7

Marco Teórico................................................................................................................8

Población:...................................................................................................................8

Muestra:....................................................................................................................8

Medidas de centralización..........................................................................................8

Análisis de los resultados.............................................................................................10

Conclusión....................................................................................................................18

Bibliografía...................................................................................................................19

Anexos..........................................................................................................................20
3

Índice de Tablas

Tabla 1. ¿cuál es su género?__________________________________________________________________10

Tabla 2. Rango de edad_____________________________________________________________________11

Tabla 3. Posee algún tipo de discapacidad______________________________________________________12

Tabla 4. ¿En qué sector de la ciudad labora?____________________________________________________13

Tabla 5. ¿A qué sector laboral pertenece?_______________________________________________________14

Tabla 6. Durante la pandemia ¿En qué modalidad trabajo?_________________________________________15

Tabla 7. Utilizaste algún implemento de bioseguridad para proteger tu salud?__________________________16

Tabla 8 .¿Qué tipo de seguridad utilizaste?______________________________________________________17


4

Índice de Ilustraciones

Ilustración 1. ¿Cuál es su género?_____________________________________________________________10

Ilustración 2. Rango de edad_________________________________________________________________11

Ilustración 3. ¿Posee algún tipo de discapacidad?________________________________________________12

Ilustración 4. ¿En qué sector de la ciudad labora?________________________________________________13

Ilustración .5 ¿A qué sector laboral pertenece?__________________________________________________14

Ilustración 6. ¿Durante la pandemia en que modalidad trabajo?_____________________________________15

Ilustración 7.¿Utilizaste algun implemento de bioseguridad para proteger tu salud?_____________________16

Ilustración 8.¿Qué tipo de seguridad utilizaste?__________________________________________________17


5

Introducción

Este trabajo se refiere a la disciplina de la estadística, que se puede definir como la

ciencia de recopilar información para facilitar el estudio de grandes cantidades de datos sobre

individuos, grupos de personas, conjuntos de hechos, etc. y derivar de ella, como resultado

del análisis de estos datos, significados precisos o predicciones sobre el futuro.

La estadística a través del tiempo ha tenido un papel fundamental en el desarrollo de

la sociedad, pues es ésta disciplina la que aporta herramientas a cualquier ciudadano para que

pueda describir e interpretar el mundo a su alrededor y de esta manera de solución a

problemas cotidianos.

La estadística incluye la recopilación, organización, compilación, presentación

y métodos científicos de datos para analizar datos y sacar conclusiones válidas y tomar

decisiones basadas en dicho análisis, así como hacer predicciones sobre la recopilación

de dichos datos de los cuales tomar muestras. El uso cuidadoso de las técnicas estadísticas

puede proporcionar información precisa a partir de los datos.

La estadística juega un papel central en el desarrollo de la ciencia y la tecnología,

debido a que proporciona herramientas metodológicas que permiten al estudiante describir e

interpretar el mundo que lo rodea, además del desarrollo del razonamiento estadístico, que va

más allá del conocimiento matemático y de la comprensión de los conceptos y

procedimientos (Batanero, 2011)

Se presenta el análisis de los resultados obtenidos, mediante la encuesta realizada a 60

personas, el cual incluye su respectivo gráfico.


6

Objetivo general.

Realizar una encuesta a un grupo de personas donde se deberá emplear las

herramientas y métodos para realizar el análisis de los datos obtenidos mediante los criterios

estadísticos estudiados.

Descripción. 

El objetivo específico del proyecto es que el estudiante conozca a detalle la

importancia de analizar las medidas de tendencia central y de dispersión de un grupo de datos

y calcular las diversas medidas de tendencia central. Finalmente, que pueda interpretar dichas

medidas calculadas.

En la etapa 1 deberás realizar el análisis de los datos de la encuesta mediante la

elaboración de los cuadros respectivos concernientes a cada una de las preguntas,

denominado Herramientas y Métodos que se utilizan para el análisis de datos con criterios

estadísticos.
7

Desarrollo

Analizamos datos de personas que viven en zonas rurales para poder sacar

conclusiones sobre su condición durante la pandemia, encuestando así cuál es su género, si

sufre algún tipo de discapacidad, sobre su situación laboral, modalidad de trabajo que realizo

en pandemia, implementos de bioseguridad que utilizo para protegerse.

Para empezar a definir nuestra población, el objetivo principal es sesgar que cada

persona encuestada nos pueda dar una información aparentemente fidedigna sobre cada

pregunta.
8

Marco Teórico

En este proyecto va a constar de diferentes términos estadísticos los cuales debemos

tener muy claro su definición.

Medidas de Tendencia Central y Dispersión

Las medidas de tendencia promedio más utilizadas son: media, mediana y moda. Las

medidas de dispersión, por otro lado, miden el grado en que se dispersan los valores de una

variable. En otras palabras, las medidas de dispersión tienen como objetivo evaluar cuánto

difieren los datos entre sí.

Población: El concepto de población en estadística va más allá de lo que comúnmente

se conoce como tal. Una población se precisa como un conjunto finito o infinito de personas

u objetos que presentan características comunes.

Se destacan algunas definiciones:

"Una población es un conjunto de todos los elementos que estamos estudiando, acerca

de los cuales intentamos sacar conclusiones" (Levin, 1996) .

"Una población es un conjunto de elementos que presentan una característica común".

(Cadenas, 1974).

Muestra: La muestra es una representación significativa de las características de

una población, que bajo, la asunción de un error (generalmente no superior al 5%) estudiamos

las características de un conjunto poblacional mucho menor que la población global.

"Se llama muestra a una parte de la población a estudiar qué sirve para

representarla" (Spiegel, 1991).


9

"Una muestra es una colección de algunos elementos de la población, pero no de

todos" (Levin, 1996).

Medidas de centralización

Nos dan los valores centrales de los datos obtenidos. Las más usuales son: la media, la

moda y la mediana.

• Media (x): Es el resultado de sumar el valor de la variable de todos los individuos y

dividir por el total de individuos.

• Moda (Mo): La moda es el valor más frecuente de la variable estadística. La moda,

como la media, representa un valor central de la distribución de datos y su determinación

visual la podemos obtener a partir de la tabla de frecuencias o de su gráfico, en el caso de ser

de columnas corresponde con la columna más alta.

• Mediana (Me): La mediana es el valor de la variable que divide la serie estadística

ordenada en dos partes iguales, dejando tantos valores por encima como por debajo y por

consiguiente la frecuencia a uno y a otro lado de la mediana también son iguales.

Medidas de dispersión: Rango y Desviación Media

Rango y Desviación media, las medidas de dispersión indican si los datos están más

o menos agrupados respecto de las medidas de centralización.

Rango o recorrido, es la diferencia entre el mayor y el menor valor de la variable,

indica la longitud del intervalo en el que se hallan todos los datos. Aunque el rango da una

información importante, resulta más interesante calcular cuánto se desvían en promedio los

datos de la media.

Desviación media, es la media de los valores absolutos de las diferencias entre la

media y los diferentes datos.


10

Se calcula como la media de los valores absolutos de las diferencias entre la media
aritmética y los diferentes datos.

Varianza y desviación estándar

La varianza y la desviación estándar son medidas de dispersión o

variabilidad, es decir, indican la dispersión o separación de un conjunto de datos.

Hay que tener en cuenta que las fórmulas de la varianza y la desviación estándar

son diferentes para una muestra que para una población (Matemovil, Varianza,

2022).

Probabilidad.

Los orígenes de la probabilidad se remontan a 1654. En ese año el matemático

francés Blas Pascal y el abogado Pierre Fermat inician, mediante correspondencia, una

comunicación referente a ciertos problemas de los juegos de cartas y de dados.

Esta correspondencia es considerada el punto de partida de la teoría de la

probabilidad. A partir de ese intercambio epistolar se publica en 1657 un tratado titulado “De


11

Ratiocinnis in ludo aleae”, escrito por un matemático holandés de nombre Christiaan

Huygens, que se basa en la correspondencia entre Fermat y Pascal.

Posteriormente, hay una serie de aportes por parte de diversos matemáticos para el

cálculo de probabilidades (editorial, 2022), distribución normal (Abraham Moivre),

distribución binomial (Nicolás Bernoulli) y teorema de probabilidad condicional (Thomas

Bayes), que fueron constituyendo con sus aportaciones las herramientas de esta nueva teoría

Sin embargo, no fue sino hasta el año 1812, con los trabajos de Laplace, cuando la teoría de

la probabilidad se considera una parte autónoma de las matemáticas que, al vincularse a la

estadística, ha logrado desarrollarse hasta convertirse en lo que conocemos el día de hoy.

El término probabilidad proviene de lo probable, o sea, de aquello que es más posible

que ocurra, y se entiende como el mayor o menor grado de posibilidad de que un evento

aleatorio ocurra, expresado en una cifra entre 1 (posibilidad total) y 0 (imposibilidad

absoluta), o bien en porcentajes entre el 100% o el 0%, respectivamente.

Tipos de probabilidad

Existen los siguientes tipos de probabilidad:

Frecuencia. Aquella que determina la cantidad de veces que un fenómeno puede

ocurrir, considerando un número determinado de oportunidades, a través de la

experimentación.

Matemática. Pertenece al ámbito de la aritmética, y aspira al cálculo en cifras de la

probabilidad de que determinados eventos aleatorios tengan lugar, a partir de la lógica formal

y no de su experimentación.

Binomial. Aquella en la que se estudia el éxito o fracaso de un evento, o cualquier

otro tipo de escenario probable que tenga dos posibles resultados únicamente.
12

Objetiva. Se denomina así a toda probabilidad en la que conocemos de antemano la

frecuencia de un evento, y simplemente se dan a conocer los casos probables de que ocurra

dicho evento.

Subjetiva. Contrapuesta a la matemática, se sustenta en ciertas eventualidades que

permiten inferir la probabilidad de un evento, aunque alejada de una probabilidad certera o

calculable. De allí su subjetividad.

Hipergeométrica. Aquella que se obtiene gracias a técnicas de muestreo, creando

grupos de eventos según su aparición.

Lógica. La que posee como rasgo característico que establece la posibilidad de

ocurrencia de un hecho a partir de las leyes de la lógica inductiva.

Condicionada. Aquella que se emplea para comprender la causalidad entre dos

hechos distintos, cuando puede determinarse la ocurrencia de uno tras la ocurrencia del otro.

Fórmula para calcular la probabilidad

El cálculo de las probabilidades se lleva a cabo según la fórmula siguiente:

Probabilidad = Casos favorables / casos posibles x 100 (para llevarlo a porcentaje)

Así, por ejemplo, podemos calcular la probabilidad de que una moneda salga cara en

un único lanzamiento, pensando que sólo puede salir una cara (1) de las dos que hay (2), esto

es, 1 / 2 x 100 = 50% de probabilidad.

En cambio, si decidimos calcular cuántas veces saldrá la misma cara en dos

lanzamientos seguidos, deberemos pensar que el caso favorable (cara y cara o sello y sello) es

uno entre cuatro posibilidades de resultado (cara y cara, cara y sello, sello y cara, sello y

sello). Por ende, 1 / 4 x 100 = 25% de probabilidad.


13

Reglas de la suma y multiplicación.

La regla de la suma, o regla de la suma, establece que la probabilidad de cualquier

evento es igual a la suma de las probabilidades individuales cuando los eventos son

mutuamente excluyentes, es decir, dos eventos no pueden ocurrir al mismo tiempo.

Si P(A⋂B) = 0 es decir que son mutuamente excluyentes entonces:

P(A⋃B) = P(A) +P(B)

P(A): probabilidad de que ocurra el evento A.

P(B): probabilidad de que ocurra el evento B.

P(A⋃B): probabilidad de que ocurra el evento A o el evento B.

Nota: El símbolo U se lee «o»

Teorema de Bayes.

El teorema de Bayes es utilizado para calcular la probabilidad de un suceso, teniendo

información de antemano sobre ese suceso.

Podemos calcular la probabilidad de un suceso A, sabiendo además que ese A cumple

cierta característica que condiciona su probabilidad. El teorema de Bayes entiende la

probabilidad de forma inversa al teorema de la probabilidad total. El teorema de la

probabilidad total hace inferencia sobre un suceso B, a partir de los resultados de los sucesos

A. Por su parte, Bayes calcula la probabilidad de A condicionado a B.

El teorema de Bayes ha sido muy cuestionado. Lo cual se ha debido, principalmente,

a su mala aplicación. Ya que, mientras se cumplan los supuestos de sucesos disjuntos y

exhaustivos, el teorema es totalmente válido.


14

Fórmula del teorema de Bayes

Para calcular la probabilidad tal como la definió Bayes en este tipo de sucesos,

necesitamos una fórmula. La fórmula se define matemáticamente como:

Donde B es el suceso sobre el que tenemos información previa y A(n) son los

distintos sucesos condicionados. En la parte del numerador tenemos la probabilidad

condicionada, y en la parte de abajo la probabilidad total. En cualquier caso, aunque la

fórmula parezca un poco abstracta, es muy sencilla. Para demostrarlo, utilizaremos un

ejemplo en el que en lugar de A (1), A (2) y A (3), utilizaremos directamente A, B y C.

Ejemplo del teorema de Bayes

Una empresa tiene una fábrica en Estados Unidos que dispone de tres máquinas A, B

y C, que producen envases para botellas de agua. Se sabe que la máquina A produce un 40%

de la cantidad total, la máquina B un 30%, y la máquina C un 30%. También se sabe que cada

máquina produce envases defectuosos. De tal manera que la máquina A produce un 2% de

envases defectuosos sobre el total de su producción, la máquina B un 3%, y la máquina C un

5%. Dicho esto, se plantean dos cuestiones:

P(A) = 0,40 P(D/A) = 0,02

P(B) = 0,30 P(D/B) = 0,03

P(C) = 0,30 P(D/C) = 0,05

Si un envase ha sido fabricado por la fábrica de esta empresa en Estados Unidos


15

¿Cuál es la probabilidad de que sea defectuoso?

Se calcula la probabilidad total. Ya que, a partir los diferentes sucesos, calculamos la

probabilidad de que sea defectuoso.

P(D) = [ P(A) x P(D/A)] + [ P(B) x P(D/B) ] + [ P(C) x P(D/C) ] = [ 0,4 x 0,02 ] +

[ 0,3 x 0,03 ] + [ 0,3 x 0,05 ] = 0,032

Expresado en porcentaje, diríamos que la probabilidad de que un envase fabricado por

la fábrica de esta empresa en Estados Unidos sea defectuoso es del 3,2%.

2. Siguiendo con la pregunta anterior, si se adquiere un envase y este es defectuoso

¿Cuáles es la probabilidad de que haya sido fabricado por la máquina A? ¿Y por la máquina

B? ¿Y por la máquina C?

Aquí se utiliza el teorema de Bayes. Tenemos información previa, es decir, sabemos


que el envase es defectuoso. Claro que, sabiendo que es defectuoso, queremos saber cuál es la
probabilidad de que se haya producido por una de las máquinas.

P(A/D) = [P(A) x P(D/A)] / P(D) = [0,40 x 0,02] / 0,032 = 0,25

P(B/D) = [P(B) x P(D/B)] / P(D) = [0,30 x 0,03] / 0,032 = 0,28

P(C/D) = [P(C) x P(D/C)] / P(D) = [0,30 x 0,05] / 0,032 = 0,47

Sabiendo que un envase es defectuoso, la probabilidad de que haya sido producido


por la máquina A es del 25%, de que haya sido producido por la máquina B es del 28% y de
que haya sido producido por la máquina C es del 47%. (J.F)

Principio de conteo.

El principio fundamental de conteo establece que el número de posibilidades en que


múltiples eventos pueden ocurrir se pueden determinar al multiplicar el número de resultados
posibles por cada evento.

Las técnicas de conteo nos permiten identificar y contar los resultados de los experimentos.

La regla de conteo para experimentos de pasos múltiples permite determinar el

número de resultados experimentales sin tener que enumerarlos.


16

De esta manera tenemos que “un experimento se describe como una sucesión de k pasos en

los que hay n1 resultados posibles en el primer paso, n2 resultados posibles en el segundo

paso y así en lo sucesivo. Entonces el número total de resultados experimentales es (n1) (n2).

(nk)(Anderson, Sweeney y Williams, 2008)”.

Ejemplo:

Se realiza el siguiente experimento de lanzar dos monedas. Los resultados experimentales se

determinarán en término de caras y cruces que observamos en las dos monedas.

Experimento 1: Lanzar la primera moneda

Experimento 2: Lanzar la segunda moneda

En el primer lanzamiento se tienen 2 resultados y en el segundo obtenemos otros 2

resultados, entonces tenemos cuatro resultados experimentales:

S = {(cara, cruz), (cara, cara), (cruz, cara), (cruz, cruz)}

Variables aleatorias

Una variable aleatoria es la función matemática de un experimento aleatorio.

A priori, la definición de variable aleatoria no reviste mucha complejidad. Se trata de

un concepto que se puede definir en una frase. Sin embargo, es más complejo de lo que las

apariencias puedan indicar.

Cómo podemos comprobar la frase se compone básicamente de dos conceptos:

función matemática y experimento aleatorio. De manera que por aquí es por dónde debemos

empezar. Es decir, por entender primero qué es una función matemática y, más tarde, por

definir qué entendemos por experimento aleatorio.


17

Función matemática: Dicho de manera sencilla, es una ecuación que asigna valores a

una variable (variable dependiente) en función de otras variables (variables independientes).

Experimento aleatorio: Es un fenómeno de la vida real cuyos resultados se deben

completamente al azar. Es decir, bajo las mismas condiciones iniciales arroja resultados

diferentes.

En otras palabras, es una ecuación que describe o intenta describir los resultados (con

un número) de un evento cuyos resultados se deben al azar.

Variables aleatorias discretas y continuas

Existen dos tipos de variables aleatorias dependiendo del espacio muestral. Por

ejemplo, si una variable aleatoria asume un número finito o sucesión infinita de valores tales

como 0,1,2... Se le llama variable aleatoria discreta, pero si la variable aleatoria toma

cualquier valor numérico dentro de un intervalo colección de intervalos se le conoce con el

nombre de variable aleatoria continua.

Toda distribución de probabilidad es generada por una variable aleatoria 𝑥, la que

puede ser de dos tipos:1. Variable aleatoria discreta (x).Se le denomina variable porque puede

tomar diferentes valores, aleatoria, porque el valor tomado es totalmente al azar y discreta

porque solo puede tomar valores enteros y un número finito de ellos. No son variables

medibles, sino que son de tipo atributo; cuando se inspecciona un producto este puede ser

defectuoso o no, blanco o negro. cumple con las especificaciones o NO cumple, etc.

Variable aleatoria continua (x). Se le denomina variable continua porque puede

tomar tanto valores enteros como fracciones y un número infinito de ellos, esta variable nos

permite medir o evaluarla.


18

Distribuciones de probabilidad discreta y continua

Una distribución de frecuencia es una lista de las frecuencias observadas de todos los

resultados experimentales que realmente ocurrieron durante el experimento, mientras que una

distribución de probabilidad es una lista de las probabilidades de todos los resultados posibles

que podrían obtenerse al realizar el experimento.

La distribución de probabilidad de una variable aleatoria describe cómo se distribuyen

las probabilidades entre los valores de la variable aleatoria. La distribución de probabilidad

de una variable aleatoria discreta x se define mediante una función de probabilidad

denominada f(x). Una función de probabilidad da la probabilidad de cada valor de una

variable aleatoria (Anderson, Sweeney y Williams, 2008)

Las condiciones requeridas para una función de probabilidad de discreta son:

f (x) ≥ 0

Σ f(x) = 1

La función de probabilidad uniforme discreta:

f(x) = 1/n

Distribución de probabilidad normal

La distribución normal es un modelo teórico capaz de aproximar satisfactoriamente el

valor de una variable aleatoria a una situación ideal. 

En otras palabras, la distribución normal adapta una variable aleatoria a una función

que depende de la media y la desviación típica. Es decir, la función y la variable aleatoria

tendrán la misma representación pero con ligeras diferencias.


19

Una variable aleatoria continua puede tomar cualquier número real. Por ejemplo, las

rentabilidades de las acciones, los resultados de un examen, el coeficiente de inteligencia IQ

y los errores estándar son variables aleatorias continuas.

Una variable aleatoria discreta toma valores naturales. Por ejemplo, el número de

estudiantes en una universidad.

La distribución normal es la base de otras distribuciones como la distribución t de

Student, distribución ji-cuadrada, distribución F de Fisher y otras distribuciones.

Fórmula de la distribución normal

Dada una variable aleatoria X, decimos que la frecuencia de sus observaciones puede

aproximarse satisfactoriamente a una distribución normal tal que: 

Variable aleatoria X aproximada a una distribución normal.

Donde los parámetros de la distribución son la media o valor central y la desviación

típica: 

Parámetros de una distribución normal.

En otras palabras, estamos diciendo que la frecuencia de una variable aleatoria X

puede representarse mediante una distribución normal. 


20

Representación

Función de densidad de probabilidad de una variable aleatoria que sigue una

distribución normal.

Función de densidad de una distribución normal.

Propiedades

Es una distribución simétrica. El valor de la media, la mediana y la moda coinciden.

Matemáticamente, 

Media = Mediana = Moda

Distribución unimodal. Los valores que son más frecuentes o que tienen más

probabilidad de aparecer están alrededor de la media. En otras palabras, cuando nos alejamos

de la media, la probabilidad de aparición de los valores y su frecuencia descienden. 


21

¿Qué necesitamos para representar una distribución normal?

Una variable aleatoria. 

Calcular la media. 

Calcular la desviación típica. 

Decidir la función que queremos representar: función de densidad de probabilidad o

función de distribución. 

Ejemplo teórico

Suponemos que queremos saber si los resultados de un examen pueden aproximarse

satisfactoriamente a una distribución normal. 

Sabemos que en este examen participan 476 estudiantes y que los resultados podrán

oscilar entre 0 y 10. Calculamos la media y la desviación típica a partir de las observaciones

(resultados del examen).

Entonces, definimos la variable aleatoria X como los resultados del examen que

depende de cada resultado individual. Matemáticamente, 

La

variable aleatoria X representa la variable resultados del examen y puede aproximarse a una

distribución normal de media 4,8 y desviación típica de 3,09.

El resultado de cada estudiante se anota en una tabla. De esta forma, obtendremos una

visión global de los resultados y de su frecuencia.


22

Resultados Frecuencia

0 20

1 31

2 44

3 56

4 64

5 66

6 62

7 51

8 39

9 26

10 16

TOTAL 475

Una vez hecha la tabla, representamos los resultados del examen y las frecuencias. Si

el gráfico se parece a la imagen anterior y cumple con las propiedades, entonces, la variable

resultados del examen puede aproximarse satisfactoriamente a una distribución normal de

media 4,86 y desviación típica de 2,56.


23

Histograma de frecuencias sobre la variable resultados del examen.

¿Los resultados del examen pueden aproximarse a una distribución normal?

Razones para considerar que la variable resultados del examen sigue una distribución

normal: 

Distribución simétrica. Es decir, existe el mismo número de observaciones tanto a la

derecha como a la izquierda del valor central. También, que la media, la mediana y la moda

tienen el mismo valor. 

Media = Mediana = Moda = 5

Las observaciones con más frecuencia o probabilidad están alrededor del valor

central. En otras palabras, las observaciones con menos frecuencia o probabilidad se

encuentran lejos del valor central. 


24

La variable resultados del examen sigue una distribución normal.

La variable resultados del examen sigue una distribución normal.

La distribución normal describe la variable aleatoria mediante una aproximación que

produce errores estándar (las barras encima de cada columna). Estos errores son la diferencia

entre las observaciones reales (resultados) y la función de densidad (distribución normal). 


25

  Distribución de probabilidad binomial, de poisson, normal, exponencial

La distribución normal De entre todas las distribuciones continuas tiene especial

relevancia la distribución Normal o de Gauss. Aparece frecuentemente en las situaciones más

variadas.

Las variables que presentan una distribución Normal tienen características comunes

tales como la acumulación de valores en torno al valor de la media, la simetría en la

distribución de los valores y escasos valores alejados de la media, por ejemplo:

- Caracteres morfológicos de individuos: altura, peso, número de pie, tamaño del

palmo, etc.

- Características de la mayoría de los productos de consumo: duración de las

bombillas, resistencia a la rotura de muebles o de piezas, duración de los electrodomésticos,

etc.

- Calificaciones obtenidas en cursos, asignaturas y exámenes. Se dice que una variable

aleatoria continua sigue una distribución normal de media  y desviación típica  , y se

escribe X N   ,  , cuando tiene la función de densidad: 2 2 1 2 1 ( )            


26

   x f x e La gráfica de esta función de densidad tiene forma campaniforme, y se

denomina “campana de Gauss”.

Las Propiedades de la función f(x) se aprecian en su gráfica y son: - f(x) tiene por

dominio (,). - f(x) es continua en su dominio. - f(x) es simétrica respecto a la recta x=μ.

- Ffx) tiene un máximo absoluto en) 2 1 (,    - f(x) tiene dos puntos de inflexión en x=

μ+σ y x=μ-σ. - f(x) es siempre positiva y asintótica con respecto al eje OX. - La gráfica de la

función de densidad f(x) se llama campana de Gauss.

Para el cálculo de probabilidades usamos la función de distribución: F X P X x f t dt e

dt x t x                 2. 2 1 2 1 () () ()     . Para x=a este valor

representa la probabilidad de que la v.a.X tome valores menores o iguales que a y

gráficamente representa el área encerrada bajo la curva, el eje OX y la recta x=a. Puede

observarse la dificultad de la integral, es por ello y dado lo habitual que es el uso de esta

distribución, que se utiliza una tabla ya confeccionada para el cálculo de probabilidades. Pero

como bien estarás pensando es imposible realizar una tabla para cada valor de μ y de σ que

pueden tomar los parámetros en la distribución.

Las curvas de las diferentes funciones de densidad son en realidad la misma curva

variando su máximo y su curvatura en función de μ y σ, por esto el área encerrada bajo la

curva es siempre la misma (como función de densidad que es vale 1) aunque repartida de

forma diferente. Los anteriores argumentos justifican el uso de la N (0,1) como distribución

estándar, para la cual existe la tabla de valores de la función de distribución. A partir de ella y

mediante un cambio de variable, que denominamos tipificación podemos calcular las

probabilidades para cualquier distribución N (μ, σ).


27

Distribución Binomial. Se tiene un número fijo de pruebas n. Con las siguientes

características:  Cada prueba tiene sólo dos posibles resultados: genéricamente los llamamos

éxito y fracaso. Los denotamos con 1 (éxito) y 0 (fracaso).

 El resultado de cada prueba es independiente del resultado de las demás pruebas.

 La probabilidad de éxito no cambia de una prueba a otra.

 Nos interesa sólo el número total de éxitos X y nó el orden en que hayan ocurrido.

Cuando se cumplen las condiciones anteriores X tiene la distribución binomial con

parámetros n y p, donde n es el número de intentos y p la probabilidad de obtener un éxito.

Los valores posibles son desde cero hasta ene: {0, 1, 2..., n}. La función de probabilidad es:

f(k) = P(X=k) = nCk pkq(n-k), para k en {0,1, 2..., n} donde me he visto obligado por la

tipografía, a usar el símbolo poco usual nCk para denotar las combinaciones de k objetos

tomados de un total de n: nCk = [n!] / [k! (n-k)!] además, la letra q representa la probabilidad

de fracaso q = 1-p. La media de la binomial es: E(X) = np y la varianza: var(X) = npq.

Distribución Poisson. Este modelo se llama así para honrar la memoria de otro gran

probabilista y matemático. La v. a. de Poisson se refiere a sucesos en un intervalo de tiempo o

en un área específica. El intervalo de tiempo puede ser de cualquier duración, un minuto, una

hora, un día, un año. Algunos ejemplos de situaciones modeladas con el modelo de Poisson

son: el número de fallas de una máquina en una semana, el número juegos de algún deporte

pospuestos por lluvia en una temporada. Cuando se trata de superficies, los ejemplos son: el

número de ratas en un terreno, el número de errores de mecanografía por página, el número

de defectos por centímetro cuadrado. Para que una v. a. sea de Poisson, se requiere que se

satisfagan 3 hipótesis (que suelen llamarse también postulados del proceso de Poisson).

 La probabilidad está concentrada cerca de cero. Se puede ver, usando la tabla, que la

probabilidad de un intervalo cercano a cero es mayor que la de un intervalo del mismo ancho
28

pero alejado de cero. En el salón hacemos varios ejercicios de cálculo de probabilidades que

nos convencen de este hecho.

 La probabilidad está simétricamente distribuida alrededor del cero. Haciendo

cuentas con la misma tabla se ve que la F(a) + F(-a) = 1, para cualquier valor de a. Esto nos

lleva a concluir la simetría de la distribución.

 Para algunos cálculos de probabilidad de una normal es conveniente considerar el

eje real partido en cuatro pedazos, 1. antes de -a, 2. entre -a y 0, 3. entre 0 y a, 4. después de

a. Las probabilidades de (1) y (4) son iguales; las de (2) y (4) son iguales; las de (1) y (2)

sumadas dan 0.5; las de (3) y (4) suman 0.5. Use la tabla para calcular: P(Z < 1.45), P(Z > -

0.92), P(-0.53 < Z < 1.23). En la tarea tiene Ud. muchos ejercicios más de cálculo de

diferentes probabilidades en el modelo normal. Esta variable aleatoria, debido a la forma de

la densidad, tiene un valor central (el cero) que ``atrae'' los valores. La unidad de medida de

esta variable es el uno. Usos de la normal. La normal no estándar En los casos en que este

modelo se usa, generalmente:

 el valor central o promedio vale mu (distinto de cero)

 la unidad de medida o desviación estándar es sigma (distinta de uno). Para calcular

en este caso no estándar, es preciso hacer una transformación que se llama estandarización.

Esta estandarización es una codificación de los valores. La fórmula para estandarizar es: Z =

(X - mu) / sigma.

Distribuciones Muéstrales E Intervalos De Confianza

Muestreo

Se trata del proceso de seleccionar un conjunto de individuos de una población

específica con el fin de estudiarlos y caracterizar el total de la población. (Nieto, 2019)


29

Ventajas Del Muestreo

 Resume considerablemente el tiempo y costos de los estudios que se realizan

además de reducir los recursos que se emplean.

 La operación de los datos resulta más simple.

Desventajas Del Muestreo

 Introducimos error (controlado) en el resultado, debido a la propia naturaleza

del muestreo y a la necesidad de generalizar resultados.

 Tenemos el riesgo de introducir sesgos debido a una mala selección de la

muestra.

Muestreo Probabilístico

Se hablará de muestro probabilístico siempre que se cumplan dos condiciones:

 Los elementos de la población deben tener una probabilidad mayor de cero

para ser seleccionados en la muestra.

 Se tiene conocimiento preciso de la probabilidad de cada elemento.

Muestreo Aleatorio Simple

Se trata de la técnica de muestreo en la que todos los elementos que forman el

universo y que se encuentran detallados en el marco muestral, tienen la misma probabilidad

de ser elegidos para la muestra.


30

Ventajas Del Muestreo Aleatorio Simple

 Es rápida y fiable ya que actualmente existen software que minimizan el

trabajo al momento de seleccionar a los individuos por lo que es más confiable.

 El error debido al azar puede calcularse de forma precisa

Desventaja Del Muestreo Aleatorio Simple

 Dificultad de llevarlo a la práctica en investigaciones reales. al ser una técnica

probabilística, se necesita un marco muestral con todos los individuos y que todos sean

seleccionables para la muestra.

Muestreo Aleatorio Estratificado

Esta técnica, perteneciente a la familia de muestreos probabilísticos, consiste en

dividir toda la población objeto de estudio en diferentes subgrupos o estratos disjuntos, de

manera que un individuo sólo puede pertenecer a un estrato. También tenemos otros tipos de

muestreo estratificado

 Muestreo estratificado proporcionado.

 Muestreo estratificado uniforme.

 Muestreo estratificado óptimo (respecto a la desviación estándar)

Muestreo Sistemático

 Se trata de una técnica la cual consiste en seleccionar a determinado sujeto de

forma aleatoria entre la población para posteriormente seleccionar para la muestra a cada

enésimo individuo disponible en el marco muestral.


31

Ventajas Del Muestreo Sistemático

 Representa muy bien a la población, de manera rápida y simple ya que no hay

necesidad de generar muchos números aleatorios, así como sujetos en nuestra muestra.

 Nos garantiza una selección equitativa de la población a estudiar.

Distribuciones Muéstrales

El estudio de las características específicas de las poblaciones se realiza a través de

diversas muestras que se pueden extraer de ellas. El muestreo se puede realizar con o sin

reemplazo, y la población inicial puede ser infinita o finita. Una población finita muestreada

con permutación teóricamente puede considerarse infinita. Además, a efectos prácticos, las

poblaciones muy grandes pueden considerarse infinitas. A lo largo de nuestra investigación,

buscamos limitarnos a una población inicial infinita o muestreo por permutación.

Distribución Muestral De La Media

Cada muestra de tamaño n que podemos extraer de una población proporciona una

media. Si consideramos cada una de estas medias como valores de una variable aleatoria

podemos estudiar su distribución que llamaremos distribución muestral de medias. (Sac,

2016)

 Si tenemos una población normal N (m, s) y extraemos de ella muestras de

tamaño n, la distribución muestral de medias sigue también una distribución normal


32

 Si la población no sigue una distribución normal, pero n>30, aplicando el

llamado Teorema central del límite la distribución muestral de medias se aproxima también a

la normal anterior.

Intervalos De Confianza Para La Estimación De La Media Y La Proporción

Es un rango que se encuentra delimitado por dos valores, inferior y superior, dentro

del cual, con un cierto de grado de probabilidad establecido (arbitraria, pero generalmente de

95 %), se espera que se encuentre el parámetro o valor poblacional de la variable o indicador

estudiado en la muestra (estimador puntual).Es un rango que se encuentra delimitado por dos

valores, inferior y superior, dentro del cual, con un cierto de grado de probabilidad

establecido (arbitraria, pero generalmente de 95 %), se espera que se encuentre el parámetro o

valor poblacional de la variable o indicador estudiado en la muestra (estimador puntual).


33

Análisis de los resultados

Tabla 1. ¿Cuál es su género?

Categoría ¿Cuál es su género?


Femenino 28
Masculino 32
Total General 60

Ilustración 1. ¿Cuál es su género?

Masculino
42%

Femenino
58%

Femenino Masculino

Según la encuesta realizada a 60 personas, nos podemos dar cuenta que 32 son

mujeres el cual representa el 58% de los encuestados, y 28 personas son de género masculino

el cual representa el 42%.


34

Tabla 2. Rango de edad

Categoría Rango de edad


18 a 25 años 3
26 a 35 años 24
36 a 45 años 27
46 a 65 años 6
Total 60

Ilustración 2. Rango de edad

5%
10%

40%

45%

18 a 25 años 26 a 35 años 36 a 45 años 46 a 65 años

De las 60 personas encuestadas, se encuentra que 27 personas están entre la edad de

36 a 45 años el cual representa el 45% distribuidos entre sexo masculino y femenino,

seguidos por 24 personas entre masculino y femenino el cual representa el 40% que

representa la edad entre 26 a 35 años, 6 personas entre 46 a 65 años que representa el 10% y

con apenas 3 personas están representadas con un 5% entre la edad de 18 a 25 años.


35

Tabla 3. Posee algún tipo de discapacidad

Categoría ¿Posee algún tipo de


discapacidad?
No 57
Si 3
Total general 60

Ilustración 3. ¿Posee algún tipo de discapacidad?

Si
5%

No
95%

Si No

El grafico representa de las 60 personas encuestadas, 57 personas entre sexo

masculino y femenino, no poseen algún tipo de discapacidad, el cual representa el 95%,

mientras que 3 personas si posee algún tipo de discapacidad, el cual lo representamos con el

5% de los encuestados.
36

Tabla 4. ¿En qué sector de la ciudad labora?

Categoría ¿En qué sector de la ciudad


Labora?
Centro 11
Norte 47
Sur 2
Total general 60
Ilustración 4. ¿En qué sector de la ciudad labora?

50
45 47
40
35
30
25
20
15
10
11
5
0 2
Centro Sur Norte

Centro Sur Norte

Con un total de 60 personas encuestadas, 47 personas respondieron que laboran al

norte de la ciudad, el cual representa un 78.3%, seguido de 11 personas que laboran en el

centro representa un 18,3%, y con un 3,4%, 2 personas laboran al sur de la ciudad.


37

Tabla 5. ¿A qué sector laboral pertenece?

Categoría ¿A qué sector laboral


Categoría Durante la pandemia, ¿En
pertenece?
qué modalidad trabajó?
Independiente 11
No trabajo 13
Privado 42
Publico 7
Total Presencial 60 24

Desde Casa 23
Ilustración .5 ¿A qué sector laboral
pertenece?
Total general 60

18% 13%

Publico
Privado
Independiente

68%

En esta pregunta nos podemos dar cuenta que el 68% de los encuestados laborar en el

sector privado, seguido el 18% que laboran de manera independiente y con el 14% labora en

el sector público.

Tabla 6. Durante la pandemia ¿En qué modalidad trabajo?


38

Ilustración 6. ¿Durante la pandemia en que modalidad trabajo?

No Trabajo 13

Desde Casa 23

Presencial 24

0 5 10 15 20 25 30

Presencial Desde Casa No trabajo

El grafico representa que de las 60 personas encuestadas, 24 personas representadas

por un 40% laboro presencialmente a pesar de las restricciones que dio el gobierno, seguido

de 23 personas que corresponde un 38,3% laboro desde su casa y 13 personas el cual esta

representada con un 21,7% no laboro durante la pandemia.


39

Tabla 7. Utilizaste algún implemento de bioseguridad para proteger tu salud?

Categoría Utilizaste algún implemento de


bioseguridad para proteger tu salud?
Si 55
No 5
Total 60

Ilustración 7.¿Utilizaste algun implemento de bioseguridad para proteger tu salud?

8%

Si
No

92%

En esta pregunta podemos analizar que 55 perosnas el cual representa el 92% de las

personas encuestadas si utilizaron algun tipo de implemento de bioseguridad, mientras que 5

personas el cual representada por el 8% no utilizo ningun tipo de implemento de

bioseguridad.
40

Tabla 8 .¿Qué tipo de seguridad utilizaste?

Categoría Bioseguridad
Lavado de manos 47
Mascarilla 55
Alcohol 50
Traje de Bioseguridad 7

Ilustración 8.¿Qué tipo de seguridad utilizaste?

¿Que ti po de seguridad uti lizaste?


Mascarilla Alcohol Traje de Bioseguridad Lavado de Manos

47
L avad o d e Man o s

7
Tr aj e d e Bi o segu r i d ad

50
Al c o h o l

55
Masc ar i l l a

Esta pregunta esta relacionada a la anterior, realizamos esta pregunta adicional para

especificar que tipo de bioseguridad utilizaron las personas que respondieron con un si, el

cual nos podemos dar cuenta que de las 55 personas que respondieron con un si, utilizo

mascarillas, 50 personas tambien utilizaron alchol, 47 personas hicieron el lavado de manos,

y 7 personas utilizaron trajes de bioseguridad.


41

Conclusión

En la encuesta realizada por medio del internet, a 60 personas que residen en la ciudad

de Guayaquil, se obtuvieron datos muy importantes de los cuales se evidencio que durante la

pandemia del Covid-19, el 58% de trabajadores fueron de sexo femenino y el 42% de género

masculino, con una promedio de rango de edades entre 36 a 45 años, teniendo de referencia al

sector norte con el mayor porcentaje de competencia laboral, de los cuales la mayor parte

pertenece al sector laboral privado, y con el mayor porcentaje de las personas encuestadas las

cuales trabajaron de manera presencial, utilizando implementos de bioseguridad para su

protección.
42

Bibliografía

Batanero, A. &. (2011). El Currículo de Estadística en la Enseñanza. EM TEIA Revista de

Educación Matemática Y Tecnológica Iberoamericana, 2.

Cadenas. (1974). Poblacion.

editorial, E. (2022). "Probabilidad". Obtenido de https://concepto.de/probabilidad/

J.F, L. (s.f.). Teorema de Bayes. Obtenido de https://economipedia.com/definiciones/teorema-

de-bayes.html (Accessed: March 25, 2023).

Levin, R. I. (1996). Estadística para administradores. Prentice-Hall Hispanoamericana.

Obtenido de

https://dspace.scz.ucb.edu.bo/dspace/bitstream/123456789/4294/3/584.pdf

Matemovil. (2021). Varianza y desviacion estandar. Obtenido de

https://matemovil.com/varianza-y-desviacion-estandar-ejemplos-y-ejercicios/

Matemovil. (2022). Varianza. Obtenido de https://matemovil.com/varianza-y-desviacion-

estandar-ejemplos-y-ejercicios/

Nieto, C. Y. (2019). Características de los muestreos probabilísticos y no probabilísticos.

Obtenido de https://www.gestiopolis.com/caracteristicas-los-muestreos-

probabilisticos-no-probabilisticos/

Sac, C. (2016). ¿Para qué sirve la distribución muestral de medias? Obtenido de

https://www.sac.org.ar/cuestion-de-metodo/para-que-sirve-la-distribucion-muestral-

de-medias/
43

Spiegel, M. R. (1991). Muestra.


44

Anexos

Preguntas de Encuesta

You might also like