Professional Documents
Culture Documents
Análisis de Datos I
Análisis de Datos I
Instrucciones generales:
Página 1 de 8
Selección única. Marque la opción correcta de acuerdo con lo expresado en cada propuesta. (25
puntos, 1 punto cada ítem). Nota: la selección hecha por el estudiante será la opción subrayada en
amarillo.
A.
B.
C.
D.
E.
3. Es una herramienta que permite resumir en una gráfica los datos. La base de este diagrama es el cálculo
de la mediana y los cuartiles Q1 y Q3. También se usa el IQR y al utilizar este diagrama se puede identificar
valores atípicos sin necesidad de cálculos complejos . El párrafo anterior describe el diagrama denominado:
Página 2 de 8
6. ¿Cuál es el grafico más apropiado para observar la proporción de desempeño de procedimientos?
R/ B
7. Dado el siguiente conjunto de datos, A = {23, 45, 41, 34, 17, 61, 34,18, 43, 22, 33, 20, 23, 34, 19, 34, 29,
27, 26, 34}. El valor que más se repite en el conjunto de datos se conoce como y su valor es
a. Media aritmética, el valor es 30,85
b. Moda, el valor es 34
c. Mediana, valor es 30
d. Percentil 25, el valor es 18
e. Media ponderada, el valor es 30,75
f. Curtosis, el valor es 0,263
g. Ninguna de las anteriores
8. Nos indica cuanto se aleja en promedio las observaciones con respecto a la media aritmética del
conjunto de datos
a. Varianza
b. Sesgo
c. Desviación estándar
d. Coeficiente de variación
e. Rango
9. Es el valor que se encuentra en el punto medio (50%). La interpretación geométrica es que es el valor
que divide un histograma en dos partes iguales.
a. Moda
b. Media aritmética
c. Coeficiente de variación
d. Mediana
e. Ninguna de las anteriores
Página 3 de 8
11. La siguiente figura presenta un comportamiento representativo al cual en el estudio de la estadística se
clasifica como:
N
a. Estadística inferencial
b. Estadística descriptiva n
c. Método estocástico
d. Análisis numérico
e. Ninguna de las anteriores
12. Describe, analiza y representa un grupo de datos utilizando métodos numéricos y gráficos que resumen y
presentan la información contenida en ellos. Se puede definirse como aquel método que contiene la
recolección, organización, presentación y resumen de una serie de datos. Este párrafo describe el concepto
de:
a. Estadística inferencial
b. Estadística descriptiva
c. Método estocástico
d. Análisis numérico
e. Ninguna de las anteriores
¿Qué podemos concluir acerca de las muestras de galletas basados en el diagrama de medidas individuales?.
Página 4 de 8
15. ¿Cuál de estos tres puntos A, B y C representados en la figura siguiente es un dato atípico?
A.
B.
C.
16. Es el límite dentro del cual están comprendidos todos los valores de la serie de datos, en otras palabras,
es el número de diferentes valores que toma la variable en un estudio o investigación dada. Es la diferencia
entre el valor máximo de una variable y el valor mínimo que ésta toma en una investigación cualquiera.
El párrafo anterior describe el concepto de:
a. Amplitud de clase
b. Rango
c. Coeficiente de variación
d. Clase o intervalo de clase
e. Punto medio o Marca de clase
f. Varianza
a. 8
b. 2
c. 4
d. 5
18. Son divisiones o categorías en las cuales se agrupan un conjunto de datos ordenados con características
comunes. En otras palabras, son fraccionamientos del rango o recorrido de la serie de valores para
reunir los datos que presentan valores comprendidos entre dos límites. El párrafo anterior describe el
concepto de:
a. Amplitud de clase
b. Rango
c. Clase o intervalo de clase
d. Punto medio o Marca de clase
Página 5 de 8
19. Es el grado de asimetría o falta de la misma de una distribución de frecuencia, por lo que numéricamente
se puede calcular a partir de obtener la mediana, la media aritmética y la desviación estándar. Este
estadístico se denomina:
20. Dada la siguiente figura, se puede concluir que el comportamiento de los datos obedece a un
comportamiento denominado:
9 10 11 12
a. Simetría perfecta x = Me = Mo
b. Asimétrica positiva x > Me > Mo
c. Asimétrica negativa x < Me < Mo
d. Ninguna de las anteriores
21. El centro de la clase es el valor de los datos que se ubica en la posición central de la clase y representa
todos los demás valores de esa clase. Este valor se utiliza para el cálculo de la media aritmética
El párrafo anterior describe el concepto de:
a. Amplitud de clase
b. Rango
c. Coeficiente de variación
d. Clase o intervalo de clase
e. Punto medio o Marca de clase
f. Varianza
a. 10
b. 2
c. 6
d. 4
Página 6 de 8
23. La siguiente figura representa la información de….
a. Asimetría a la derecha
b. Asimetría a la izquierda
c. No posee un comportamiento de asimetría
Página 7 de 8
25. ¿Cuál turno de producción de neumáticos tiene mayor variación del peso?
A. Tarde = Evening
B. Mañana = Morning
Promedio de
Muestra dosis en mg
1 10,45
2 10,20
3 9,95
4 9,85
5 10,90
6 10,35
7 11,35
Página 8 de 8
8 10,80
9 10,55
10 9,50
11 10,55
12 9,95
13 10,45
14 10,90
15 11,15
16 10,00
17 11,40
18 11,85
19 11,15
20 11,45
21 9,55
22 10,05
23 11,00
24 9,15
25 9,25
26 10,00
27 10,15
28 10,35
29 9,45
30 9,85
.
Estadísticas
Error
estándar
de la
Variable N N* Media media Desv.Est. Varianza CoefVar Mínimo
Promedio de 30 0 10,385 0,128 0,699 0,489 6,73 9,150
dosis en mg
Variable Q1 Mediana Q3 Máximo Rango IQR Modo
Promedio de 9,925 10,350 10,925 11,850 2,700 1,000 9,85; 9,95; 10;
dosis en mg 10,35
Variable N para moda Asimetría Curtosis
Promedio de 2 0,18 -0,68
dosis en mg
**Los datos contienen por lo menos cinco valores de moda. Sólo se muestran los cuatro más
pequeños.**
Página 9 de 8
2. Elabore gráficos apropiados para representar el punto 1. Valor: 5 puntos
Página 10 de 8
3. Realice una discusión de datos obtenidos y un cuadro de conclusiones relevantes. 5 puntos
R/ Los datos de los miligramos del medicamento presentan una distribución normal según la prueba Anderson-
Darling (p-value (0.785) > 0.05) con lo cual podemos hacer más predecible el comportamiento de la prueba de
tolerancia. Los datos del muestreo presentan una media de 10.385 mg por dosis del medicamento, concentrando un
valor medio en 10.350 mg. La desviación estándar de los miligramos de la dosis es de 0.699 mg. La gráfica de cajas
nos presenta una asimetría sesgada a la derecha de los datos con respecto a la media. Los datos no presentan
valores atípicos u outliers, y sus valores extremos se encuentran entre los 9.15 mg y los 11.85 mg de la dosis.
La curtosis de la curva presenta un dato negativo lo cual indica que la curva es platicúrtica, con lo cual el
apuntalamiento de los datos es aplanado con tendencia hacia las colas (en este caso hacia la cola derecha).
Podemos también observar que el error estándar de la media es bajo (0.128) con lo cual los valores de la media no
se alejan tanto de los valores de la media poblacional. Con respecto a las medidas de dispersión podemos señalar
que el rango intercuartil de la caja es de 1mg y el coeficiente de variación es del 6.73% relativamente bajo, lo que
nos da indicios de poca dispersión de los datos. La homogeneidad de los datos nos indica 5 valores que representan
la moda. El gráfico de histograma nos permite evidenciar datos muy agrupados con casi nula dispersión en los
valores promedio de miligramos de las dosis del medicamento.
El informe resumen del promedio de dosis en miligramos nos indica el intervalo de confianza al 95% para la media
del promedio de miligramos de la dosis del medicamento, él cual oscilarán entre 10.124 mg y 10.646 mg. El intervalo
de confianza de la desviación estándar de miligramos de la dosis estima que la variación de la dosis será menor de
1 mg.
Conclusiones relevantes:
1. Los datos del muestreo de la prueba piloto siguen una distribución normal, lo que permite una mejor
predicción de resultados o comportamiento de la población.
2. Las medidas de tendencia central se acercan a los valores de la dosis recomendada de 10mg.
3. Los intervalos de confianza al 95% nos generan información importante para conocer los valores de
oscilación de la media y la desviación estándar de las muestras.
4. Las medidas de dispersión de los datos nos indican que existe poca variabilidad, lo que ayuda al estudio.
5. La estadística descriptiva del estudio brinda información valiosa para posteriormente pasar a la fase
inferencial y así poder determinar la tolerancia y los factores que pueden influir en la dosis del medicamento.
Página 11 de 8
Problema 2 (10 puntos)
Suponer que la velocidad de los autos en una autopista se ajusta a una distribución normal con media
94.5 Km/h y una desviación estándar de 7.5 Km/h.
a) Obtener la probabilidad de que un auto viaje entre 90 y 100 Km/h. 5 puntos
R/La probabilidad de que un auto viaje entre 90 y 100 Km/h es del 49.94%
𝑃(90,100) = 0.494069
90−94.5 100−94.5
𝑍= 𝑍=
7.5 7.5
𝑍 = |−𝟎. 𝟔𝟎| 𝑍 = 𝟎. 𝟕𝟑
𝑃(100) = 0.2327
𝑃(90) = 1 − 0.2743
𝑃(90) = 0.7257
𝑃(90, 100) = 07.257 − 0.2327
Página 12 de 8
𝑃(90,100) = 0.4930
b) Si la policía desea multar por exceso de velocidad al 5% de los autos, ¿cuál es la velocidad límite
que debe establecer? 5 puntos
R/El límite de velocidad que debe establecer la policía es de ≤ 106.8 𝐾𝑚/ℎ, de lo contrario formará parte
del 5% multado por exceso de velocidad.
106.8 − 94.5
𝑍=
7.5
𝑍 = 𝟏. 𝟔𝟒
𝑃 (1.64) = 0.0505
Página 13 de 8