Download as ppt, pdf, or txt
Download as ppt, pdf, or txt
You are on page 1of 31

ORGANIZACIÓN DE DATOS

TABLAS DE FRECUENCIA
• El primer procedimiento a estudiar para organizar y
resumir un conjunto de datos es una Tabla de
Frecuencias: Agrupación de datos cualitativos en
clases mutuamente excluyentes que muestra el
número de observaciones en cada clase.
• Ejemplo:
• Tabla de frecuencias vehículos vendidos el mes pasado
• Tipo de Automóvil Nº de automóviles
• Doméstico 50
• De importación 30
• El número de observaciones en cada clase recibe el nombre de frecuencia
de clase.
ORGANIZACIÓN DE DATOS
FRECUENCIAS RELATIVAS DE CLASE
• Es posible convertir las frecuencias de clase en
FRECUENCIAS RELATIVAS DE CLASE para mostrar la
fracción del número total de observaciones en cada
clase.
• Así, una frecuencia relativa capta la relación entre la
totalidad de elementos de una clase y el número
total de observaciones.
Tabla de frecuencia relativas de vehículos vendidos por tipo de vehículo mes pasado
• Tipo de Automóvil Nº de automóviles Frecuencia Relativa
• Doméstico 50 0.625
• De importación 30 0.375
• Total 80 1
REPRESENTACIÓN GRÁFICA DE DATOS CUALITATIVOS
• GRÁFICA DE BARRAS: Es la representación más común para
representar una variable cualitativa en forma gráfica.
• En la mayoría de los casos, el eje horizontal muestra la
variable de interés y el eje vertical la cantidad, número o
fracción de cada uno de los posibles resultados.
• Una característica distintiva de la gráfica de barras es que
existe una distancia o espacio entre las barras.
• Es decir que, como la variable de interés es cualitativa las
barras no son adyacentes.
• Por consiguiente una gráfica de barras es una representación
gráfica de una tabla de frecuencias mediante una serie de
rectángulos de anchura uniforme, cuya altura corresponde a
la frecuencia de clase.
• GRÁFICA DE PASTEL: Gráfica que
muestra la parte o porcentaje que
representa cada clase del total de
números de frecuencia.
DISTRIBUCIONES DE FRECUENCIA
DATOS CUANTITATIVOS

• Agrupación de datos en clases mutuamente


excluyentes, que muestra el número de
observaciones que hay en cada clase.

• Supongamos ahora que se desea resumir las


ventas del último mes utilizando el precio de
venta; entonces describirá el precio de venta
por medio de una distribución de frecuencias.
¿Cómo crear una distribución de frecuencia?
• Primer paso: Definir el número de clases. El objetivo
consiste en emplear suficientes agrupamientos o
clases, de manera tal que se perciba la forma de la
distribución.
• Aquí se necesita criterio; una gran cantidad de clases
o muy pocas podrían no permitir ver la forma
fundamental del conjunto de datos.
• Una receta útil para determinar la cantidad de clases
(k) es la regla de 2 a la k tal que al efectuar este 2 a la
k sea algo más del n (número de observaciones)
Ejemplo: Precios de vehículos vendidos el mes
pasado (en dólares)
• 23197 23372 20454 23591 26651 27453 17266
• 18021 28683 30872 19587 23169 35851 19251
• 20047 24285 24324 24609 28670 15546 15935
• 19873 25251 25277 28034 24533 27443 19889
• 20004 17357 20155 19688 23657 26613 20895
• 20203 23765 25783 26661 32277 20642 21981
• 24052 25799 15794 18263 35925 17399 17968
• 20356 21442 21722 19331 22817 19766 20633
• 20962 22845 26285 27896 29076 32492 18890
• 21740 22374 24571 25449 28337 20642 23613
• 24220 30655 22442 17891 20818 26237 20445
• 21556 21639 24296
• Segundo paso: Determine el intervalo o ancho
de clase:
• Debería ser el mismo para todas las clases.
• Todas las clases juntas deben cubrir por lo
menos la distancia del valor más bajo al más
alto de los datos. Expresado esto en una
formula sería: i>= H-L/k donde i= intervalo
de clase H máximo valor observado y L el
mínimo valor observado k el Nº de clases.
• En el ejemplo el valor más bajo es $15546 y el
más alto $35925.
• En el ejemplo n=80 vehículos vendidos si vamos a
calcular el 2 a la k probemos hasta que éste de algo
más de 80.
• Con k=6 2 a la k será 64<80
• Con k=7 2 a la K será 128>180
• Por lo tanto escogeremos k=7
• i= $35925-$15546 /7= $2911
• En la práctica, este tamaño de intervalo
normalmente se redondea a una cifra conveniente,
tal como un múltiplo de 10 o 100…. En este caso, el
valor de $3000 podría emplearse sin inconvenientes.
• Tercer paso: Establezca los límites de cada clase:
• Esto es importante para que sea posible incluir cada observación
en una sola categoría.
• En el ejemplo 7 clases de $3000 de amplitud dan un rango de
$21000.
• El rango real es $35925-$15546=$20379 HAY UNA DIFERENCIA DE
$621.
• Como solo necesita abarcar la distancia H-L, resulta natural poner
cantidades aproximadamente iguales del excedente en cada una de
las colas. Por supuesto, también se deberían elegir límites
convenientes de clase.
• Una directriz consiste en convertir el límite inferior de la primera
clase en un múltiplo del intervalo de clase.
• A veces esto no es posible, pero el límite inferior por lo menos
debe redondearse.
• Ahora bien, éstas son las clases que podría utilizar
para estos datos:
• $15000 a 18000
• 18000 a 21000
• 21000 a 24000
• 24000 a 27000
• 27000 a 30000
• 30000 a 33000
• 33000 a 36000
• Con este formato debemos de tener claro que
$17999 pertenece a la primera clase y $18000 a la
segunda clase.
• Cuarto paso: Cuente el número de elementos de
cada clase (frecuencia de clase).
• Precios de Venta Frecuencia
• $15000 a 18000 8
• 18000 a 21000 23
• 21000 a 24000 17
• 24000 a 27000 18
• 27000 a 30000 8
• 30000 a 33000 4
• 33000 a 36000 2
• 80
• Ahora que ha organizado los datos en una
distribución de frecuencias, resuma el patrón de los
precios de ventas de vehículos y podemos observar
lo siguiente:
– Los precios de venta abarcan alrededor de $15000 a
aproximadamente $36000.
– Los precios de venta se concentran entre 18.000 y 27000
dólares (un total de 58) lo que significa el 72,5% de los
vehículos vendidos caen en ese rango de precios.
– La máxima concentración de precios está en la clase que
va de 18 mil dólares a 21 mil dólares.
INTERVALOS DE CLASE Y PUNTOS MEDIOS DE CLASE
• El punto medio de clase se encuentra a la mitad,
entre los límites inferiores de dos clases
consecutivas.
• En nuestro ejemplo el punto medio de la primera
clase es $16.500. De la segunda clase $19500….
• Para determinar el intervalo de clase, se resta el
límite inferior de la primera clase del límite inferior
de la siguiente clase.
• También se puede determinar el intervalo de clase
calculando la diferencia entre puntos medios
consecutivos. ($19500-$16500=$3000)
Distribución de Frecuencias
relativas
• Precios de Venta Frecuencia Frecuencia Relativa
• $15000 a 18000 8 0.1000
• 18000 a 21000 23 0.2875
• 21000 a 24000 17 0.2125
• 24000 a 27000 18 0.2250
• 27000 a 30000 8 0.1000
• 30000 a 33000 4 0.0500
• 33000 a 36000 2 0.0250
• 80 1
Representación gráfica de una distribución de
frecuencias
• Histograma: Las clases se señalan en el eje horizontal
y las frecuencias de clase en el eje vertical.
• Las frecuencias de clase se representan por medio de
las alturas de las barras.
• Existe una importante diferencia como consecuencia
de la naturaleza de los datos. Por lo general los datos
cuantitativos se miden con escalas continuas, no
discretas. Por consiguiente el eje horizontal
representa todos los valores posibles y las barras se
colocan adyacente para que muestren la naturaleza
continua de los datos.
ASISTENCIA DE SOFTWARE

• EXISTEN DIVERSOS PAQUETES QUE PERMITEN


LLEVAR A CABO LAS GRÁFICAS:
– MICROSOFT EXCEL
– MEGASTAT
– MINITAB
• Polígono de frecuencias: También muestra la
forma que tiene una distribución y es similar a
un histograma.
• Consiste en segmentos de recta que conectan
los puntos formados por las intersecciones de
los puntos medios de clase y las frecuencias
de clase.
P
Distribuciones de frecuencias acumulativas.
• Precios de Venta Frecuencia Frec Ac
• $15000 a 18000 8 8
• 18000 a 21000 23 31
• 21000 a 24000 17 48
• 24000 a 27000 18 66
• 27000 a 30000 8 74
• 30000 a 33000 4 78
• 33000 a 36000 2 80
• 80
EJERCICIO 1
• Bebidas Fanta C.A sirve una bebida de cola con un sabor adicional, Cola Plus, muy
popular entre sus clientes. La compañía se encuentra interesada en la preferencia
de los consumidores por Cola-Plus en comparación con Coca-Cola, Pepsi y una
bebida de lima-limón. Se pidió a 100consumidores elegidos de forma aleatoria que
degustaran una prueba y eligieran la bebida que más le gustaba. Los resultados
aparecen en la tabla siguiente:

• BEBIDA NÚMERO
• COLA-PLUS 40
• COCA-COLA 25
• PEPSI 20
• LIMA-LIMÓN 15

• A) Son los datos de naturaleza cuantitativa o cualitativa?


• B) ¿Qué nombre recibe la Tabla? ¿Qué muestra la tabla?
• C) Diseñe una gráfica de barras para describir la información.
• D) Dibuje una gráfica de pastel utilizando frecuencias relativas.
Respuestas
• A) Datos Cualitativos, ya que la respuesta de los
consumidores a la prueba de degustación es el nombre de
una bebida.
• B) Tabla de Frecuencias. Ésta muestra el número de personas
que prefiere cada una de las bebidas.
C)
D)
Ejercicio 2
• Una muestra de salarios por hora de 15 empleados
se organizó en la siguiente tabla:

• Salarios por hora (en $) Número de empleados

8 a 10 3
10 a 12 7
12 a 14 4
14 a 16 1
a)¿Qué nombre recibe la tabla?
b)Elabore una distribución de frecuencias acumulativas.
c)¿Cuántos empleados ganan menos de 12$ por hora?
Respuestas
• A) Una distribución de frecuencias.
• B) Salarios por hora (en $) Número de empleados Frec.
Acum
8 a 10 3 3
10 a 12 7 10
12 a 14 4 14
14 a 16 1 15
• C) 10 empleados ganan menos de 12$ por hora de
trabajo.

You might also like