Professional Documents
Culture Documents
Guia de Diseños de Experimentos (CCC)
Guia de Diseños de Experimentos (CCC)
DISEÑOS .......................................................................................................................................................................................................................4
DISEÑOS DE EXPERIMENTOS.......................................................................................................................................................................................6
DEFINICIONES BÁSICAS ...............................................................................................................................................................................................8
PRINCIPIOS BÁSICOS....................................................................................................................................................................................................9
CLASIFICACIÓN Y SELECCIÓN DE LOS DISEÑOS EXPERIMENTALES ......................................................................................................................... 10
ETAPAS EN EL DISEÑO DE EXPERIMENTOS .............................................................................................................................................................. 11
ANALISIS DE VARIANZA ................................................................................................................................................................................................ 13
ANÁLISIS DE VARIANZA DE UN FACTOR O UNA VÍA (DCA) ......................................................................................................................................... 16
MODELO MATEMÁTICO ........................................................................................................................................................................................... 17
Modelo estadístico lineal ......................................................................................................................................................................................... 17
CUADRO DE ANALISIS DE VARIANZA ....................................................................................................................................................................... 18
PRUEBA DE HIPÓTESIS .............................................................................................................................................................................................. 18
COMPARACIÓN ENTRE TRATAMIENTOS ..................................................................................................................................................................... 21
DIFERENCIA MÍNIMA SIGNIFICATIVA....................................................................................................................................................................... 21
MÉTODO DE TUKEY .................................................................................................................................................................................................. 22
CONTRASTES ORTOGONALES (FUNCION LINEAL) ................................................................................................................................................... 23
VERIFICACION DE SUPUESTOS ..................................................................................................................................................................................... 25
PRUEBA DE NORMALIDAD ....................................................................................................................................................................................... 26
HOMOGENEIDAD DE VARIANZAS (HOMOCEDASTICIDAD) ..................................................................................................................................... 29
INDEPENDENCIA ....................................................................................................................................................................................................... 34
SOLUCIÓN AL INCUMPLIMINTO DE SUPUESTOS ......................................................................................................................................................... 35
TAMAÑO DE MUESTRA PARA UN CONTRASTE ........................................................................................................................................................... 38
El tamaño del efecto depende del diseño, ................................................................................................................................................................... 40
𝜟 = 𝑽𝒂𝒓𝒊𝒂𝒄𝒊ó𝒏 𝒊𝒏𝒕𝒆𝒓𝒎𝒖𝒆𝒔𝒕𝒓𝒂𝒍 (𝒆𝒏𝒕𝒓𝒆 𝒕𝒓𝒂𝒕𝒂𝒎𝒊𝒆𝒏𝒕𝒐𝒔)𝑽𝒂𝒓𝒊𝒂𝒏𝒛𝒂 𝒑𝒐𝒃𝒍𝒂𝒄𝒊𝒐𝒏𝒂𝒍 ......................................................................................... 40
MODELOS DE EFECTOS FIJOS Y ALEATORIOS .............................................................................................................................................................. 42
MODELO DE EFECTOS FIJOS ..................................................................................................................................................................................... 42
MODELO DE EFECTOS ALEATORIOS ......................................................................................................................................................................... 43
ANÁLISIS DE VARIANZA DE DOS FACTOR .................................................................................................................................................................... 44
MODELO A DOS CRITERIOS DE CLASIFICACION CON UNA OBSERVACIÓN................................................................................................................. 46
MODELO MATEMÁTICO ........................................................................................................................................................................................... 46
CUADRO DE ANALISIS DE VARIANZA ....................................................................................................................................................................... 47
PRUEBA DE HIPÓTESIS .............................................................................................................................................................................................. 47
PARTICIÓN DE LA SUMA DE CUADRADOS DE TRATAMIENTOS O BLOQUES.............................................................................................................. 50
Si CMB>CMR DBCA, entonces ER>1; y es mejor usar DBCA............................................................................................................................................. 51
Si CMB≤CMR DBCA, entonces ER≤1; y es mejor usar DCA ............................................................................................................................................... 51
Nota: a=K=t; SCE=SCR ................................................................................................................................................................................................... 52
MODELO A DOS CRITERIOS DE CLASIFICACION CON DOS O MAS OBSERVACIONES POR CELDA ............................................................................. 52
MODELO MATEMÁTICO ........................................................................................................................................................................................... 52
CUADRO DE ANALISIS DE VARIANZA ....................................................................................................................................................................... 53
PRUEBAS DE HIPÓTESIS ............................................................................................................................................................................................ 53
MODELO MATEMÁTICO ........................................................................................................................................................................................... 54
CUADRO DE ANALISIS DE VARIANZA ....................................................................................................................................................................... 55
PRUEBA DE HIPÓTESIS .............................................................................................................................................................................................. 55
CUADRADO GRECO LATINO-DCGL ............................................................................................................................................................................... 57
MODELO MATEMÁTICO ........................................................................................................................................................................................... 58
CUADRO DE ANALISIS DE VARIANZA ....................................................................................................................................................................... 59
PRUEBA DE HIPÓTESIS .............................................................................................................................................................................................. 59
DISEÑO FACTORIAL (con réplicas)................................................................................................................................................................................ 60
DISEÑO FACTORIAL 22 .............................................................................................................................................................................................. 64
Realizar: Ejercicio 6 – 9 Libro de Montgomery, página 278 ...................................................................................................................................... 68
DISEÑO FACTORIAL 23 .............................................................................................................................................................................................. 68
Realizar ejemplo “Biorremediación de suelos contaminados por hidrocarburos”, 23 .............................................................................................. 72
DISEÑO FACTORIAL 24 .............................................................................................................................................................................................. 72
DISEÑO FACTORIAL GENERAL O FACTORIALES MIXTOS O EXPERIMENTOS FACTORIALES ................................................................................... 74
DE DOS O TRES FACTORES........................................................................................................................................................................................ 74
DISEÑOS CON EFECTOS ALEATORIOS............................................................................................................................................................................ 77
DISEÑOS
Experimentos
puros
Según el propósito:
DISEÑOS Diseños experimentales Cuasi Exploratorios
El diseño de la investigación es una experimentos
planificación de lo que se debe Según el número
Descriptivos
hacer para lograr los objetivos del Diseños no de mediciones:
Correlaciónales/causales
estudio experimentales u Transaccionales
observacionales Tendencia
Longitudinales
Evolución de grupo (Cohorte)
Panel
Investigación experimental
Consiste en ampliar un estímulo a un individuo o grupo de individuos, o elementos, y ver el efecto de
ese estimulo en alguna(s) variable(s) en condiciones de mayor o menos control.
La investigación no experimental
Es la que se realiza sin manipular deliberadamente las variables independientes, y se basa en categorías,
conceptos, variables, sucesos, comunidades o contextos que ya ocurrieron, o se dieron sin la intervención
directa del investigador. Es un enfoque retrospectivo
Cuasi experimentos
La asignación de los grupos y de los sujetos a los grupos no se realiza al azar. No aleatorización en la
formación de los grupos. (Grupos intactos o naturales). La asignación de los grupos se hace por la situación
real, es decir, son grupos intactos
El método cuasiexperimental permite explorar temas que de otra manera no podrían explorarse debido
a cuestiones éticas, morales y/o prácticas. Las ventajas de estos experimentos es que implica menos
costos y tiempo que si se quisiera realizar un experimento puro, mientras que el limitante es que al no
reunir a los grupos aleatoriamente, provoca que los resultados puedan no ser todo lo exactos que se
desearía.
Ejemplos:
Se investiga los efectos de tres vacunas contra el coronavirus, tomando como sujetos de estudio a
personas que se presentan voluntarias. Es cuasi experimental porque no se ha podido asignar
aleatoriamente a los sujetos a distintos grupos.
Efecto del alcohol en adolescentes
En resumen, diremos que los estudios experimentales, a diferencia de los estudios no experimentales u
observacionales, permiten la comparación de manera controlada de tratamientos sobre una variable
respuesta y los tratamientos son asignados a las unidades experimentales aleatoriamente
La aleatorización es una de los elementos más importantes de un experimento bien diseñado
“Consiste en planear y realizar un conjunto de pruebas con el objetivo de generar datos que, al ser
analizados estadísticamente, proporcionen evidencias objetivas que permitan responder las
interrogantes planteadas por el experimentador sobre determinada situación”. (Gutiérrez Pulido & De la
Vara Salazar, 2012)
“Un experimento puede definirse como una prueba o serie de pruebas en las que se hacen cambios
deliberados en las variables de entrada de un proceso o sistema para observar e identificar las razones de
los cambios que pudieran observarse en la respuesta de salida”. (Montgomery, 2004)
“Diseñar estadísticamente un experimento es realizar una prueba o una serie de pruebas buscando
caracterizar las variables explicativas o factores (Xi) de mayor influencia en un ensayo de interés, evaluado
a través de una o varias variables respuesta(s), tal que si deliberada o sistemáticamente se introducen
cambios controlados en algunas de las variables explicativas del proceso, siempre sea posible observar o
cuantificar los cambios que estos generan en la(s) variable(s) respuesta(s). Adicionalmente, se busca
minimizar el efecto de las variables no controlables (covariables), procurando con ello estabilizar y
minimizar la variabilidad de las respuestas, identificando los factores que contribuyen a las mayores
causas de variabilidad”. (Melo et al., 2020)
El diseño de experimentos (DOE según sus siglas en inglés), es empleado en todos los sectores,
permitiéndonos:
- Comparaciones de dos o más materiales
- Hacer cambios en los materiales, métodos o condiciones de operación de un proceso
- Comparación de varios instrumentos de medición
- Probar varias temperaturas
- Evaluar un material para obtener mejoras
- Mejoramiento de procesos
- Determinar los factores de un proceso que tienen impacto sobre una o más características del
producto final
Procesos:
✓ Maquinaria
✓ Mano de obra Cuando se cuantifican
✓ Métodos se expresan en modelos
✓ Medio ambiente
✓ Materiales
Efecto Causas
y= f (x1,x2,………….xk)
F principales (aleatorios)
v. respuesta f (factores que explican el fenómeno)
F accesorios (fijos)
v. cuantitativa v. cuantitativas
v. cualitativas
DEFINICIONES BÁSICAS
Según (Gutiérrez Pulido & De la Vara Salazar, 2012)
Experimento
Es la unidad de observación y análisis, de la cual se observa, mide y registra la misma característica o
variable. Es un cambio en las condiciones de operación de un sistema o proceso, que se hace con el
objetivo de medir el efecto del cambio en una o varias propiedades del producto o resultado.
Unidad experimental
Pieza(s) o muestra(s) que se utiliza para generar un valor que sea representativo del resultado.
Ejemplo:
• En informática: ordenadores, páginas web, buscadores de internet,
• En agricultura: parcelas de tierra,
• En medicina: individuos humanos u animales,
• En industria: lotes de material, trabajadores, máquinas
Son las variables que se investigan en el experimento para observar cómo afectan o influyen en la variable
respuesta.
Error aleatorio
Es una variabilidad observada que no se puede explicar por los factores estudiados; resulta del pequeño
efecto de los factores no estudiados y del error experimental.
Error experimental
Componente del error aleatorio que refleja los errores del experimentador en la planeación y ejecución
del experimento, es causado por:
• Errores de observación
• Errores de medición
• Variación del material experimental
• Factores extraños que pueden influir en las características de estudio
• Error de muestreo, debido a la heterogeneidad de las unidades experimentales
Control del error experimental.- Puede lograrse mediante la selección adecuada del tamaño de la
muestra y el diseño experimental
Matriz de diseño.- Es el arreglo formado por los tratamientos que serán corridos, incluyendo las
repeticiones.
Es necesario conocer las etapas a seguir cuando nos enfrentamos a l estudio de un proceso
Niveles del tratamiento.- Tipos o grados específicos del factor que se utilizan en el experimento, ejm:
distintas cantidades de drogas, grados de temperatura seleccionados, etc
Modelo de efectos fijos: Los niveles de todos los factores han sido seleccionados por el experimentador.
Modelo de efectos aleatorios: Los niveles de todos los factores son una muestra aleatoria de todos los
niveles posibles.
PRINCIPIOS BÁSICOS
Aleatorización
Consiste en hacer corridas experimentales en orden aleatorio, este principio aumenta la posibilidad de
que el supuesto de independencia de los errores se cumpla (ver ejemplo del libro de Mongomery pág
60,61 y 77)
• Tanto la asignación de material experimental como el orden en que se realizarán las corridas o
ensayos individuales del experimento se determinan al azar.
• Uno de los requisitos de los métodos estadísticos es que las observaciones sean variables
aleatorias independientes.
Véase el siguiente experimento
Fuente: (Oehlert, 2010)
Repetición
Es correr más de una vez un tratamiento o combinación de factores
Bloqueo
Tomar en cuenta en forma adecuada todos los factores que pueden afectar la respuesta observada
• Se utiliza para mejorar la precisión de las comparaciones que se hacen entre los factores de
interés.
• Reducir o eliminar la variabilidad transmitida por factores perturbadores.
• Uno de los requisitos de los métodos estadísticos es que las observaciones sean variables
aleatorias independientes.
• Un bloque es un conjunto de condiciones experimentales homogéneas.
BLOQUEAR: Dividir o particionar las unidades experimentales en grupos llamados bloques (o niveles de
factores bloque) de modo que las observaciones realizadas en cada bloque se realicen bajo condiciones
experimentales lo más parecidas posibles. Es una muy buena estrategia cuando las u.e. se prestan a ser
divididas en grupos de unidades “similares”
Tarea:
Con el fin de evaluar una investigación propuesta con enfoque experimental responda las siguientes
preguntas:
1. ¿Qué se va a medir, cómo, dónde?
2. ¿Qué características se van a analizar?
3. ¿Qué factores afectan las características que se van a analizar?
4. ¿Cuáles de esos factores se estudiarán en esta investigación?
5. ¿Cuál es la variable respuesta?
ANALISIS DE VARIANZA
El ANOVA, desarrollado por Ronald Fisher en 1918, extiende la prueba t y la prueba Z que
compara tan solo 2 grupos.
La técnica del análisis de la varianza (ANOVA o AVAR), es una de las técnicas más utilizadas en
los análisis de los datos de diseños experimentales, fue desarrollado por Ronald Fisher,
procedimiento utilizado cuando se quiere contrastar más de dos medias.
en donde:
Σ (Xij - µ)2 = Suma de cuadrados total = SCT
2
nj Σ (µj - µ) = Suma de cuadrados entre Tratamientos = SCE
Σ (Xij - µj)2 = Suma de cuadrados Residual = Error = SCR
de donde:
SCT = SCE + SCR.
Una forma abreviada de calcularlo es:
(∑ 𝑋𝑖𝑗)2
𝐹𝑐 =
𝑛
2
𝑆𝐶𝑇 = ∑ 𝑋 − 𝐹𝑐
𝑖𝑗
SCE =∑((∑x.j )2 / nj) -FC
Los supuestos básicos del análisis de varianza son las mismas asociadas con el análisis de
regresión:
• Aditividad
• Independencia
• Aleatoriedad
• Linealidad
• Varianzas homogéneas o homocedasticidad
• Normalidad
Existen varios "modelos" en el análisis de varianza dependiendo del diseño formulado, los más
utilizados son:
• Modelo aleatorizado de una variable, o a un criterio de clasificación, análisis de varianza de
un factor o ANOVA una vía (DCA)
• Modelo aleatorizado de dos variables, o de dos criterios de clasificación, o de bloques,
análisis de varianza de dos factores o ANOVA dos vías (DBCA)
• Cuadrado Latino, Grecolatino
• Diseños factoriales
MODELO MATEMÁTICO
Modelo de efectos fijos
X ij =µ+αj +εij
Modelo estadístico lineal
Donde:
TRATAMIENTO
OBSERV/Réplicas T1 T2 Tj Ta
1 X11 X12 X1j X1a
2 X21 X22 X2j X2a
i Xi1 Xi2 Xij Xia
:
𝑛𝑖 Xni2 Xni2 Xnij Xnia
TOTALES X1 X2 Xj Xa
Observaciones 𝒏𝟏 𝒏𝟐 𝒏𝒋 𝒏𝒂
Medias 𝒖𝟏 𝒖𝟐 𝒖𝒋 𝒖𝒂
∑ 𝛼𝑗 = 0
𝑗=1
La diferencia que debe tener las medias entre sí para concluir que hay un efecto (que los tratamientos son
diferentes), nos indica el ANOVA
PRUEBA DE HIPÓTESIS
1. Formulación de la Hipótesis:
H0: µ1 = µ2 = µj =..... = µa H0 : αj = 0
HA: µ1 ≠ µ2 ≠ µj ≠ ..... ≠ µa HA : αj ≠ 0 para algún j
Fc = CME / CMR
3. Criterio de Decisión
Rechazar la H0 si : Fc ≥ Fα,v1,v2
Realizar el ejercicio 3.3 (página 62 y 63 del libro de Oehlert)
Ejemplo del Libro de Análisis y diseño de experimentos, Gutiérrez Humberto y Salazar
Román, tercera edición
Ejercicio 15, página 81
Solución:
Formulación de la Hipótesis:
H0: µ1 = µ2 = µ3 No existe diferencia significativa en el promedio de la dureza de las tabletas debido
al porcentaje de almidón
HA: µ1 ≠ µ2 ≠ µ3 Existe diferencia significativa en el promedio de la dureza de las tabletas debido a
la cantidad de almidón
Criterio de Decisión
Rechazar la H0 si : Fc ≥ Fα,v1,v2
58,1015 > F 0,05 ; 2, 9
58,1015 > 4,2564 Rho
ANÁLISIS DE VARIANZA
FV SC GL CM Fc Valor p Ft
Tratamientos (Dureza) 26,7266667 2 13,3633333 58,1014493 7,16E-06 4,25649473
Error 2,07 9 0,23
Total 28,7966667 11
Ejercicios resuelto de texto:LIND Douglas,MARCHAL William, WATHEN Samuel (2015) Estadística
Aplicada a los negocios y a la Economías; Mc Graw Hill, México. Pg 425
La siguiente es información muestral. Verifique la hipótesis de que las medias de tratamiento son
iguales. Utilice el nivel de significancia de 0.05.
Solución:
Por lo tanto rechazo la hipótesis nula y concluyó que si existe diferencia significativa entre los medios de
tratamientos.
Con siguiente es información muestral. Verifique la hipótesis con un nivel de significancia de 0.05 de que
las medias de tratamiento son iguales.
a) Formule las hipótesis nula y alternativa.
b) ¿Cuál es la regla de decisión?
c) Calcule SST, SSE y SS total.
d) Elabore una tabla ANOVA.
e) Declare su decisión respecto de la hipótesis nula.
Solución:
𝐻0 : 𝜇1 = 𝜇2 = 𝜇3 No existe diferencia significativa entre las medias de tratamientos
𝐻0 : 𝜇1 ≠ 𝜇2 ≠ 𝜇3 Existe diferencia significativa entre las medias de tratamientos
REGLA DE DECISION:
grados de libertad en el numerador: 3-1= 2
grados de libertad en el denominador: 15-3=12
Si el 𝐹𝐶 ≥ 3,89, SE RECHAZA LA HIPOTESIS NULA
SCT= 152,93
SCE= 70,4
SCR= 82,53
FC= 2184,07
FUENTE DE SUMA DE GRADOS DE CUADRADO F
VARIACION CUADRADOS LIBERTAD MEDIO
TRATAMIENTOS 70,40 2 35,20 5,12
ERROS 82,53 12 6,88
TOTAL 152,93 14
Por lo tanto, rechazo la hipótesis nula y concluyo que a un nivel de confianza de 0,05 si existe diferencia
significativa entre las medias de tratamientos.
Cuando la decisión es rechazar la Ho en el análisis de varianza, es necesario ver cuales tratamientos son
diferentes
La diferencia de los métodos es la potencia para detectar las diferencias entre las medias
DIFERENCIA MÍNIMA SIGNIFICATIVA
1. Planteamiento de hipótesis
𝐻𝑜: 𝑢1 = 𝑢2
𝐻1 : 𝑢1 ≠ 𝑢2
Gl = (𝑛1 + 𝑛2 − 2) = (2 ∗ 𝑛𝑗 − 2)
Si tengo dos grupos a comparar. Entonces F=2* t (ver Webster pg. 285), por ejm: si tengo 4 tratamientos y cada
uno con 7 réplicas, entonces para la distribución F tiene 1 gl del numerador y del denominador (n- a) 28-4=24
𝐹𝛼,1,𝑁−𝑎 mientras que los gl de t =14-2 𝑡𝛼∕2,𝑣
MÉTODO DE TUKEY
Esta prueba fue desarrollada por John W. Tukey. El método de Tukey se utiliza en ANOVA
La prueba de Tukey es similar a una prueba t de Student en cuanto a que se calcula una única diferencia
crítica para realizar todas las comparaciones entre las medias; sin embargo, es también similar a la prueba
de Duncan y de Newman-Keuls en cuanto a que el valor de esta diferencia crítica depende del número de
comparaciones que se haga.
Es un método más conservador para comparar pares de medias de tratamientos.
Cuando utilizar el método de Tukey
• Solo se debe usar después que se ha rechazado la hipótesis nula en el análisis de varianza
• Cuando el tamaño de las muestras seleccionadas para cada grupo es igual
• Cuando el interés fundamental es comparar promedios entre dos grupos y son múltiples las
comparaciones que estemos haciendo
• La prueba de Tukey es la prueba más aplicada y preferida por los estadísticos pues controla de
mejor manera los errores ampliamente conocidos en la estadística
Planteamiento de hipótesis
𝐻𝑜: 𝑢1 = 𝑢2
𝐻1 : 𝑢1 ≠ 𝑢2
1. Planteamiento de hipótesis
Si se tiene los siguientes tratamientos: µ1, µ2, µ3, µ4
Ho: Coeficiente ortogonal
λ1 λ2 λ3 λ4 ∑λj
Comparación con 2 tratamientos
(µ1 - µ2) = 0 µ1 = µ2 1 -1 0 0 0
(µ1 - µ3) = 0 µ1 = µ3 1 0 -1 0 0
(µ2- µ3) = 0 µ2 = µ3 0 1 -1 0 0
Comparación con 3 tratamientos λ1 λ2 λ3 λ4 ∑λj
(µ1 + µ2)/2 - µ3 = 0 µ1 + µ2 - 2 µ3 = 0 * 1 1 -2 0 0
(µ1 + µ3)/2 - µ2 = 0 µ1 -2µ2+ µ3 = 0 1 -2 1 0 0
(µ2 + µ3)/2 - µ1 = 0 - 2 µ1 µ2 + µ3 = 0 -2 1 1 0 0
Comparación con 4 tratamientos λ1 λ2 λ3 λ4 ∑λj
(µ1 + µ2+ µ3)/3 - µ4 = 0 µ1 + µ2+ µ3 - 3µ4 = 0 1 1 1 -3 0
(µ1 + µ3+ µ4)/3 - µ2 = 0 µ1 + µ3+ µ4 -3 µ2 = 0 1 -3 1 1 0
(µ1 + µ2+ µ3)/3 - µ4 = 0 µ1 + µ2+ µ3 - 3 µ4 = 0 1 1 1 -3 0
(µ1 + µ2)/2 - (µ3+ µ4)/2 = 0 µ1 + µ2- µ3 - µ4 = 0 1 1 -1 -1 0
(µ1 + µ3)/2 - (µ2 + µ4)/2 = 0 µ1 + µ3- µ2 - µ4 = 0 1 -1 1 -1 0
(µ1 + µ4)/2 - (µ2 + µ3)/2 = 0 µ1 + µ4- µ2 - µ3 = 0 1 -1 -1 1 0
𝝀𝟏 𝟐 𝝀𝟐 𝟐 𝝀𝟑 𝟐 𝝀𝒂 𝟐
√
𝝈𝑳 = 𝝈 ∗ ( + + + ⋯+ )
𝒏𝟏 𝒏𝟐 𝒏𝟑 𝒏𝒂
𝝈 = √𝑪𝑴𝑹
| tc | ≥ t α/2, v
Los grados de libertad se considera las corridas menos los tratamientos (gl=N-K)
Los contrastes ortogonales pueden ser calculados con la distribución F, particionando la SCE, como se
señala más adelante
VERIFICACION DE SUPUESTOS
En resumen, mediante el ANOVA analizamos los datos experimentales comparando las respuestas medias en los
distintos tratamientos y en caso de detectar diferencias significativas procedemos a un análisis más detallado basado
en comparaciones por parejas u otros contrastes. Todos estos procedimientos estadísticos se basan en la suposición
que los datos se ajustan al modelo (Oehlert, 2010)
X ij =µ+αj +εij
Para comprobar cada supuesto existen pruebas analíticas y gráficas. Las pruebas gráficas no son “exactas”,
pero, aun así, en la mayoría de las situaciones prácticas proporcionan la evidencia suficiente en contra o
a favor de los supuestos. El uso de las pruebas gráficas requiere una fuerte evidencia visual para concluir
que el supuesto en cuestión no se cumple, ya que se requiere que la evidencia en contra de un supuesto
esta soportada por más de dos puntos. Cuando son uno o dos los puntos que se salen del comportamiento
esperado de las gráficas se pueden tratar de un problema de puntos aberrantes, no de violación del
supuesto en cuestión. En ese caso debe investigarse la obtención de dichas mediciones atípicas, ya que
ese tipo de puntos pueden afectar sensiblemente los resultados del análisis. (Gutiérrez Pulido & De la
Vara Salazar, 2012)
Se puede utilizar una prueba analítica para subsanar las ambigüedades que surjan en la interpretación
visual (subjetiva) de las gráficas.
Los supuestos del modelo lineal en términos de los residuos 𝑒𝑖𝑗 son:
• Los 𝑒𝑖𝑗 siguen una distribución normal con media 0
• Los 𝑒𝑖𝑗 son independientes entre sí
• Los 𝑒𝑖𝑗 de cada tratamiento tienen la misma varianza
Los residuos 𝑒𝑖𝑗 vienen dados por la diferencia entre el valor observado 𝑦𝑖𝑗 y el valor ajustado o predicho
(media del tratamiento 𝑢𝑖 ) según el modelo para dicha observación.
En caso que alguno de los supuestos como: normalidad, homogeneidad de varianzas o independencia de
los términos de error de cada observación, no se cumplan, impactaran sobre la distribución del estadístico
F y con ello el verdadero nivel de significancia de la prueba de hipótesis del ANOVA, afectando así la
calidad de las conclusiones que finalmente obtendremos. Por ello, resulta importante verificar que los
supuestos del análisis se cumplen antes de elaborar conclusiones.
PRUEBA DE NORMALIDAD
- Prueba de Chi-Cuadrado para bondad y ajuste
- Prueba de Shapiro-Wilks (no paramétrica, libre distribución, observaciones< 50)
- Prueba Kolmogorov-Smirnov (observaciones >50)
- Prueba Anderson-Darling
- Prueba de Jarque Bera
La normalidad se prueba con valores observados sin embargo es más eficaz con residuales.
“Desafortunadamente cuando se trabaja con muestras pequeñas, suelen ocurrir fluctuaciones
significativas, por lo que la aparición de una desviación moderada de la normalidad no implica
necesariamente una violación seria de los supuestos” (Montgomery, 2004)
Prueba de Shapiro-Wilks
1)Planteamiento de hipótesis
𝑯𝟎 : 𝒍𝒂 𝒅𝒊𝒔𝒕𝒓𝒊𝒃𝒖𝒄𝒊ó𝒏 𝒅𝒆 𝒅𝒂𝒕𝒐𝒔 𝒕𝒊𝒆𝒏𝒅𝒆𝒏 𝒂 𝒖𝒏𝒂 𝒏𝒐𝒓𝒎𝒂𝒍 (F(x) es normal)
𝑯𝟏 : 𝒍𝒂 𝒅𝒊𝒔𝒕𝒓𝒊𝒃𝒖𝒄𝒊ó𝒏 𝒅𝒆 𝒅𝒂𝒕𝒐𝒔 𝒏𝒐 𝒕𝒊𝒆𝒏𝒅𝒆 𝒂 𝒖𝒏𝒂 𝒏𝒐𝒓𝒎𝒂𝒍 (𝑭(𝒙) 𝒏𝒐 𝒆𝒔 𝒏𝒐𝒓𝒎𝒂𝒍)
2)
1 2
𝑊𝑐 = [∑ 𝑎 𝑖 (𝑥(𝑛−𝑖+1) − 𝑥𝑖 )]
(𝑛 − 1)𝑆 2
Nota: varianza muestral y datos ordenados
3) 𝑺𝒊 𝑾𝒄 ≤ 𝑾𝟏−∝,𝒏 → 𝑨𝒄𝒆𝒑𝒕𝒂 𝑯𝟎
𝑺𝒊 𝑾𝒄 ≤ 𝑾∝,𝒏 → 𝑹𝒆𝒄𝒉𝒂𝒛𝒂 𝑯𝟎
Análisis gráfico
1. Se ordena los valores observado o residuos
2. Calcular una posición de graficación para cada dato en función de su rango y del total de
observaciones (i-0.5)/N
3. Se gráfica, eje x los valor observado o residuos (los ordenados), eje y (i-0.5)/N o Z
Solución:
Variable respuesta= resistencia a la tensión
Factor= peso porcentual de algodón
Unidad experimental= algodón de una fibra sintética, tela para camisa de caballero
Prueba de Shapiro-Wilks
Resistencia
ai
(ordenados)
7 0,445 18 8,01
7 0,3069 16 4,9104
7 0,2543 15 3,8145
9 0,2148 10 2,148
10 0,1822 9 1,6398
11 0,1539 8 1,2312
11 0,1283 8 1,0264
11 0,1046 7 0,7322
12 0,0823 6 0,4938
12 0,061 6 0,366
14 0,0403 4 0,1612
15 0,02 2 0,04
15 0 0
17 24,5735
18
18
18 Wc= 0,94802955
18 Wt= 0,918
19 Aho
19
19
19
22
23
25
Análisis gráfico
𝑒𝑖𝑗 =𝑦𝑖𝑗 − µ =𝑦𝑖𝑗 -15
Peso porcentual 𝑒𝑖𝑗
Totales
del algodón 1 2 3 4 5
15 -8 -8 0 -4 -6 -26
20 -3 2 -3 3 3 2
25 -1 3 3 4 4 13
30 4 10 7 4 8 33
35 -8 -5 -4 0 -4 -21
P Z
Residual (ordenado) i (orden) (i-0,5)/25 N(0,1)
-8 1 0,02 -2,05
-8 2 0,06 -1,55
-8 3 0,1 -1,28
-6 4 0,14 -1,08
-5 5 0,18 -0,92
-4 6 0,22 -0,77
-4 7 0,26 -0,64
-4 8 0,3 -0,52
-3 9 0,34 -0,41
-3 10 0,38 -0,31
-1 11 0,42 -0,20
0 12 0,46 -0,10
0 13 0,5 0,00
2 14 0,54 0,10
3 15 0,58 0,20
3 16 0,62 0,31
3 17 0,66 0,41
3 18 0,7 0,52
4 19 0,74 0,64
4 20 0,78 0,77
4 21 0,82 0,92
4 22 0,86 1,08
7 23 0,9 1,28
8 24 0,94 1,55
10 25 0,98 2,05
Gráfico 1
Gráfica de probabilidad normal de los
residuos
1.2
1
0.8
(i-0,5)/n
0.6
0.4
0.2
0
-10 -5 0 5 10 15
xi (resistencia)
Gráfico 2
Grafica de probabilidad (z)
3
0
Z
-10 -5 0 5 10 15
-1
-2
-3
xi (resistencia)
La presencia de ligeras violaciones de este supuesto (normalidad) no resulta grave para el ANOVA, ya que
no afecta de forma importante la probabilidad de cometer Error de Tipo I.
𝑘 = 𝑁º 𝑑𝑒 𝑡𝑟𝑎𝑡𝑎𝑚𝑖𝑒𝑛𝑡𝑜
Si 0.2779 <0.544 AHo. Existe igualad de varianzas, las varianzas de todos los tratamientos son iguales
Análisis gráfico
Residuos
Xi Predichos (por
tratamiento)
7 9,8 -2,8
7 9,8 -2,8
15 9,8 5,2
11 9,8 1,2
9 9,8 -0,8
12 15,4 -3,4
17 15,4 1,6
12 15,4 -3,4
18 15,4 2,6
18 15,4 2,6
14 17,6 -3,6
18 17,6 0,4
18 17,6 0,4
19 17,6 1,4
19 17,6 1,4
19 21,6 -2,6
25 21,6 3,4
22 21,6 0,4
19 21,6 -2,6
23 21,6 1,4
7 10,8 -3,8
10 10,8 -0,8
11 10,8 0,2
15 10,8 4,2
11 10,8 0,2
Predichos vs residuos
6
5
4
3
2
1
0
-1 0 5 10 15 20 25
-2
-3
-4
-5
Si los puntos en esta gráfica se distribuyen de manera aleatoria en una banda horizontal (sin ningún patrón
claro y contundente), entonces es señal de que se cumple el supuesto de que los tratamientos tienen igual
varianza
Este tipo de gráficos de residuos aparecerán tiras verticales de puntos, por cada nivel, si la varianza es
constante la extensión de las tiras será aproximadamente igual, caso contrario aparecerá un patrón en la
dispersión vertical de los residuos y cuando no se cumple el supuesto de varianza constantes el gráfico de
residuos muestra una forma de embudo.
ALEATORIEDAD
La no aleatoriedad de la selección de la muestra puede reflejarse en la falta de independencia de los ítems,
heterogeneidad de las varianzas, o en la no normalidad de la distribución.
ADITIVIDAD
Si la interacción está realmente presente entonces la prueba F será muy ineficaz y posiblemente induzca
a error si el efecto de la interacción es muy grande. Una verificación de este supuesto requiere o bien más
de una sola observación por casilla.
La aditividad se refiere a que cada variable independiente por sí sola, suma a la explicación de la variable
dependiente. En otras palabras, no hay relación entre las variables independientes.
La aditividad en las varianzas supone que la variación total en los datos puede ser expresada como suma
de variaciones procedentes de fuentes diversas:
(Variación total en los datos) = (Variación debida al primer factor) + (Variación debida al segundo factor)
+ (Variación debida al error aleatorio)
Para verificar el cumplimiento del supuesto de independencia se realiza un gráfico del orden de la corrida
(eje x) vs residuos (eje y), si el comportamiento de los puntos es aleatorio dentro de una banda horizontal,
el supuesto se está cumpliendo. Una prueba analítica para verificar la independencia entre residuos
consecutivos es la prueba de Durbin –Watson
Residuos
Xi Orden por
tratamiento
7 15 -2,8
7 19 -2,8
15 25 5,2
11 12 1,2
9 6 -0,8
12 8 -3,4
17 14 1,6
12 1 -3,4
18 11 2,6
18 3 2,6
14 18 -3,6
18 13 0,4
18 20 0,4
19 7 1,4
19 9 1,4
19 22 -2,6
25 5 3,4
22 2 0,4
19 24 -2,6
23 10 1,4
7 17 -3,8
10 21 -0,8
11 4 0,2
15 16 4,2
11 23 0,2
- Planteamiento de hipótesis:
Ho: No existe autocorrelación entre los residuos. Los residuos son independientes
Ha: Existe correlación entre los residuos. Los residuos no son independientes
Corrigiendo la no normalidad
El aumentar la muestra puede corregir el problema de no normalidad
Cabe señalar que “Desvíos moderados a la falta de normalidad no afectan los resultados de las
estadísticas t y F” (Melo et al., 2020)”
La no normalidad, sobre todo debida a la asimetría, a veces puede ser disminuida mediante la
transformación de la variable respuesta a una escala diferente. La asimetría hacia la derecha se
ve reducida (disminuye valores grandes) por √𝑦, 4√𝑦, ln y, 1/y, u otra transformación a una
potencia menor que uno, mientras que la asimetría a la izquierda se ve reducida (aumentan
valores pequeños) por un 𝑦 2, 𝑦 3u otra transformación a una potencia mayor que uno.(Oehlert,
2010), (Melo et al., 2020)
Existen trabajos teóricos que tratan el problema de escoger las transformaciones, pero no existen
métodos prácticos que indiquen la transformación adecuada. (Melo et al., 2020)
Transformar significa un cambio de métrica de la variable original por una medida en otra escala
Transformación de Box-Cox
Esta transformación permite estabilizar la varianza y corregir el problema de no normalidad
(Melo et al., 2020)
Cuando no tenemos una distribución con una transformación conocida para la estabilización de
la varianza, entonces por lo general se ensaya una familia de transformaciones de potencia.
El método de Box-Cox establece un procedimiento para determinar a partir de los datos, la
transformación de potencia (busca la mejor función para obtener el λ óptimo). La familia de
transformaciones de Box-Cox vienen dadas por
La técnica de Box-Cox transforma los datos (variable respuesta) explorando un rango de valores
de λ y realizando un ANOVA para cada transformación (es decir, para cada valor de λ). En cada
ANOVA obtenemos una suma de cuadrados del error (SCE) que dependerá de la λ usada, SCE (λ).
La mejor transformación λ será aquella para la cual el SCE (λ) alcanza el mínimo valor (Oehlert,
2010), (Montgomery, 2004)
Según Melo (2020), se menciona que los modelos robustos para hacer transformaciones, es
analizar los datos con modelos lineales generalizados (MLG) y modelos con presencia de sobre
dispersión (MS), en el libro de Melo, Montgomery, se aborda de forma general estas técnicas
Continuar con el ejercicio inicial, que, aunque aceptamos la constancia de varianzas, para
implementar la técnica Box-Cox vamos a utiliza en estos datos
Cabe indicar que estos métodos podrían ser motivo de otro curso
Se recomienda buscar la técnica adecuada que es mejor que forzar los datos para que se ajusten
a utilizar un ANOVA
TAMAÑO DE LA MUESTRA
El tamaño de muestra difiere si se quiere hacer estimaciones (inferencia) o se requiere para un
contraste (pruebas de hipótesis). La estimación aproxima a un parámetro de una población,
mientras que la prueba de hipótesis permite medir un efecto. De manera que la muestra para un
contraste debe basarse en el tamaño del efecto
Poblaciones infinitas
𝑍𝛼2⁄ (𝑝 ∗ 𝑞) 𝑍𝛼2⁄ 𝜎 2
2 2
𝑛= ;𝑛 =
𝑒2 𝑒2
Cabe señalar que las fórmulas que se podrían utilizar para calcular el tamaño de muestra,
necesitan que ciertas cantidades se conozcan a priori, como la varianza, para esto puede
adoptarse la estrategia de que, a partir de un estudio piloto, asignarse los valores estimados para
estos parámetros.
Ejm: No queremos saber el número de plantas necesarias para estimar la altura media, si no cual es el
tamaño de la muestra necesario para detectar un efecto en la altura de la planta debido a los tratamientos
Potencia de un contraste
El objetivo es contrastar la hipótesis de que los efectos de los distintos tratamientos son iguales,
frente a la alternativa de que algunos no lo son, se expresa como
𝐻0 : 𝛼1 = · · · = 𝛼𝑎 = 0
ya que imponemos la restricción
𝑎
∑ 𝛼𝑖 = 0
𝑖=1
E implica que los 𝛼𝑖 son todos iguales a 0
Como sabemos, al realizar un contraste podemos cometer un error de tipo I con probabilidad
α= P [Rechazar 𝐻0 |𝐻0 es cierta]
o un error de tipo II si
β= P [Aceptar 𝐻0 |𝐻𝐴 es cierta] o no rechazar la Ho cuando es falsa
La técnica desarrollada en la teoría estadística para decidir sobre el número de réplicas necesarias
en un experimento es el cálculo de la potencia de las pruebas estadísticas de interés. En la prueba
F del ANOVA a una vía, el cálculo directo de la potencia es generalmente complejo, pero se han
construido algunas gráficas, llamadas curvas características de operación, que permiten estimar
un valor para la probabilidad β o error de tipo II. La potencia 1-β se deduce a partir de esta
probabilidad.
es, por tanto, la probabilidad complementaria al error del tipo II, es la probabilidad de no cometer
un error tipo II. Diversos autores mencionan que la potencia mínima aceptada es del 80% (1-
β=0.2), esto quiere decir que existe un 80% de probabilidad de rechazar correctamente la H0,
por tanto, β=0.2, indica que el 20% restante de las veces el error de muestreo hará que no se
rechace la Ho cuando esta es falsa
Se trata de construir contrastes que tengan un nivel de significación fijo que controle α y una
potencia máxima (es decir un error tipo II pequeño).
En este marco queremos calcular la potencia del test F en el caso de efectos fijos, que son
estudiados hasta el momento:
1 − β = P [Fc > Fα(a − 1,n − a)| 𝐻𝐴 es cierta]
Depende de los tamaños muestrales (ni), del número de tratamientos (a), del nivel de
significancia (), y de la varianza del error (𝜎 2 )
Existen curvas de operación características para calcular n, ver libro Montgomery página 41 (para
dos grupos). Existen dos métodos para calcular la potencia: uno consiste en utilizar tablas de
potencia (tabla D10. O página 155 del Libro de Oelther), sin embargo, tienen la limitación de no
ser precisas o no hay la tabla con esas referencias. En la actualidad, podemos usar la función
pwr.anova.test del paquete pwr de R o la función power.anova.test, (entre otros) para hallar
la potencia del test anova. La primera necesita 𝜙 y la segunda . A continuación, veamos un
ejemplo en el que aplicaremos los conceptos anteriores.
REPLICACIÓN
Ya logrado determinar el tamaño de la muestra, esto nos servirá para determinar el número de
réplicas
𝑛
𝑹é𝒑𝒍𝒊𝒄𝒂𝒔 =
𝑡𝑟𝑎𝑡𝑎𝑚𝑖𝑒𝑛𝑡𝑜𝑠
También se considera cuando los niveles de prueba utilizados en un factor son una muestra
aleatoria de la población de niveles para ese factor.
Es importante que el experimentador sea capaz de hacer inferencias acerca de una población de
tratamientos a través de un experimento en el que los tratamientos empleados se elijan al azar
de entre la población. Evidentemente se utilizan estos factores cuando tienen un número muy
grande de niveles y no es razonable o posible trabajar con todos ellos. En este caso se está
interesado en examinar la variabilidad de la respuesta debida a la población entera de niveles del
factor.
Ejemplo: una cadena de hipermercados que tiene en plantilla 300 trabajadores de caja está
interesada en estudiar la influencia del factor trabajador en la variable tiempo en el cobro a un
cliente (Marin, 2015).
Suponga que se tiene un factor denominado operador y que este tiene 3 niveles, si se selecciona
intencionalmente estos 3 operadores y desean que los resultados se apliquen únicamente a estos
operarios, el factor es fijo. Si se toma una muestra aleatoria de 3 operadores en un número más
grande de operadores y se desea que sus resultados se apliquen a todos los operadores, el factor
es aleatorio.
Se prueban hipótesis acerca de las varianzas de los tratamientos.
Ho: 𝜎A2 = 0, No existe variabilidad
H1: 𝜎A2 > 0, Existe variabilidad entre los tratamientos
Así pues, los pasos que hay que seguir para conformar la muestra es:
1. Definir grupos (Bloque) en la población de estudio: por ejemplo, grupos de edad (>30, 30-40,
50-60, 60-70, >70), tamaño, sexo, etc
2. Seleccionar n individuos para cada grupo o bloque.
3. Asignar al azar cada uno de los a tratamientos (por ejemplo “A”, “B” y “C”) a los n individuos
escogidos de cada bloque.
El diseño ANOVA 2 vías, permite estudiar simultáneamente los efectos de dos fuentes de
variación, variación debido al primer factor y variación debido a un segundo factor. Se trabaja
con dos factores, llamados tratamientos y bloques, cada uno con n niveles
Los bloques se forman con el objetivo de que las unidades experimentales al interior de ellos,
sean lo más homogéneas posibles, lo que permite disminuir el error experimentar, o sea, reducir
la variabilidad residual y obtener un diseño más eficiente para detectar diferencias entre
tratamientos. Lo que se busca es formar bloques de unidades con valores similares para
los factores y los tratamientos del experimento se pueden comparar entre sí en un entorno
más homogéneo
Xij = µ + αi + βj + εij
Donde:
Xij = Valor de la variable respuesta
µ = Es el promedio general o promedio poblacional
αi = Es el efecto del i-ésimo tratamiento
βj = Es el efecto del j-ésimo bloque o repetición.
εij = Es el error o valor residual del i-ésimo tratamiento y del j-ésimo bloque o
repetición, que se considera es independiente de observación a
observación y está normalmente distribuido con valor esperado igual a
cero y varianza igual a σ2 , Ν (0,σ2).
Restricción: ∑αi = ∑βj = 0.
Representación de datos
TRATAMIENTOS
B1 B2 Bj Bb ∑ Xi•
/BLOQUES
T1 X11 X12 X1j X1b X1•
T2 X21 X22 X2j X2b X2•
Ti Xi1 Xi2 Xij Xib Xi•
Ta Xa1 Xa2 Xaj Xab Xa•
∑ X•j X•1 X•2 X•j X•b X••
Fórmulas de cálculo:
FC = (Σ Xij)2/ab
SCT = Σ X2ij - FC
SCE =Σ (( ΣXi•)2 / b) - FC
SCB = Σ (( ΣX•j)2 / a) - FC
SCR = SCT – SCE – SCB
PRUEBA DE HIPÓTESIS
1. Formulación de la Hipótesis:
Tratamientos
H0: αi = 0 H0 :u1=u2=u3=……..=ui
HA: αi ≠ 0 HA : u1≠u2≠u3≠……..≠ui
Bloques
H0: βj = 0
HA : β j ≠ 0
2. Determinación de la estadística de prueba
Tratamientos: Fc = CME / CMR
Bloques: Fc = CMB / CMR
3. Criterio de Decisión
Rechazar la H0 si : Fc ≥ Fα/2,v1,v2 Tratamientos
Rechazar la H0 si : Fc ≥ Fα/2,v1,v2 Bloques
Ejemplo resuelto:
En un experimento se estudió el proceso de maduración del aguacate (medido en día). El
propósito del experimento es conocer el efecto que tienen las diferentes técnicas sobre la
maduración de los diferentes aguacates. Los factores son: tipo de aguacate con dos niveles
(guatemalteco y criollo) y técnicas de maduración con tres niveles (aire libre, bolsa de papel
kraft, recipiente plástico), se obtuvo los siguientes resultados. Construya una anova 2 vías y
pruebe cuales son los factores significativos
Técnica de maduración (B)
Dentro de
Dentro de un
Tipo de Aire una bolsa
recipiente
Aguacate(A) libre de papel
plástico
Kraft
Guatemalteco 6 3 4
Criollo 4 2 4
ANÁLISIS DE VARIANZA
FV SC GL CM Fc Valor p Ft
Tipo de
aguacate 1,5000 1,0000 1,5000 3,0000 0,2254 18,5128
Maduración 6,3333 2,0000 3,1667 6,3333 0,1364 19,0000
Error 1,0000 2,0000 0,5000
Total 8,8333 5,0000
Solución:
Formulación de la Hipótesis:
Filas
H0: µ1 = µ2 No existe diferencia significativa en la maduración promedio del aguacate ,
debido si es aguacate guatemalteco o criollo
HA: µ1 ≠ µ2 Existe diferencia significativa en la maduración promedio del aguacate, debido
si es aguacate guatemalteco o criollo
Columnas
H0: µ1 = µ2 = µ3 No existe diferencia significativa en la maduración promedio del aguacate
, debido a las técnicas de maduración
HA: µ1 ≠ µ2 ≠ µ3 Existe diferencia significativa en la maduración promedio del aguacate ,
debido a las técnicas de maduración
Criterio de Decisión
Rechazar la H0 si : Fc ≥ Fα,v1,v2
Filas
3> F 0,05 ; 2, 9
3> 18,5128 Aho
Columnas
3> F 0,05 ; 2, 9
6,3334> 19 Aho
Filas
P-valor: Rechazo la Ho, el p-valor es menor al nivel de significancia (0,05)
0,2254 > 0,05 Aho
Columnas
0,1364 > 0,05 Aho
Ejercicio resuelto:
Una empresa agrícola quiere saber si la cantidad de agua y el tipo de terreno influyen en el
crecimiento de las semillas en su periodo de germinación. Para ello se utilizó semilla de lenteja
en donde la cantidad de gua fueron de (2, 4 y6) ml, el tipo de terreno fue de (tierra y algodón).
Realizar un análisis de varianzas
Lo resultados en 15 días del crecimiento del tallo de las semillas fueron de:
cant_agua/ terreno Tierra Algodón
Solución:
ANÁLISIS DE VARIANZA
FV SC GL CM Fc Valor p Ft
Cantidad de agua
13,1233333 2 6,56166667 14,1111111 0,06617647 19
Terreno 3,84 1 3,84 8,25806452 0,10276455 18,5128205
Error 0,93 2 0,465
Total 17,8933333 5
Formulación de la Hipótesis:
Filas
H0 : µ1 = µ2 = µ3 No existe diferencia significativa en el crecimiento promedio de la semilla
, debido a la cantidad de agua
HA : µ1 ≠ µ2 ≠ µ3 No existe diferencia significativa en el crecimiento promedio de la semilla
, debido a la cantidad de agua
Columnas
H0 : µ1 = µ2 No existe diferencia significativa en el crecimiento promedio de la semilla ,
debido al tipo de terreno
HA : µ1 ≠ µ2 Existe diferencia significativa en el crecimiento promedio de la semilla, debido
al tipo de terreno
Criterio de Decisión
Rechazar la H0 si : Fc ≥ Fα,v1,v2
Filas
14,1111 < F 0,05 ; 2, 9
14,1111 <18,5128 Aho
Columnas
8,258 < F 0,05 ; 2, 9
8,258 < 18,5128 Aho
Filas
P-valor: Rechazo la Ho, el p-valor es menor al nivel de significancia (0,05)
0,0662 > 0,05 Aho
Columnas
0,1028 > 0,05 Aho
Restricción: ∑ λi = 0
Para que dos o más funciones lineales formen parte independiente o sean componentes
independientes de la suma de cuadrados de tratamientos, es indispensable que éstas sean
mutuamente ortogonales.
Por lo tanto, si dos comparaciones son mutuamente ortogonales, sus contribuciones son partes
independientes de la suma de cuadrados de tratamientos o bloques.
Si las comparaciones de L1 , L2 , L3 , ... La-1 son mutuamente ortogonales, entonces, sus
contribuciones son componentes individuales de la suma de cuadrados de tratamientos, entonces:
Por lo tanto, si dos comparaciones son ortogonales, sus contribuciones son partes independientes
de la suma de cuadrados de tratamientos o bloques, cada una con un grado de libertad.
MODELO MATEMÁTICO
El modelo matemático del diseño es:
Xijk = µ + αi + βj + Iij + εijk
Xijk = Valor de la variable respuesta correspondiente en el iésimo tratamiento del j-
ésimo bloque.
µ = Es el promedio general o promedio poblacional
αi = Es el efecto del i-ésimo tratamiento
Las formulaciones de cálculo para las sumas de cuadrados son las siguientes:
FC = (Σ Xijk)2/abc
SCT = Σ X2ijk - FC
SCE = Σ(Σ Xi••)2 / bc) - FC
SCB = Σ(Σ X•j•)2 / ac) - FC
SCI = (Σ (ΣXij• )2/ c) – FC) – (SCE + SCB)
SCR = SCT – (SCE + SCB +SCI)
PRUEBAS DE HIPÓTESIS
A diferencia del diseño a dos criterios con una observación, en este diseño se analiza la interacción
entre los factores, de manera que la hipótesis adicional a las anteriores es:
H0 : Iij = 0 , La interacción no tiene efecto significativo en la variable
respuesta. No existe interacción entre factores. Existe independientes
HA : Iij ≠ 0 La interacción tiene efecto significativo en la variable
respuesta. Existe interacción entre factores. Existe dependientes
El nombre de cuadrado latino se deriva del hecho que se forma un arreglo cuadrado (matriz cuadrada),
donde el factor principal, y los dos de bloqueo deben tener igual número de niveles, las letras latinas
representan los niveles del factor principal, mientras que las filas y columnas los niveles de los factores de
bloqueo
El DCL optimiza el modelo, reduciendo el número de unidades experimentales. La principal restricción es
que no se puede calcular interacciones.
El número de tratamientos K=a determina el número de filas y de columnas, los tratamientos se denotan
con letras latinas mayúsculas, el número de ensayos es K 2
Se recomienda DCL de dimensiones: 4*4 hasta 7*7. Debe cumplirse la regla que cada letra debe aparecer
solo una vez en cada fila y columna. Si la primera columna y primera fila aparecen las letras en orden
alfabético, se tiene un cuadro latino estándar ejm:
A B C D
B C D A
C D A B
D A B C
En el DCL se controlan dos factores de bloque y se estudia un factor tratamiento, por lo tanto, se tiene 4
fuentes de variabilidad que puede afectar la respuesta observada, estos son: tratamientos, el factor
bloque I (columnas), el factor bloque II (filas) y el error aleatorio. Cabe señalar que no hay interacciones
entre filas, columnas y tratamientos, puesto que hay una sola observación por cada celda, de manera que
cada tratamiento aparece una vez exactamente en cada fila y columna
MODELO MATEMÁTICO
La función matemática del modelo cuadrado latino, efectos fijos es:
Xijk = µ + αi + βj + γk + εij k
Donde:
Xijk = Valor de la variable respuesta correspondiente al i ésimo nivel del factor fila, al j-
ésimo nivel del factor columna y al k-ésimo tratamiento.
µ = Es el promedio general o promedio global
αi = Es el efecto del i-ésimo nivel del factor fila
βj = Es el efecto del j-ésimo nivel del factor columna.
γk = Es el efecto del k-ésimo tratamiento.
εijk = Es el error o valor residual del k-ésimo tratamiento, del i-ésimo factor fila y del j-
ésimo factor columna, que se considera es independiente de observación a observación y
está normalmente distribuido con valor esperado igual a cero y varianza igual a σ2, Ν (0, σ2).
El modelo postula además que: ∑αi = ∑βj = ∑γk = 0.
Las formulaciones de cálculo para las sumas de cuadrados son las siguientes:
FC = (Σ Xijk)2/a2
SCT = Σ X2ijk - FC
SCF = Σ((Σ Xi••)2 / a) - FC
SCC = Σ((ΣX•j•)2 / a) - FC
SCE = Σ((ΣX••k)2 / a) - FC
SCR = SCT – (SCF + SCC+ SCE)
Fila/Columna C1 C2 C3 C4
Sumatorias
F1 A B C D X1..
F2 B C D A X2..
F3 C D A B X3..
F4 D A B C Xi..
Sumatorias X.1. X.2. X.3. X.j. X…
SumasTratamientos X..A X..B X..C X..D X..K
PRUEBA DE HIPÓTESIS
1. Formulación de la Hipótesis:
Factor fila
H0: αi = 0
HA: αi ≠ 0
Factor columna
H0: βj = 0
HA : β j ≠ 0
Factor tratamiento
H0: γk = 0
HA : γ k ≠ 0
2. Determinación de la estadística de prueba
3. Criterio de Decisión
Rechazar la H0 si : Fc ≥ Fα/2,v1,v2 Filas
Rechazar la H0 si : Fc ≥ Fα/2,v1,v2 Columnas
Rechazar la H0 si : Fc ≥ Fα/2,v1,v2 Tratamientos
Ejercicio resuelto
Un ingeniero investigador estudió la eficiencia en tiempo de cuatro métodos de fabricación (A,…D) de un
componente electrónico, se eligieron cuatro técnicos para el estudio, pero como el proceso de fabricación
produce fatiga de manera que el tiempo requerido por el técnico aumenta al cambiar de un método a
otro sin importar el orden, el ingeniero utilizó un diseño de cuadrado latino con los técnicos en las
columnas, los periodos en los renglones. Los métodos de fabricación se asignaron al azar a los técnicos.
Los valores son los tiempos de fabricación en minutos requeridos para el componente. Se pide analizar
los datos con un nivel de significancia del cinco por ciento.
Período de Técnico
tiempo T1 T2 T3 T4
P1 C D A B
90 96 84 88
P2 B C D A
90 91 96 88
P3 A B C D
89 97 98 98
P4 D A B C
104 100 104 106
CARACTERÍSTICAS:
➢ Factores: Periodo de tiempo, Técnico y Métodos de fabricación
➢ Filas: Periodos de tiempo P1,..P4
➢ Columna: Técnicos T1,.T4
➢ Letra Latina: Métodos de fabricación A,…, D
➢ Unidad experimental: Componente electrónico
➢ Variable respuesta: Tiempos de fabricación en minutos
➢ Nivel de significancia: 0.05
➢ Modelo matemático: 𝑋𝑖𝑗𝑘 = 𝑢 +∝𝑖 + 𝛽𝑗 + 𝑌𝑘 + 𝐸𝑖𝑗𝑘
Formulación de hipótesis
Periodo de tiempo
H0 : αi = 0 No existe diferencia significativa en el tiempo promedio de fabricación en minutos de
los componentes electrónicos debido a los diferentes periodos de tiempo.
Técnico
Métodos de fabricación
5. Decisión
Periodo de tiempo
➢ Como 40.85 > 4.76 se rechaza la hipótesis nula H0
Con un nivel de significancia del 5% se puede concluir que existe diferencia significativa en el tiempo
promedio de fabricación en minutos de los componentes electrónicos debido a los diferentes periodos de
tiempo.
Técnico
➢ Como 1.5 < 4.76 se acepta la hipótesis nula H0
Con un nivel de significancia del 5% se puede concluir que no existe diferencia significativa en el tiempo
de fabricación en minutos de los componentes electrónicos debido a los diferentes técnicos que realizan
el experimento.
Métodos de fabricación
➢ Como 12.74 > 4.76 se rechaza la hipótesis nula H0
Con un nivel de significancia del 5% se puede concluir que existe diferencia significativa en el tiempo
promedios de fabricación en minutos de los componentes electrónicos debido a los diferentes métodos
de fabricación.
Se llama cuadro grecolatino porque los cuatro factores involucrados se prueban en la misma cantidad de
niveles formando una matriz cuadrada, se utilizan letras latinas para denotar a los tratamientos y letras
griegas para nombrar a los niveles del tercer factor de bloque. Al igual que en el DCL cada letra latina y
griega debe aparecer sólo una vez en cada fila y en cada columna, y cada par de letras debe aparecer sólo
una vez en todo el arreglo
El DCGL controla tres factores de bloque y se estudia un factor tratamiento, por lo tanto, se tiene cinco
fuentes de variabilidad que puede afectar la respuesta observada, estos son: tratamientos, el factor
bloque I (columnas), el factor bloque II (filas), el factor bloque III (letras griegas) y el error aleatorio
Entonces la variabilidad total se descompone en: SCT=SCF+SCC+SCE+SCG+SCR.
El análisis de varianza es muy parecido al de un DCL. Se recomienda cuadrados grecolatinos para todo K
≥ 3, excepto K=6
MODELO MATEMÁTICO
La función matemática del modelo cuadrado greco latino de efectos fijos es:
Xijkl = µ + αi + βj + γk + δL + εij kL
Donde:
XijkL = Valor de la variable respuesta correspondiente al iésimo nivel del factor fila, al j-
ésimo nivel del factor columna, al k-ésimo tratamiento y l-ésimo letra griega
µ = Es el promedio general o promedio poblacional
αi = Es el efecto del i-ésimo nivel del factor fila
βj = Es el efecto del j-ésimo nivel del factor columna.
γk = Es el efecto del k-ésimo tratamiento, o letra latina
δL = Es el efecto del L-ésimo nivel del factor letra griega
εijk = Es el error o valor residual del k-ésimo tratamiento, del i-ésimo factor fila y del
j-ésimo factor columna, l-ésimo letra griega, que se considera es
independiente de observación a observación y está normalmente
distribuido con valor esperado igual a cero y varianza igual a σ2 , Ν (0,σ2).
Dichos efectos están sujetos a la restricción: ∑αi = ∑βj = ∑γk = ∑ δL = 0.
Las formulaciones de cálculo para las sumas de cuadrados son las siguientes:
FC = (Σ xijkL)2/a2
SCT = Σ x2ijkL - FC
SCF = Σ((Σ xi•••)2 / a) - FC
SCC = Σ((Σx•j••)2 / a) - FC
SCE= Σ((Σx••k•)2 / a) - FC
SCG = Σ((Σx•••L)2 / a) - FC
SCR = SCT – (SCF + SCC+ SCL + SCG)
C1 C2 C3 C4 Sumatorias
Fila/Columna
F1 Aβ B γ Cδ Dα X1…
F2 Bα Cδ D γ A β X2…
F3 Cδ Dα A β B γ X3…
F4 D γ A β Bα Cδ Xi…
Sumatorias X.1.. X.2.. X.3.. X.4.. X….
SumasLetras
X..A. X..B. X..C. X..D. X..K.
Latinas
SumasLetras
X…α X…β X… γ X… δ X…L
Griegas
PRUEBA DE HIPÓTESIS
1. Formulación de la Hipótesis:
Factor fila
H0 : αi = 0
HA : αi ≠ 0
Factor columna
H0 : β j = 0
HA : β j ≠ 0
Factor Latina
H0 : γk = 0
HA : γ k ≠ 0
Factor Griega
H 0 : δL = 0
H A : δL ≠ 0
3. Criterio de Decisión
Rechazar la H0 si : Fc ≥ Fα/2,v1,v2 Filas
Rechazar la H0 si : Fc ≥ Fα/2,v1,v2 Columnas
Rechazar la H0 si : Fc ≥ Fα/2,v1,v2 Letra latina
Rechazar la H0 si : Fc ≥ Fα/2,v1,v2 Letra griega
A diferencia de los diseños antes tratados la estructura de los diseños factoriales combina los niveles de
dos o más factores para crear “a” tratamientos, de manera que los tratamientos tienen una estructura
factorial, además nos centraremos en diseños balanceados, es decir, tienen n observaciones en cada
tratamiento. El objetivo de un diseño factorial es estudiar el efecto de varios factores sobre la variable
respuestas. A diferencia de los diseños anteriormente estudiados, los diseños factoriales permiten
combinar factores y niveles por factor, se puede analizar cuantitativamente los efectos que tienen en la
variable dependiente, las variables independientes o factores por sí mismos y en todas las combinaciones,
se puede determinar la relación entre los factores
Entre las principales ventajas de la utilización del diseño factorial es un ahorro considerable de
tiempo y dinero; permite detectar e identificar los efectos simples y principales, así como aquellos
debidos a una combinación particular de niveles de los factores, proporcionando información sobre
los efectos de los factores y sobre sus relaciones entre sí.
Por ejemplo, con k = 2 factores, ambos con dos niveles, se forma el diseño factorial 2 × 2 = 22 , que consiste
en cuatro combinaciones o puntos experimentales. Si ahora uno tiene tres niveles y el otro dos, se pueden
construir 3 × 2 combinaciones que dan lugar al diseño factorial 3 × 2, que equivale a 6 tratamientos. Para
obtener el número de corridas experimentales se multiplica el número de tratamientos por el número de
réplicas
En general, la familia de diseños factoriales 2𝑘 consiste en k factores, todos con dos niveles de prueba, y
la familia de diseños factoriales 3𝑘 consiste en k factores cada uno con tres niveles de prueba, si los k
factores no tienen la misma cantidad de niveles, debe escribirse el producto de manera explícita; por
ejemplo, con k = 3 factores, el primero con cuatro niveles y los dos restantes con dos niveles, se tiene el
diseño factorial 4 × 2 × 2 o 4 ×22 , es lo que se conoce como diseños factoriales generales
Otros ejemplos: si el factor A interviene con dos niveles: a1 y a2; y el factor B interviene con niveles
b1 y b2, entonces el número de tratamientos del experimento es 2*2=4, y los tratamientos: a1b1, a1b2,
a2b1 y a2b2; otro ejemplo si A interviene con dos niveles: a1 y a2; y si el factor B tuviese tres niveles,
entonces el número de tratamientos del experimento será 2*3=6 y los tratamientos: a1b1, a1b2, a1b3,
a2b1, a2b2 y a2b3.
Cabe señalar que los diseños factoriales completos 2𝑘 (k factores con dos niveles de prueba cada
uno), son los diseños de mayor impacto en la industria y la investigación debido a su eficacia y
versatilidad
EFECTOS E INTERACCIONES
Los factores se representan con letras mayúsculas y los niveles con letras minúsculas
FACTOR A FACTOR B
b1 b2
a1 𝑎1 𝑏1 𝑎1 𝑏2
(1) (b)
(-,-) (-,+)
a2 𝑎2 𝑏1 𝑎2 𝑏2
(a) (a,b)
(+,-) (+,+)
Si a1 representa el nivel inferior del factor A y a2 el nivel superior del factor, entonces la diferencia
(a2 - a1) proporciona una medida del cambio del factor A. De similar manera, si b 1 representa el
nivel inferior del factor B y b2 el nivel superior del factor, entonces la diferencia (b2 - b1) proporciona
una medida del cambio del factor B.
Efecto principal se mide promediando los efectos del factor en todos los niveles del otro factor. Son los
cambios en la medida de la variable de respuesta que se deben a la acción individual de cada factor
A= ((a2b1 - a1b1)+( a2b2 - a1b2))/2
B= ((a1b2 - a1b1)+( a2b2 - a2b1))/2
Interacción entre factores es un efecto adicional debido a la influencia combinada de dos, o más,
factores. Dos factores interactúan entre sí o tienen un efecto de interacción sobre la variable de
respuesta, cuando el efecto de un factor depende del nivel en que se encuentra el otro. Por ejemplo,
los factores A y B interactúan si el efecto de A es muy diferente en cada nivel de B, o viceversa.
Realizar ejemplos:
Ejemplo 5.1 pág 116. Libro de Gutierrez
Cuando hay interacción, las conclusiones que se obtienen a partir de los efectos principales no
siempre son ciertos. En general sólo se interpretan los efectos principales de aquellos factores que
no interactúan con ningún otro (Gutiérrez Pulido & De la Vara Salazar, 2012)
Una de las principales utilidades de una gráfica de interacción es que ayuda a seleccionar la condición en
la que debe operarse el proceso para mejorar su desempeño. Por ejemplo, en el caso de la figura 5.1b, el
mínimo de Y se logra en A = –1 y B = –1; mientras que el máximo en A = –1 y B = +1.
DISEÑO FACTORIAL 22
(con más de una réplicas)
Este diseño es aquel en el que intervienen dos factores a dos niveles cada factor; en la expresión 22,
la base corresponde el número de niveles por factor y el exponente al número de factores.
Con el diseño factorial 22 se estudia el efecto de dos factores considerando dos niveles en cada uno.
Cada réplica de este diseño tiene 2x2=4 combinaciones o tratamientos.
Los factores son A y B, cada uno a dos niveles: a1 y a2 para el factor A; y, b1 y b2 para el factor B. El número
de tratamientos posibles es igual al número de niveles del factor A por el número de niveles del factor B,
esto es: 2 x 2 = 4 tratamientos específicos: a1b1, a1b2, a2b1 y a2b2.
Esos tratamientos se pueden representar de la siguiente manera:
Representación geométrica
El diseño factorial 22 se representa de manera geométrica por los vértices del cuadrado. Cada vértice
representa un punto de diseño o tratamiento. El área limitada por este cuadrado se conoce como región
experimental y, en principio, las conclusiones que se obtengan del experimento sólo tienen validez sobre
esta región.
La suma de cuadrados de tratamientos puede ser particionada para obtener los efectos principales
de cada factor, así como su interacción: SCE=SCA+SCB+SCAB
Los efectos principales, simples e interacciones se sintetizan en el siguiente cuadro, que muestra los
multiplicadores ortogonales que serán utilizados para obtener los efectos principales y la interacción
entre tratamientos. De igual manera, expresa la forma de obtener la contribución a la suma de
cuadrados de tratamientos.
Una forma sencilla y útil para establecer los signos de los coeficientes ortogonales consiste en que, para
obtener el efecto principal de un factor, los coeficientes serán positivos si el tratamiento tiene el nivel
superior del factor y será negativo si tiene el nivel inferior del factor.
Modelo matemático: representación con un modelo de regresión del experimento factorial de dos
factores
Ŷ= β0 + β1 X 1+ β2 X2 + β12 X 1 X2
Nota: la interacción es otra variable X1*X2 (en SPSS), se recomienda trabajar con -1 y 1 o 0 y 1 como
nivel bajo y alto respectivamente, lleva a la misma estimación
Debemos notar que en el modelo matemático los elementos: αi, βj y αβij, corresponden a los
componentes independientes de los tratamientos, de forma que el modelo matemático, expresado
en función de los tratamientos y de las replicaciones, puede escribirse como un diseño ANOVA dos
factores o solo en función de tratamientos ANOVA un factor
Xij = µ + Φi + γk + εij ANOVA dos factores (una sola réplica)
Xij = µ + Φi + εij ANOVA un factores (con más de una réplica)
Las hipótesis que se prueban en el diseño 22 corresponden a la dómima para cada factor e
interacción:
Factor A
H0 : αi = 0
HA: αi ≠ 0
Factor B
H0 : βj = 0
HA : βj ≠ 0
Factor AB
H0 : αβij = 0 La interacción no tiene un efecto significativo en la variable
respuesta. No existe interacción. Independencia
HA : αβij ≠ 0 La interacción tiene un efecto significativo en la variable
respuesta. Existe interacción. Dependencia
El cuadro de análisis de varianza para un diseño factorial de 22 con “r” replicaciones por
tratamiento es:
Ŷ= β0 + β1 X 1+ β2 X2 + β1,2 X 1 X2
Es útil ajustar un modelo de regresión a los datos experimentales con la finalidad de predecir
el valor de Y en diferentes niveles (2 niveles) de los factores estudiados. Los coeficientes del
modelo de regresión son iguales a los estimados que resultaron significativos divididos entre
2. Esta división se hace para lograr una escala unitaria, que es la escala usual en regresión,
de manera que el coeficiente X1 es igual al efecto de A/2. El término independiente β0 es la
media global u. Es necesario resaltar lo que se indicó, considerando únicamente para un
diseño factorial 2^K
Nota: en SPSS es necesario trabajar con los niveles (con 2 niveles): -1 nivel bajo y 1 nivel alto,
para que se verifique que el coeficiente X1 es igual al efecto de A/2, a diferencia de R, para
hacer la estimación de la predicción en R se trabaja con 0 nivel bajo y 1 nivel alto, como es
de esperar, se tiene la misma predicción predicha. Esto es útil en diseños factoriales 2^k, no
en diseños factoriales generales o mixtos
Ŷ= β0 + β1 X 1+ β2 X2 + β3 X 1 X2
Ŷ(-1,1)= u + β1 (-1)+ β2( 1) + β3 (-1)(+1)
Nota: en R los efectos “effects” están divididos para 2, de manera que en diseños 22 los efectos no son
efectos principales en R, pasan a ser los coeficientes del modelo de regresión. Razón por lo cual se debe
interpretar mejor los efectos medios que son las medias aritméticas, que pasan a ser 𝑦̂ de la regresión en
el punto indicado
DISEÑO FACTORIAL 23
• Con el diseño factorial 23 se estudian tres factores en dos niveles cada uno. Consta
de 23 =2 × 2 × 2 = 8 tratamientos diferentes.
• Con este diseño se pueden estudiar los 23 – 1 = 7 efectos: tres efectos principales A, B, C;
tres interacciones dobles o de primer orden AB, AC, BC y una interacción triple o de segundo
orden ABC, por lo general el interés se enfoca en estudiar los efectos principales y las
interacciones
Representación geométrica
La región experimental es un cubo regular centrado en el origen (0,0,0), cuyos vértices son los 8
tratamientos
H0: αβγijk = 0
H1: αβγijk ≠ 0
Combinaciones 23
Las combinaciones serán únicas y no pueden repetirse.
c1 c2
b1 b2 b1 b2
a1 a1b1c1 a1b2c1 a1b1c2 a1b2c2
a2 a2b1c1 a2b2c1 a2b1c2 a2b2c2
Efectos Principales
Los efectos principales son los cambios en la media de la variable de respuesta que se deben a
la acción individual de cada factor.
1
𝐴= [ 𝑎 + 𝑎𝑏 + 𝑎𝑐 + 𝑎𝑏𝑐 − (1) − 𝑏 − 𝑐 − 𝑏𝑐]
4𝑟
1
𝐵= [ 𝑏 + 𝑎𝑏 + 𝑏𝑐 + 𝑎𝑏𝑐 − (1) − 𝑎 − 𝑐 − 𝑎𝑐]
4𝑟
1
𝐶= [ 𝑐 + 𝑎𝑐 + 𝑏𝑐 + 𝑎𝑏𝑐 − (1) − 𝑎 − 𝑏 − 𝑎𝑏]
4𝑟
Efectos de interacción
Tres factores interactúan de manera significativa sobre una variable de respuesta cuando el
efecto de uno depende del nivel en el que se encuentra el otro.
La interacción permite conocer cómo actúan los factores sobre la variable de respuesta.
Cuando una interacción tiene un efecto estadísticamente significativo sobre la respuesta, su
interpretación tiene prioridad sobre los correspondientes efectos principales, aunque estos
también sean significativos.
Esto se debe a que la interacción termina dominando el proceso y ayuda a seleccionar la
condición en la que debe operarse el proceso para mejorar su desempeño.
1
𝐴𝐵 = [ (1) − 𝑎 − 𝑏 + 𝑎𝑏 + 𝑐 − 𝑎𝑐 − 𝑏𝑐 + 𝑎𝑏𝑐]
4𝑟
1
𝐴𝐶 = [ (1) − 𝑎 + 𝑏 − 𝑎𝑏 − 𝑐 + 𝑎𝑐 − 𝑏𝑐 + 𝑎𝑏𝑐]
4𝑟
1
𝐵𝐶 = [ (1) + 𝑎 − 𝑏 − 𝑎𝑏 − 𝑐 − 𝑎𝑐 + 𝑏𝑐 + 𝑎𝑏𝑐]
4𝑟
1
𝐴𝐵𝐶 = [ −(1) + 𝑎 + 𝑏 − 𝑎𝑏 + 𝑐 − 𝑎𝑐 − 𝑏𝑐 + 𝑎𝑏𝑐]
4𝑟
Ejemplo
Se quiere realizar un estudio para medir el tiempo en que madura el aguacate (VR). Con las
variables: Tipo de aguacate, método de conservación y temperatura.
A Tipo de Aguacate a1 Criollo
a2 Guatemalteco
B Método de conservación b1 Funda negra
b2 Periódico
C Temperatura c1 Ambiente
c2 Caliente
DISEÑO FACTORIAL 24
En este diseño intervienen cuatro factores a dos niveles cada factor; es una extensión de los diseños
descritos anteriormente y su procedimiento de prueba y cálculo son similares.
El número de tratamientos es 16 que corresponden a la multiplicación del número de niveles de cada
factor: 2 x 2 x 2 x 2 = 16
Si denotamos a los factores con A, B, C y D, los tratamientos y su notación se presenta a continuación:
Para el cálculo de los efectos principales (A, B, C, D), las interacciones de primer orden (AB, AC, AD,
BC,BD,CD), la de segundo orden (ABC, ABD, ACD, BCD) y la de tercer grado (ABCD), se utilizarán los
multiplicadores ortogonales
Al igual que en los casos anteriores, la presencia o ausencia de la letra del factor en la denominación del
tratamiento determina el signo “+” en presencia o “-” en ausencia; para las interacciones se multiplican
los signos de los factores que intervienen en la interacción.
Las 15 hipótesis que se prueban corresponden a cada factor, interacción y a las replicaciones, su
procedimiento es exactamente igual al utilizando en los ejemplos anteriores.
Tabla Anova
Fuente de Grados Suma de Cuadro Medio Estadística de prueba
variación de Cuadrados
libertad
Tratamientos abcd-1 SCE CME=SCE/(abcd-1) Fc=CME/CMR
Se tiene un diseño factorial mixto cuando los factores estudiados no tienen el mismo
número de niveles. Es aquel en el que intervienen dos o tres factores, el factor A con a
niveles y el factor B con b niveles y el factor C con c niveles; el número de tratamientos es
igual a “a x b” o “a x b x c”, respectivamente; si tenemos r replicaciones en el experimento,
entonces el número de observaciones o unidades experimentales es de “a x b x r” o “a x b
x c x r”, si es de dos o tres factores respectivamente, en el que éstas se asignan
aleatoriamente a cada tratamiento.
Si se tuviera tres factores entonces los niveles son: nivel alto, medio y bajo o nivel inferior,
intermedio y superior
Modelo matemático del diseño factorial dos generales (de efectos fijo)
Al igual que el diseño factorial 2k; debemos notar que en el modelo matemático los
elementos: αi, βj y αβij, corresponden a los componentes independientes de los
tratamientos, de forma que el modelo matemático, expresado en función de los
tratamientos y de las replicaciones, puede escribirse como un diseño ANOVA dos factores
o solo en función de tratamientos ANOVA un factor
Se probarán hipótesis para cada factor e interacción entre los factores y el efecto de los
tratamientos y de las replicaciones. El procedimiento de cálculo, elaboración, y
conformación del cuadro de análisis de varianza se explica a continuación
Pasos para realizar diseños factoriales generales:
1. Se listan los tratamientos con sus respectivas observaciones conformando un cuadro
de doble entrada: tratamiento y réplicas. Con esto se obtiene un diseño con un factor
o dos factores. Calcular el FC
2. Se tiene que formar una tabla de dos vías por cada par de factores, por ejemplo, A X B,
sumando las observaciones que correspondan para cada combinación de los niveles de
cada factor
3. Se calcula el total de cada cuadro de dos vías = se eleva al cuadrado cada valor de Xij,
la sumatoria de estos valores se divide para el número de observaciones que contiene
cada Xij, y se le resta el FC
4. Para calcular la SC de un factor, sume el cuadrado de los totales marginales del factor, y
divida para el número de observaciones que contiene cada total marginal y reste menos
FC. El resultado es la contribución del factor, a la suma de cuadrados de tratamientos
5. La interacción de cada par de factores = total de cuadro de dos vías (paso 3), menos el
aporte de cada factor
Y así se trabaja con cada cuadro de dos vías
El cuadro de análisis de varianza para un diseño factorial dos general con “r” replicaciones
por tratamiento es:
El cuadro de análisis de varianza para un diseño factorial tres general con “r” replicaciones
por tratamiento es:
Los parámetros de los modelos de efectos aleatorios son la media general μ, la varianza
del error 𝜎 2 y la varianza de los efectos 𝜎𝐴2 . Los efectos Ai son variables aleatorias, no
parámetros. Para contrastar si el factor aleatorio es significativo, planteamos el
contraste de hipótesis sobre 𝜎𝐴2
H0 : 𝜎𝐴2 = 0
H1 : 𝜎𝐴2 > 0 Los diferentes niveles del factor provocan efectos sobre la variable
respuesta
La tabla ANOVA en los modelos de un factor con efectos aleatorios, es idéntica a la tabla
ANOVA de un factor con efectos fijos. La tabla ANOVA tiene exactamente las mismas
filas; factor, residuo y total, y las mismas columnas; Fuente de variación, suma de
cuadrados, grados de libertad, cuadrados medios y F.
Por tanto, la estimación de las componentes de la varianza 𝜎𝐴2 y 𝜎 2 ,se obtiene igualando
los E(CM) con los
cuadrados medios respectivos en la tabla ANOVA. Esto es,
𝜎 2 + n𝜎𝐴2 =CMA
𝜎 2 =CMR
Y, aplicando el método de los momentos para obtener las estimaciones, aislamos las
sigmas
𝜎̂ 2 =CMR
𝐶𝑀𝐴−𝐶𝑀𝑅
𝜎̂𝐴2 =
𝑛
Contrastes de interés
H0 : 𝜎𝐴2 = 0
H1 : 𝜎𝐴2 > 0
H0 : 𝜎𝐵2 = 0
H1 : 𝜎𝐵2 > 0
2
H0 : 𝜎𝐴𝐵 =0
2
H1 : 𝜎𝐴𝐵 > 0
En resumen, la tabla ANOVA para un diseño experimental con dos factores aleatorios
con interacción es de la forma
Factor SC GL CM Fc
A SCA a-1 CMA CMA/CMAB
B SCB b-1 CMB CMB/CMAB
AB SCAB (a-1)(b-1) CMAB CMAB/CMR
Error SCR ab(r-1) CMR
Cabe señalar que a diferencia de los modelos de efectos fijos ahora no se realiza
comparaciones múltiples, pero sí se evalúa los componentes de la varianza
Nota: En R, la función “aov” asume que todos los factores son fijos, mientras que la
función lm del paquete mixlm permite especificar los factores aleatorios, mediante la
función r
En SPS, la ruta es: Analizar-Modelo lineal general-univariado, …. . Mientras que para
sacar los componentes de varianza: Analizar-Modelo lineal general- Componentes de
varianza