Download as pdf or txt
Download as pdf or txt
You are on page 1of 80

ÍNDICE

DISEÑOS .......................................................................................................................................................................................................................4
DISEÑOS DE EXPERIMENTOS.......................................................................................................................................................................................6
DEFINICIONES BÁSICAS ...............................................................................................................................................................................................8
PRINCIPIOS BÁSICOS....................................................................................................................................................................................................9
CLASIFICACIÓN Y SELECCIÓN DE LOS DISEÑOS EXPERIMENTALES ......................................................................................................................... 10
ETAPAS EN EL DISEÑO DE EXPERIMENTOS .............................................................................................................................................................. 11
ANALISIS DE VARIANZA ................................................................................................................................................................................................ 13
ANÁLISIS DE VARIANZA DE UN FACTOR O UNA VÍA (DCA) ......................................................................................................................................... 16
MODELO MATEMÁTICO ........................................................................................................................................................................................... 17
Modelo estadístico lineal ......................................................................................................................................................................................... 17
CUADRO DE ANALISIS DE VARIANZA ....................................................................................................................................................................... 18
PRUEBA DE HIPÓTESIS .............................................................................................................................................................................................. 18
COMPARACIÓN ENTRE TRATAMIENTOS ..................................................................................................................................................................... 21
DIFERENCIA MÍNIMA SIGNIFICATIVA....................................................................................................................................................................... 21
MÉTODO DE TUKEY .................................................................................................................................................................................................. 22
CONTRASTES ORTOGONALES (FUNCION LINEAL) ................................................................................................................................................... 23
VERIFICACION DE SUPUESTOS ..................................................................................................................................................................................... 25
PRUEBA DE NORMALIDAD ....................................................................................................................................................................................... 26
HOMOGENEIDAD DE VARIANZAS (HOMOCEDASTICIDAD) ..................................................................................................................................... 29
INDEPENDENCIA ....................................................................................................................................................................................................... 34
SOLUCIÓN AL INCUMPLIMINTO DE SUPUESTOS ......................................................................................................................................................... 35
TAMAÑO DE MUESTRA PARA UN CONTRASTE ........................................................................................................................................................... 38
El tamaño del efecto depende del diseño, ................................................................................................................................................................... 40
𝜟 = 𝑽𝒂𝒓𝒊𝒂𝒄𝒊ó𝒏 𝒊𝒏𝒕𝒆𝒓𝒎𝒖𝒆𝒔𝒕𝒓𝒂𝒍 (𝒆𝒏𝒕𝒓𝒆 𝒕𝒓𝒂𝒕𝒂𝒎𝒊𝒆𝒏𝒕𝒐𝒔)𝑽𝒂𝒓𝒊𝒂𝒏𝒛𝒂 𝒑𝒐𝒃𝒍𝒂𝒄𝒊𝒐𝒏𝒂𝒍 ......................................................................................... 40
MODELOS DE EFECTOS FIJOS Y ALEATORIOS .............................................................................................................................................................. 42
MODELO DE EFECTOS FIJOS ..................................................................................................................................................................................... 42
MODELO DE EFECTOS ALEATORIOS ......................................................................................................................................................................... 43
ANÁLISIS DE VARIANZA DE DOS FACTOR .................................................................................................................................................................... 44
MODELO A DOS CRITERIOS DE CLASIFICACION CON UNA OBSERVACIÓN................................................................................................................. 46
MODELO MATEMÁTICO ........................................................................................................................................................................................... 46
CUADRO DE ANALISIS DE VARIANZA ....................................................................................................................................................................... 47
PRUEBA DE HIPÓTESIS .............................................................................................................................................................................................. 47
PARTICIÓN DE LA SUMA DE CUADRADOS DE TRATAMIENTOS O BLOQUES.............................................................................................................. 50
Si CMB>CMR DBCA, entonces ER>1; y es mejor usar DBCA............................................................................................................................................. 51
Si CMB≤CMR DBCA, entonces ER≤1; y es mejor usar DCA ............................................................................................................................................... 51
Nota: a=K=t; SCE=SCR ................................................................................................................................................................................................... 52
MODELO A DOS CRITERIOS DE CLASIFICACION CON DOS O MAS OBSERVACIONES POR CELDA ............................................................................. 52
MODELO MATEMÁTICO ........................................................................................................................................................................................... 52
CUADRO DE ANALISIS DE VARIANZA ....................................................................................................................................................................... 53
PRUEBAS DE HIPÓTESIS ............................................................................................................................................................................................ 53
MODELO MATEMÁTICO ........................................................................................................................................................................................... 54
CUADRO DE ANALISIS DE VARIANZA ....................................................................................................................................................................... 55
PRUEBA DE HIPÓTESIS .............................................................................................................................................................................................. 55
CUADRADO GRECO LATINO-DCGL ............................................................................................................................................................................... 57
MODELO MATEMÁTICO ........................................................................................................................................................................................... 58
CUADRO DE ANALISIS DE VARIANZA ....................................................................................................................................................................... 59
PRUEBA DE HIPÓTESIS .............................................................................................................................................................................................. 59
DISEÑO FACTORIAL (con réplicas)................................................................................................................................................................................ 60
DISEÑO FACTORIAL 22 .............................................................................................................................................................................................. 64
Realizar: Ejercicio 6 – 9 Libro de Montgomery, página 278 ...................................................................................................................................... 68
DISEÑO FACTORIAL 23 .............................................................................................................................................................................................. 68
Realizar ejemplo “Biorremediación de suelos contaminados por hidrocarburos”, 23 .............................................................................................. 72
DISEÑO FACTORIAL 24 .............................................................................................................................................................................................. 72
DISEÑO FACTORIAL GENERAL O FACTORIALES MIXTOS O EXPERIMENTOS FACTORIALES ................................................................................... 74
DE DOS O TRES FACTORES........................................................................................................................................................................................ 74
DISEÑOS CON EFECTOS ALEATORIOS............................................................................................................................................................................ 77
DISEÑOS

Experimentos
puros

Según el propósito:
DISEÑOS Diseños experimentales Cuasi Exploratorios
El diseño de la investigación es una experimentos
planificación de lo que se debe Según el número
Descriptivos
hacer para lograr los objetivos del Diseños no de mediciones:
Correlaciónales/causales
estudio experimentales u Transaccionales
observacionales Tendencia
Longitudinales
Evolución de grupo (Cohorte)

Panel
Investigación experimental
Consiste en ampliar un estímulo a un individuo o grupo de individuos, o elementos, y ver el efecto de
ese estimulo en alguna(s) variable(s) en condiciones de mayor o menos control.

La investigación no experimental
Es la que se realiza sin manipular deliberadamente las variables independientes, y se basa en categorías,
conceptos, variables, sucesos, comunidades o contextos que ya ocurrieron, o se dieron sin la intervención
directa del investigador. Es un enfoque retrospectivo

Cuasi experimentos
La asignación de los grupos y de los sujetos a los grupos no se realiza al azar. No aleatorización en la
formación de los grupos. (Grupos intactos o naturales). La asignación de los grupos se hace por la situación
real, es decir, son grupos intactos

El método cuasiexperimental permite explorar temas que de otra manera no podrían explorarse debido
a cuestiones éticas, morales y/o prácticas. Las ventajas de estos experimentos es que implica menos
costos y tiempo que si se quisiera realizar un experimento puro, mientras que el limitante es que al no
reunir a los grupos aleatoriamente, provoca que los resultados puedan no ser todo lo exactos que se
desearía.

Ejemplos:
Se investiga los efectos de tres vacunas contra el coronavirus, tomando como sujetos de estudio a
personas que se presentan voluntarias. Es cuasi experimental porque no se ha podido asignar
aleatoriamente a los sujetos a distintos grupos.
Efecto del alcohol en adolescentes

En resumen, diremos que los estudios experimentales, a diferencia de los estudios no experimentales u
observacionales, permiten la comparación de manera controlada de tratamientos sobre una variable
respuesta y los tratamientos son asignados a las unidades experimentales aleatoriamente
La aleatorización es una de los elementos más importantes de un experimento bien diseñado

La asignación aleatoria de tratamientos da lugar a:


- Protege contra los factores de confusión (cuando el efecto de un factor o tratamiento no puede
ser distinguido de la de otro factor o tratamiento

- Constituye la base para la inferencia


DISEÑOS DE EXPERIMENTOS
La experimentación es intrínseca a la mayoría de las investigaciones científicas y tecnológicas, en donde
se busca evaluar la influencia de factores en la variable de interés, cuya influencia puede estar oculta por
la variabilidad de los resultados muestrales.

“Consiste en planear y realizar un conjunto de pruebas con el objetivo de generar datos que, al ser
analizados estadísticamente, proporcionen evidencias objetivas que permitan responder las
interrogantes planteadas por el experimentador sobre determinada situación”. (Gutiérrez Pulido & De la
Vara Salazar, 2012)

“Un experimento puede definirse como una prueba o serie de pruebas en las que se hacen cambios
deliberados en las variables de entrada de un proceso o sistema para observar e identificar las razones de
los cambios que pudieran observarse en la respuesta de salida”. (Montgomery, 2004)

“Diseñar estadísticamente un experimento es realizar una prueba o una serie de pruebas buscando
caracterizar las variables explicativas o factores (Xi) de mayor influencia en un ensayo de interés, evaluado
a través de una o varias variables respuesta(s), tal que si deliberada o sistemáticamente se introducen
cambios controlados en algunas de las variables explicativas del proceso, siempre sea posible observar o
cuantificar los cambios que estos generan en la(s) variable(s) respuesta(s). Adicionalmente, se busca
minimizar el efecto de las variables no controlables (covariables), procurando con ello estabilizar y
minimizar la variabilidad de las respuestas, identificando los factores que contribuyen a las mayores
causas de variabilidad”. (Melo et al., 2020)

Investigaciones reales con enfoque experimental:


- Estudio de la migración de aluminio desde las ollas a la colada de avena con naranjilla mediante
el método de absorción atómica
- Evaluación del desgaste de piezas dentales, medidas a través del peso y pigmentación, por la
influencia de bebidas y precios
- Incidencia del agua, ripio, arena y diferentes tiempos de curado, en la calidad del hormigón para
la construcción, empleado los agregados del cantón Pedernales
- Efecto de las diferentes dietas en la proteína extraída de grillos domésticos, una alternativa para
el consumo humano
- Retención de la memoria a corto plazo en estudiantes universitarios aplicando un diseño factorial
- Rendimiento de los alumnos en una asignatura por influencia de diferentes factores: profesor que
imparte la asignatura; método de enseñanza; sexo del alumno.
- Investigación de la variación de potasio en hortalizas sometidas a diálisis
- Investigación del procedimiento óptimo para la disminución de la concentración de potasio en
leguminosas sometidas a cocción.
- Investigación del procedimiento óptimo para la disminución de la concentración de potasio en
patata, zanahoria y yuca sometidas a cocción.
- Investigación de la variación de potasio en frutas sometidas a diferentes tratamientos
- Determinación de carotenoides totales y vitamina A en cuatro variedades de mashua (tropaeolum
tuberosum) deshidratada.
- Estudio del efecto del sistema de deshidratación de cuatro variedades de mashua (tropaeolum
tuberosum) sobre la capacidad antioxidante.
- Evaluación de la viabilidad de las bacterias ácido lácticas usadas para la elaboración de yogurt
frente a fluido gástrico simulado.
- Estudio in vitro sobre la contaminación de hilos de sutura: poliamida, poliglactina 910 y seda
expuestos a diferentes agentes antisépticos
- Comparación de dos dilutores en la viabilidad espermática del semen refrigerado a diferentes
horas con dos tipos de razas bovinas
- Actividad nematicidad de extractos etanólicos contra meloidogyne hapla bajo condiciones de
invernadero
- Diseño de experimentos relacionado con análisis de datos ómicos (ver archivo Maestria-Análisis
de datos ómicos)
- Ver investigaciones realizadas en pregrado

El diseño de experimentos (DOE según sus siglas en inglés), es empleado en todos los sectores,
permitiéndonos:
- Comparaciones de dos o más materiales
- Hacer cambios en los materiales, métodos o condiciones de operación de un proceso
- Comparación de varios instrumentos de medición
- Probar varias temperaturas
- Evaluar un material para obtener mejoras
- Mejoramiento de procesos
- Determinar los factores de un proceso que tienen impacto sobre una o más características del
producto final

Procesos:
✓ Maquinaria
✓ Mano de obra Cuando se cuantifican
✓ Métodos se expresan en modelos
✓ Medio ambiente
✓ Materiales

Efecto Causas
y= f (x1,x2,………….xk)
F principales (aleatorios)
v. respuesta f (factores que explican el fenómeno)
F accesorios (fijos)

v. cuantitativa v. cuantitativas
v. cualitativas

Infinitas variables (y) = Infinitos modelos

Los Factores principales y accesorios se estandarizan


Fuente: (Gutiérrez Pulido & De la Vara Salazar, 2012)

DEFINICIONES BÁSICAS
Según (Gutiérrez Pulido & De la Vara Salazar, 2012)

Experimento
Es la unidad de observación y análisis, de la cual se observa, mide y registra la misma característica o
variable. Es un cambio en las condiciones de operación de un sistema o proceso, que se hace con el
objetivo de medir el efecto del cambio en una o varias propiedades del producto o resultado.

Unidad experimental
Pieza(s) o muestra(s) que se utiliza para generar un valor que sea representativo del resultado.
Ejemplo:
• En informática: ordenadores, páginas web, buscadores de internet,
• En agricultura: parcelas de tierra,
• En medicina: individuos humanos u animales,
• En industria: lotes de material, trabajadores, máquinas

Variable de respuesta (variable dependiente)


Es la variable que se mide, a través de esta(s) variable(s) se conoce el efecto o los resultados de cada
prueba experimental.

Factores controlables o Factores estudiados o Factores de diseño (variables independientes)


Son variables que se pueden controlar durante el experimento o la operación normal del proceso.

Son las variables que se investigan en el experimento para observar cómo afectan o influyen en la variable
respuesta.

Error aleatorio
Es una variabilidad observada que no se puede explicar por los factores estudiados; resulta del pequeño
efecto de los factores no estudiados y del error experimental.
Error experimental
Componente del error aleatorio que refleja los errores del experimentador en la planeación y ejecución
del experimento, es causado por:
• Errores de observación
• Errores de medición
• Variación del material experimental
• Factores extraños que pueden influir en las características de estudio
• Error de muestreo, debido a la heterogeneidad de las unidades experimentales

Control del error experimental.- Puede lograrse mediante la selección adecuada del tamaño de la
muestra y el diseño experimental

Matriz de diseño.- Es el arreglo formado por los tratamientos que serán corridos, incluyendo las
repeticiones.

Tratamientos.- Se entiende como tratamiento a un conjunto particular de condiciones experimentales


que deben imponerse sobre las unidades experimentales de un experimento.
Conjunto de condiciones experimentales que serán impuestas a una unidad experimental en un diseño
elegido.
Cada una de las combinaciones de niveles de los distintos factores.

En agronomía, la cantidad de mezcla de cierto fertilizante, la cantidad de nutrientes o combinaciones de


nutrientes utilizados, diferentes variedades o líneas de cultivo, distintas densidades de siembra o
profundidad de siembra.

Es necesario conocer las etapas a seguir cuando nos enfrentamos a l estudio de un proceso

Niveles del tratamiento.- Tipos o grados específicos del factor que se utilizan en el experimento, ejm:
distintas cantidades de drogas, grados de temperatura seleccionados, etc

Modelo de efectos fijos: Los niveles de todos los factores han sido seleccionados por el experimentador.

Modelo de efectos aleatorios: Los niveles de todos los factores son una muestra aleatoria de todos los
niveles posibles.

PRINCIPIOS BÁSICOS
Aleatorización
Consiste en hacer corridas experimentales en orden aleatorio, este principio aumenta la posibilidad de
que el supuesto de independencia de los errores se cumpla (ver ejemplo del libro de Mongomery pág
60,61 y 77)
• Tanto la asignación de material experimental como el orden en que se realizarán las corridas o
ensayos individuales del experimento se determinan al azar.
• Uno de los requisitos de los métodos estadísticos es que las observaciones sean variables
aleatorias independientes.
Véase el siguiente experimento
Fuente: (Oehlert, 2010)

Repetición
Es correr más de una vez un tratamiento o combinación de factores

La realización de réplicas posee dos propiedades importantes.


• 1.- Permite al experimentador obtener una estimación del error experimental.
• 2.- Si se usa la media muestral para estimar el efecto de un factor en el experimento, la realización
de réplicas permite al experimentador obtener una estimación más precisa de este efecto.

Bloqueo
Tomar en cuenta en forma adecuada todos los factores que pueden afectar la respuesta observada
• Se utiliza para mejorar la precisión de las comparaciones que se hacen entre los factores de
interés.
• Reducir o eliminar la variabilidad transmitida por factores perturbadores.
• Uno de los requisitos de los métodos estadísticos es que las observaciones sean variables
aleatorias independientes.
• Un bloque es un conjunto de condiciones experimentales homogéneas.

BLOQUEAR: Dividir o particionar las unidades experimentales en grupos llamados bloques (o niveles de
factores bloque) de modo que las observaciones realizadas en cada bloque se realicen bajo condiciones
experimentales lo más parecidas posibles. Es una muy buena estrategia cuando las u.e. se prestan a ser
divididas en grupos de unidades “similares”

CLASIFICACIÓN Y SELECCIÓN DE LOS DISEÑOS EXPERIMENTALES


Los aspectos más influyentes son:
• El objetivo del experimento
• El número de factores
• El número de niveles
• Costo y tiempo
• El efecto que interesa investigar

Clasificación de los diseños experimentales según su objetivo:

Fuente:(Gutiérrez Pulido & De la Vara Salazar, 2012)

ETAPAS EN EL DISEÑO DE EXPERIMENTOS


El Diseño experimental parte del método científico, estructura de la investigación:
Problema de investigación Qué se investiga?
Marco Teórico En qué me apoyo?
Método/Metodología Cómo investigo?
Aspectos Administrativos Qué recursos requiero?
El proceso de investigación científica, se resume en tres fases perfectamente definidas, lo
menciona (Cisneros Guzmán):

Fase 1. Diseño, planificación y organización del experimento


Fase 2. Ejecución del experimento
Fase 3. Procesamiento y análisis de resultados del experimento.

Fase 1. Diseño, planificación y organización del experimento:

1. Definir y delimitar del problema de experimentación.


Consiste en establecer con claridad y precisión lo que se desea experimentar
Determinar: la unidad experimental y sus características, la variable respuesta, como se va
a medir, los factores controlados y no controlados.
2. Justificar la importancia y relevancia del experimento.
Explicitar las razones que fundamentan y sustentan la ejecución del proceso experimental.
3. Establecer los objetivos del estudio.
Los resultados que se espera alcanzar al término de la experimentación. Debe recordarse
que todo objetivo debe ser específico, medible, observable y fundamentalmente alcanzable.
4. Formular las hipótesis de trabajo. Establecer con precisión las hipótesis de trabajo que
guiarán la experimentación, las mismas que serán docimadas con los resultados del
experimento. Es imprescindible que, para el planteamiento definitivo de las hipótesis, éstas
consideren una hipótesis para cada factor a controlar y para sus interacciones.
5. Marco Teórico.
Es la fundamentación teórica, presentación crítica de las principales escuelas, enfoques,
teorías existentes sobre el tema en donde se muestra el estado actual del conocimiento en
este campo. Los principales debates resultado e instrumentos utilizados, en general
aspectos relevantes sobre el tema de investigación
6. Método y técnicas (Diseñar el programa de experimentación).
El método es el proceso o camino sistemático a seguir y las técnicas son las herramientas
para alcanzar los resultados
Establecer las características básicas que cada unidad debe reunir, su ubicación y proceso
de selección
La variable respuesta que será observada en las unidades experimentales, momento,
tiempos, forma, procedimientos de observación y medición de cada variable respuesta.
Los factores que serán controlados, forman y procedimiento de control y dosificación de los
niveles de factor que serán utilizados; de igual manera se indicará la forma en que la
ocurrencia de los factores no controlados será estandariza para todas las unidades
experimentales.
Se establecerán la instrumentación técnica requerida.
Establecer el mejor modelo de diseño experimental a ser utilizado y con ello los
procedimientos estadísticos de análisis
Limitaciones en términos de tiempo, instrumentación, recursos y resultados. El diseño
implica no sólo precisar lo antes citado, incluye elaborar un programa sistemático y completo
de ejecución del experimento que establezca las técnicas experimentales que serán
utilizadas.
7. Aspectos Administrativos
Presupuesto y cronograma

Fase 2. Ejecución del experimento:

1. Establecer los procesos de control. Del procedimiento de ejecución del experimento, de la


observación y registro de la variable respuesta y de la dosificación de los factores.
2. Diseñar instrumentos de registro. De control y verificación de resultados, así como de
observación y medición de la variable respuesta y de factores.
3. Ejecución del experimento. Aplicar los procedimientos, técnicas y rutinas experimentales
diseñadas.

Fase 3. Procesamiento y análisis de resultados:


1. Procesamiento de la información. Consiste en depurar los datos obtenidos e ingresar al
computador la información de manera sistemática.
2. Análisis de resultados. El análisis implica la aplicación de técnicas estadísticas previstas para
el análisis de datos experimentales, docimar las hipótesis planteadas, plantear sus
conclusiones; establecer las limitaciones a las conclusiones obtenidas a partir de la ejecución
experimental y a la evidencia de los datos.
3. Discusión y Conclusiones
La conclusión debe estar vinculada con el objetivo del estudio, claramente apoyado por los datos
obtenidos
4. Elaborar el informe final. Consiste en elaborar la memoria técnica del experimento que
recoja toda la información relevante desde el diseño hasta el análisis y conclusiones de sus
resultados.

Tarea:
Con el fin de evaluar una investigación propuesta con enfoque experimental responda las siguientes
preguntas:
1. ¿Qué se va a medir, cómo, dónde?
2. ¿Qué características se van a analizar?
3. ¿Qué factores afectan las características que se van a analizar?
4. ¿Cuáles de esos factores se estudiarán en esta investigación?
5. ¿Cuál es la variable respuesta?

ANALISIS DE VARIANZA

El ANOVA, desarrollado por Ronald Fisher en 1918, extiende la prueba t y la prueba Z que
compara tan solo 2 grupos.

La técnica del análisis de la varianza (ANOVA o AVAR), es una de las técnicas más utilizadas en
los análisis de los datos de diseños experimentales, fue desarrollado por Ronald Fisher,
procedimiento utilizado cuando se quiere contrastar más de dos medias.

El análisis de varianza (ANOVA) es la técnica central en el análisis de datos experimentales

El Análisis de Varianza consiste en partir la suma de los mínimos cuadrados debido a la


variación total, de una serie de observaciones, en las sumas de los mínimos cuadrados
correspondientes a las variables independientes incluidas en el plan experimental; y, en la
suma de los mínimos cuadrados del error experimental.
Los valores registrados corresponden a la variable respuesta observados en cada unidad
experimental; la variación que registren los diferentes valores de la variable respuesta es una
medida del efecto que produce uno o más factores en esta variable y del error experimental.
El objetivo del Análisis de Varianza es particionar la variación total observada en aquella
debida a efecto del factor o factores incluidos en el diseño y en aquella debida al error
experimental.
Si el experimento utiliza un solo factor o variable independiente, entonces la suma de
cuadrados de la variación total observada en la variable respuesta se divide en dos partes: la
primera que determina la variación debido al efecto del factor considerado, o variación entre
los tratamientos; y la segunda, que representa a la variación debido al error experimental o
variación dentro de los tratamientos, lo que se traduce a la siguiente identidad:

Variación total = Variación entre tratamientos + Variación del Error


∑(xij −µ)2 =n j ∑(µj −µ)2 +∑(xij −µj )2

en donde:
Σ (Xij - µ)2 = Suma de cuadrados total = SCT
2
nj Σ (µj - µ) = Suma de cuadrados entre Tratamientos = SCE
Σ (Xij - µj)2 = Suma de cuadrados Residual = Error = SCR
de donde:
SCT = SCE + SCR.
Una forma abreviada de calcularlo es:
(∑ 𝑋𝑖𝑗)2
𝐹𝑐 =
𝑛
2
𝑆𝐶𝑇 = ∑ 𝑋 − 𝐹𝑐
𝑖𝑗
SCE =∑((∑x.j )2 / nj) -FC

SCR = SCT – SCE

Los grados de libertad son:

Los datos atípicos afectan la media y la varianza


Nota: la RL se relaciona con el ANOVA, los coeficientes de la RL son similares a las medias de
cada tratamiento (ANOVA una vía), donde el intercepto= U1; intercepto+ coeficiente1= U2; y
así sucesivamente

Los supuestos básicos del análisis de varianza son las mismas asociadas con el análisis de
regresión:
• Aditividad
• Independencia
• Aleatoriedad
• Linealidad
• Varianzas homogéneas o homocedasticidad
• Normalidad
Existen varios "modelos" en el análisis de varianza dependiendo del diseño formulado, los más
utilizados son:
• Modelo aleatorizado de una variable, o a un criterio de clasificación, análisis de varianza de
un factor o ANOVA una vía (DCA)
• Modelo aleatorizado de dos variables, o de dos criterios de clasificación, o de bloques,
análisis de varianza de dos factores o ANOVA dos vías (DBCA)
• Cuadrado Latino, Grecolatino
• Diseños factoriales

Relacionar el Análisis de Varianza con La Regresión Lineal


Xi= VARIABLE INDEPENDIENTE o FACTOR
Yi=VARIABLE DEPENCDIENTE O RESPUESTA
*Yi

Ŷ=media de los tratamientos o valores predichos o valores ajustados


variación total=variación explicada o debido a la regresión + variación no explicada o debido al
error
variación total=variación debido al tratamiento + variación del error

ANÁLISIS DE VARIANZA DE UN FACTOR O UNA VÍA (DCA)


En este diseño, interviene un solo factor o variable independiente con más de dos niveles ,
llamados también tratamientos, de forma que a una unidad experimental se le aplicará un
solo tratamiento; suele ser común que uno de los tratamientos implique la no aplicación del
factor, o que el factor tiene en éste tratamiento su nivel mínimo, cero; en este caso, al
tratamiento así asignado se le denomina "testigo" y servirá de elemento base para medir el
efecto de los restantes niveles del factor en la variable respuesta.
Este es un modelo en el cual los tratamientos, sometidos a experimentación, son asignados
completamente al azar a las unidades experimentales o viceversa.

MODELO MATEMÁTICO
Modelo de efectos fijos

X ij =µ+αj +εij
Modelo estadístico lineal

Donde:

Xij = Valor de la variable respuesta


µ = Es el promedio general o promedio poblacional
αj = Es el efecto del j-ésimo tratamiento
εij = Es el error o valor residual de la i-ésima observación del j-ésimo
tratamiento, que se considera es independiente de observación a
observación y está normalmente distribuido con valor esperado igual a
cero y varianza igual a σ2, Ν (0, σ2).

La representación del diseño en una tabla es el siguiente:

TRATAMIENTO

OBSERV/Réplicas T1 T2 Tj Ta
1 X11 X12 X1j X1a
2 X21 X22 X2j X2a
i Xi1 Xi2 Xij Xia
:
𝑛𝑖 Xni2 Xni2 Xnij Xnia
TOTALES X1 X2 Xj Xa
Observaciones 𝒏𝟏 𝒏𝟐 𝒏𝒋 𝒏𝒂
Medias 𝒖𝟏 𝒖𝟐 𝒖𝒋 𝒖𝒂

Tenemos a tratamientos y N o n unidades experimentales. Denotemos por 𝑋𝑖𝑗 la respuesta i-


esima en el tratamiento j-esimo. Por tanto, i = 1, ..., ni, y j = 1, ...,a. Siendo “a” el número total de
tratamientos El modelo completo, considera que cada tratamiento tiene su media μj.
Generalizando que el número de repeticiones en cada tratamiento es nj y la media de cada
tratamiento es μj
El diseño es balanceado cuando hay igual número de observaciones en cada tratamiento, el
número de tratamientos es determinado por el investigador, por lo general “se recomienda de 5
a 30 mediciones en cada tratamiento”(Gutiérrez Pulido & De la Vara Salazar, 2012)

La elección más usual para μ es la media de la media de los tratamientos


1
µ=a ∑aj=1 µj

Con esta elección la suma de los efectos de los tratamientos es cero:


𝑎

∑ 𝛼𝑗 = 0
𝑗=1

La estimación de los efectos de los tratamientos es


𝛼𝑗 =𝑢𝑗 − µ

La diferencia que debe tener las medias entre sí para concluir que hay un efecto (que los tratamientos son
diferentes), nos indica el ANOVA

CUADRO DE ANALISIS DE VARIANZA


FUENTE DE GRADOS DE SUMA DE CUADRADO ESTADISTICA DE
VARIACION LIBERTAD CUADRADOS MEDIO PRUEBA
Tratamientos a-1 SCE CME = SCE / (a - 1) Fc = CME / CMR
Residual (Error) n-a SCR CMR = SCR / (n -a)
Total n-1 SCT

PRUEBA DE HIPÓTESIS
1. Formulación de la Hipótesis:

H0: µ1 = µ2 = µj =..... = µa H0 : αj = 0
HA: µ1 ≠ µ2 ≠ µj ≠ ..... ≠ µa HA : αj ≠ 0 para algún j

En la que µj representa el promedio del j-ésimo tratamiento del diseño y µa representa el


promedio del a-ésimo tratamiento.

2. Determinación de la estadística de prueba

Fc = CME / CMR

3. Criterio de Decisión
Rechazar la H0 si : Fc ≥ Fα,v1,v2
Realizar el ejercicio 3.3 (página 62 y 63 del libro de Oehlert)
Ejemplo del Libro de Análisis y diseño de experimentos, Gutiérrez Humberto y Salazar
Román, tercera edición
Ejercicio 15, página 81

Solución:
Formulación de la Hipótesis:
H0: µ1 = µ2 = µ3 No existe diferencia significativa en el promedio de la dureza de las tabletas debido
al porcentaje de almidón
HA: µ1 ≠ µ2 ≠ µ3 Existe diferencia significativa en el promedio de la dureza de las tabletas debido a
la cantidad de almidón

Determinación de la estadística de prueba


Fc = CME / CMR = 13,3633333/0,23 =58,1015

Criterio de Decisión
Rechazar la H0 si : Fc ≥ Fα,v1,v2
58,1015 > F 0,05 ; 2, 9
58,1015 > 4,2564 Rho

Si el valor p < α, entonces Rho


P-valor: Rechazo la Ho, el p-valor es menor al nivel de significancia (0,05) 0,00000715857<0,05
Si existe diferencia significativa en el promedio de la dureza de las tabletas debido a la cantidad de
almidón

ANÁLISIS DE VARIANZA
FV SC GL CM Fc Valor p Ft
Tratamientos (Dureza) 26,7266667 2 13,3633333 58,1014493 7,16E-06 4,25649473
Error 2,07 9 0,23
Total 28,7966667 11
Ejercicios resuelto de texto:LIND Douglas,MARCHAL William, WATHEN Samuel (2015) Estadística
Aplicada a los negocios y a la Economías; Mc Graw Hill, México. Pg 425
La siguiente es información muestral. Verifique la hipótesis de que las medias de tratamiento son
iguales. Utilice el nivel de significancia de 0.05.

a) Formule las hipótesis nula y alternativa.


b) ¿Cuál es la regla de decisión?
c) Calcule los valores SSR, SSE y SS total.
d) Elabore una tabla ANOVA.
e) Declare su decisión respecto de la hipótesis nula.

Solución:

𝐻0 : 𝜇1 = 𝜇2 = 𝜇3 No existe diferencia significativa entre las medias de tratamientos


𝐻0 : 𝜇1 ≠ 𝜇2 ≠ 𝜇3 Existe diferencia significativa entre las medias de tratamientos
REGLA DE DECISION:
grados d elibertad en el numerador: 3-1= 2
grados d elibertad en el denominador: 12-3= 9
Si el 𝐹𝐶 ≥ 4,96, SE RECHAZA LA HIPOTESIS NULA
SCT= 74,92
SCE= 62,17
SCR= 12,75
FC= 310,08

FUENTE DE SUMA DE GRADOS DE CUADRADO F


VARIACION CUADRADOS LIBERTAD MEDIO
TRATAMIENTOS 62,17 2 31,09 21,98
ERROS 12,75 9 1,42
TOTAL 74,92 11

Por lo tanto rechazo la hipótesis nula y concluyó que si existe diferencia significativa entre los medios de
tratamientos.
Con siguiente es información muestral. Verifique la hipótesis con un nivel de significancia de 0.05 de que
las medias de tratamiento son iguales.
a) Formule las hipótesis nula y alternativa.
b) ¿Cuál es la regla de decisión?
c) Calcule SST, SSE y SS total.
d) Elabore una tabla ANOVA.
e) Declare su decisión respecto de la hipótesis nula.
Solución:
𝐻0 : 𝜇1 = 𝜇2 = 𝜇3 No existe diferencia significativa entre las medias de tratamientos
𝐻0 : 𝜇1 ≠ 𝜇2 ≠ 𝜇3 Existe diferencia significativa entre las medias de tratamientos
REGLA DE DECISION:
grados de libertad en el numerador: 3-1= 2
grados de libertad en el denominador: 15-3=12
Si el 𝐹𝐶 ≥ 3,89, SE RECHAZA LA HIPOTESIS NULA
SCT= 152,93
SCE= 70,4
SCR= 82,53
FC= 2184,07
FUENTE DE SUMA DE GRADOS DE CUADRADO F
VARIACION CUADRADOS LIBERTAD MEDIO
TRATAMIENTOS 70,40 2 35,20 5,12
ERROS 82,53 12 6,88
TOTAL 152,93 14

Por lo tanto, rechazo la hipótesis nula y concluyo que a un nivel de confianza de 0,05 si existe diferencia
significativa entre las medias de tratamientos.

COMPARACIÓN ENTRE TRATAMIENTOS


COMPARACIONES MÚLTIPLES O PRUEBAS DE RANGOS MÚLTIPLES

Cuando la decisión es rechazar la Ho en el análisis de varianza, es necesario ver cuales tratamientos son
diferentes

- Diferencia mínima significativa DMS o LSD (least significant difference)


- Prueba de rangos múltiples de Duncan
- Prueba de Tukey
- Prueba de Scheffé
- Prueba de Bonferroni

La diferencia de los métodos es la potencia para detectar las diferencias entre las medias
DIFERENCIA MÍNIMA SIGNIFICATIVA

1. Planteamiento de hipótesis

𝐻𝑜: 𝑢1 = 𝑢2
𝐻1 : 𝑢1 ≠ 𝑢2

2. DMS= tα/2, v*𝜎𝑥̅1−𝑥̅2


Donde:
σ2 𝜎 2 2 ∗ 𝐶𝑀𝑅
𝜎𝑥̅1−𝑥̅2 = √ + =√
𝑛1 𝑛2 𝑛𝑗
Usualmente no conocemos 𝜎 2 , así que usamos la estimación que obtenemos de los CMR

GL= N-K En modelos equilibrados, entonces GL= N-K

Gl = (𝑛1 + 𝑛2 − 2) = (2 ∗ 𝑛𝑗 − 2)

Si tengo dos grupos a comparar. Entonces F=2* t (ver Webster pg. 285), por ejm: si tengo 4 tratamientos y cada
uno con 7 réplicas, entonces para la distribución F tiene 1 gl del numerador y del denominador (n- a) 28-4=24
𝐹𝛼,1,𝑁−𝑎 mientras que los gl de t =14-2 𝑡𝛼∕2,𝑣

3. Si | 𝑥̅1 − 𝑥̅ 2|≥ DMS , entonces Rho

Ver libro de Oehlert página 97 “Comparaciones por pares”


Nota: Comparaciones de tratamientos con DMS en: Página 285 del libro de Webster (utiliza la distribución
F)

Fuente: (Webster, 2000)

MÉTODO DE TUKEY
Esta prueba fue desarrollada por John W. Tukey. El método de Tukey se utiliza en ANOVA
La prueba de Tukey es similar a una prueba t de Student en cuanto a que se calcula una única diferencia
crítica para realizar todas las comparaciones entre las medias; sin embargo, es también similar a la prueba
de Duncan y de Newman-Keuls en cuanto a que el valor de esta diferencia crítica depende del número de
comparaciones que se haga.
Es un método más conservador para comparar pares de medias de tratamientos.
Cuando utilizar el método de Tukey
• Solo se debe usar después que se ha rechazado la hipótesis nula en el análisis de varianza
• Cuando el tamaño de las muestras seleccionadas para cada grupo es igual
• Cuando el interés fundamental es comparar promedios entre dos grupos y son múltiples las
comparaciones que estemos haciendo
• La prueba de Tukey es la prueba más aplicada y preferida por los estadísticos pues controla de
mejor manera los errores ampliamente conocidos en la estadística

Planteamiento de hipótesis

𝐻𝑜: 𝑢1 = 𝑢2
𝐻1 : 𝑢1 ≠ 𝑢2

Diferencia honestamente significativa (HSD de Tukey):


𝐶𝑀𝑅
𝐻𝑆𝐷 = 𝑞𝛼 ∗ √
𝑛𝑗
Donde: qα = K, v (buscar en la tabla de cuantiles de la distribución de Tukey)
K (grupos o N° de tratamientos), v (grados de libertad)=N-K

Decisión Si l i- j l ≤ HSD → ACEPTAR H0

Si l i- j l > HSD → RECHAZAR H0

Test de Bonferroni para comparaciones múltiples


Los métodos para hacer frente a las comparaciones múltiples con frecuencia plantean ajustar el nivel de
significación α de alguna manera para que la probabilidad de observar al menos un resultado significativo
debido al azar se mantenga por debajo del nivel de significación deseado α.
El método de Bonferroni corrige el nivel de significación al punto de corte α/n siendo n el número de contrastes
a realizar. Por ejemplo, si n = 20 contrastes y nivel de significación α= 0.05, rechazaríamos hipótesis nulas en cuyo
test el pvalor fuera inferior a 0.05/20 = 0.0025.

COMPARACION POR CONTRASTES


CONTRASTES ORTOGONALES (FUNCION LINEAL)
Permite comparar dos o más tratamientos o subconjuntos de tratamientos, la comparación puede incluir
todas las medias de los tratamientos o solo una parte de estas.
La función lineal puede expresarse en términos de los totales o del promedio de cada tratamiento

1. Planteamiento de hipótesis
Si se tiene los siguientes tratamientos: µ1, µ2, µ3, µ4
Ho: Coeficiente ortogonal

λ1 λ2 λ3 λ4 ∑λj
Comparación con 2 tratamientos
(µ1 - µ2) = 0 µ1 = µ2 1 -1 0 0 0
(µ1 - µ3) = 0 µ1 = µ3 1 0 -1 0 0
(µ2- µ3) = 0 µ2 = µ3 0 1 -1 0 0
Comparación con 3 tratamientos λ1 λ2 λ3 λ4 ∑λj
(µ1 + µ2)/2 - µ3 = 0 µ1 + µ2 - 2 µ3 = 0 * 1 1 -2 0 0
(µ1 + µ3)/2 - µ2 = 0 µ1 -2µ2+ µ3 = 0 1 -2 1 0 0
(µ2 + µ3)/2 - µ1 = 0 - 2 µ1 µ2 + µ3 = 0 -2 1 1 0 0
Comparación con 4 tratamientos λ1 λ2 λ3 λ4 ∑λj
(µ1 + µ2+ µ3)/3 - µ4 = 0 µ1 + µ2+ µ3 - 3µ4 = 0 1 1 1 -3 0
(µ1 + µ3+ µ4)/3 - µ2 = 0 µ1 + µ3+ µ4 -3 µ2 = 0 1 -3 1 1 0
(µ1 + µ2+ µ3)/3 - µ4 = 0 µ1 + µ2+ µ3 - 3 µ4 = 0 1 1 1 -3 0
(µ1 + µ2)/2 - (µ3+ µ4)/2 = 0 µ1 + µ2- µ3 - µ4 = 0 1 1 -1 -1 0
(µ1 + µ3)/2 - (µ2 + µ4)/2 = 0 µ1 + µ3- µ2 - µ4 = 0 1 -1 1 -1 0
(µ1 + µ4)/2 - (µ2 + µ3)/2 = 0 µ1 + µ4- µ2 - µ3 = 0 1 -1 -1 1 0

* (u1+u2)/2 –u3=0; (u1+u2-2u3)/2 = 0; u1+u2-2u3=0

2. La estadística de prueba que se utiliza en la comparación de medias es la estadística t


calculada en donde:
𝑳
𝒕𝒄 = 𝝈
𝑳
Donde:
̅𝟏 + 𝝀 𝟐 𝒚
𝑳 = 𝝀𝟏 𝒚 ̅𝟐 + 𝝀 𝟑 𝒚
̅𝟑 + ⋯ + 𝝀 𝒂 𝒚
̅𝒂

(se puede trabajar con medias o totales)


Error estándar de la función lineal
𝝀𝒋 𝟐
𝝈𝑳 = 𝝈 ∗ √∑
𝒏𝒋

𝝀𝟏 𝟐 𝝀𝟐 𝟐 𝝀𝟑 𝟐 𝝀𝒂 𝟐

𝝈𝑳 = 𝝈 ∗ ( + + + ⋯+ )
𝒏𝟏 𝒏𝟐 𝒏𝟑 𝒏𝒂
𝝈 = √𝑪𝑴𝑹

3. El criterio de decisión será el de rechazar la Hipótesis nula planteada si:

| tc | ≥ t α/2, v

Los grados de libertad se considera las corridas menos los tratamientos (gl=N-K)

Los contrastes ortogonales pueden ser calculados con la distribución F, particionando la SCE, como se
señala más adelante
VERIFICACION DE SUPUESTOS
En resumen, mediante el ANOVA analizamos los datos experimentales comparando las respuestas medias en los
distintos tratamientos y en caso de detectar diferencias significativas procedemos a un análisis más detallado basado
en comparaciones por parejas u otros contrastes. Todos estos procedimientos estadísticos se basan en la suposición
que los datos se ajustan al modelo (Oehlert, 2010)

X ij =µ+αj +εij

El análisis de varianza requiere que se satisfagan los supuestos:


• Normalidad
• Homogeneidad de varianzas
• Independencia
• Aditividad
• Aleatoriedad

La linealidad.- la hipótesis de linealidad no supone restricción en la práctica, porque a cada grupo


(tratamiento) se le permite una media diferente

Para comprobar cada supuesto existen pruebas analíticas y gráficas. Las pruebas gráficas no son “exactas”,
pero, aun así, en la mayoría de las situaciones prácticas proporcionan la evidencia suficiente en contra o
a favor de los supuestos. El uso de las pruebas gráficas requiere una fuerte evidencia visual para concluir
que el supuesto en cuestión no se cumple, ya que se requiere que la evidencia en contra de un supuesto
esta soportada por más de dos puntos. Cuando son uno o dos los puntos que se salen del comportamiento
esperado de las gráficas se pueden tratar de un problema de puntos aberrantes, no de violación del
supuesto en cuestión. En ese caso debe investigarse la obtención de dichas mediciones atípicas, ya que
ese tipo de puntos pueden afectar sensiblemente los resultados del análisis. (Gutiérrez Pulido & De la
Vara Salazar, 2012)

Se puede utilizar una prueba analítica para subsanar las ambigüedades que surjan en la interpretación
visual (subjetiva) de las gráficas.

Los supuestos del modelo lineal en términos de los residuos 𝑒𝑖𝑗 son:
• Los 𝑒𝑖𝑗 siguen una distribución normal con media 0
• Los 𝑒𝑖𝑗 son independientes entre sí
• Los 𝑒𝑖𝑗 de cada tratamiento tienen la misma varianza
Los residuos 𝑒𝑖𝑗 vienen dados por la diferencia entre el valor observado 𝑦𝑖𝑗 y el valor ajustado o predicho
(media del tratamiento 𝑢𝑖 ) según el modelo para dicha observación.

En el caso del ANOVA un factor el valor residual para la observación 𝑦𝑖𝑗 es


𝑒𝑖𝑗 = 𝑦𝑖𝑗 − 𝑢𝑖
2
Se asume que 𝑒𝑖𝑗 ~ N(0,𝜎 ) y es independiente de observación en observación
Donde: 𝑦𝑖𝑗 = valor observado
𝑢𝑖 = media del tratamiento i
De manera que los errores o residuales y los valores observados son independientes y siguen una
distribución normal pero el primer caso con media 0 mientras el segundo con media de cada
tratamiento

En caso que alguno de los supuestos como: normalidad, homogeneidad de varianzas o independencia de
los términos de error de cada observación, no se cumplan, impactaran sobre la distribución del estadístico
F y con ello el verdadero nivel de significancia de la prueba de hipótesis del ANOVA, afectando así la
calidad de las conclusiones que finalmente obtendremos. Por ello, resulta importante verificar que los
supuestos del análisis se cumplen antes de elaborar conclusiones.

PRUEBA DE NORMALIDAD
- Prueba de Chi-Cuadrado para bondad y ajuste
- Prueba de Shapiro-Wilks (no paramétrica, libre distribución, observaciones< 50)
- Prueba Kolmogorov-Smirnov (observaciones >50)
- Prueba Anderson-Darling
- Prueba de Jarque Bera

La normalidad se prueba con valores observados sin embargo es más eficaz con residuales.
“Desafortunadamente cuando se trabaja con muestras pequeñas, suelen ocurrir fluctuaciones
significativas, por lo que la aparición de una desviación moderada de la normalidad no implica
necesariamente una violación seria de los supuestos” (Montgomery, 2004)

Prueba de Shapiro-Wilks
1)Planteamiento de hipótesis
𝑯𝟎 : 𝒍𝒂 𝒅𝒊𝒔𝒕𝒓𝒊𝒃𝒖𝒄𝒊ó𝒏 𝒅𝒆 𝒅𝒂𝒕𝒐𝒔 𝒕𝒊𝒆𝒏𝒅𝒆𝒏 𝒂 𝒖𝒏𝒂 𝒏𝒐𝒓𝒎𝒂𝒍 (F(x) es normal)
𝑯𝟏 : 𝒍𝒂 𝒅𝒊𝒔𝒕𝒓𝒊𝒃𝒖𝒄𝒊ó𝒏 𝒅𝒆 𝒅𝒂𝒕𝒐𝒔 𝒏𝒐 𝒕𝒊𝒆𝒏𝒅𝒆 𝒂 𝒖𝒏𝒂 𝒏𝒐𝒓𝒎𝒂𝒍 (𝑭(𝒙) 𝒏𝒐 𝒆𝒔 𝒏𝒐𝒓𝒎𝒂𝒍)
2)
1 2
𝑊𝑐 = [∑ 𝑎 𝑖 (𝑥(𝑛−𝑖+1) − 𝑥𝑖 )]
(𝑛 − 1)𝑆 2
Nota: varianza muestral y datos ordenados
3) 𝑺𝒊 𝑾𝒄 ≤ 𝑾𝟏−∝,𝒏 → 𝑨𝒄𝒆𝒑𝒕𝒂 𝑯𝟎
𝑺𝒊 𝑾𝒄 ≤ 𝑾∝,𝒏 → 𝑹𝒆𝒄𝒉𝒂𝒛𝒂 𝑯𝟎
Análisis gráfico
1. Se ordena los valores observado o residuos
2. Calcular una posición de graficación para cada dato en función de su rango y del total de
observaciones (i-0.5)/N
3. Se gráfica, eje x los valor observado o residuos (los ordenados), eje y (i-0.5)/N o Z

Desarrollado el EJEMPLO 3-1 (Libro de Montgomery, pág. 60) El experimento de la resistencia a la


tensión

Solución:
Variable respuesta= resistencia a la tensión
Factor= peso porcentual de algodón
Unidad experimental= algodón de una fibra sintética, tela para camisa de caballero

Prueba de Shapiro-Wilks

Resistencia
ai
(ordenados)

7 0,445 18 8,01
7 0,3069 16 4,9104
7 0,2543 15 3,8145
9 0,2148 10 2,148
10 0,1822 9 1,6398
11 0,1539 8 1,2312
11 0,1283 8 1,0264
11 0,1046 7 0,7322
12 0,0823 6 0,4938
12 0,061 6 0,366
14 0,0403 4 0,1612
15 0,02 2 0,04
15 0 0
17 24,5735
18
18
18 Wc= 0,94802955
18 Wt= 0,918
19 Aho
19
19
19
22
23
25

Análisis gráfico
𝑒𝑖𝑗 =𝑦𝑖𝑗 − µ =𝑦𝑖𝑗 -15
Peso porcentual 𝑒𝑖𝑗
Totales
del algodón 1 2 3 4 5
15 -8 -8 0 -4 -6 -26
20 -3 2 -3 3 3 2
25 -1 3 3 4 4 13
30 4 10 7 4 8 33
35 -8 -5 -4 0 -4 -21

P Z
Residual (ordenado) i (orden) (i-0,5)/25 N(0,1)
-8 1 0,02 -2,05
-8 2 0,06 -1,55
-8 3 0,1 -1,28
-6 4 0,14 -1,08
-5 5 0,18 -0,92
-4 6 0,22 -0,77
-4 7 0,26 -0,64
-4 8 0,3 -0,52
-3 9 0,34 -0,41
-3 10 0,38 -0,31
-1 11 0,42 -0,20
0 12 0,46 -0,10
0 13 0,5 0,00
2 14 0,54 0,10
3 15 0,58 0,20
3 16 0,62 0,31
3 17 0,66 0,41
3 18 0,7 0,52
4 19 0,74 0,64
4 20 0,78 0,77
4 21 0,82 0,92
4 22 0,86 1,08
7 23 0,9 1,28
8 24 0,94 1,55
10 25 0,98 2,05

Gráfico 1
Gráfica de probabilidad normal de los
residuos
1.2
1
0.8
(i-0,5)/n

0.6
0.4
0.2
0
-10 -5 0 5 10 15
xi (resistencia)

Gráfico 2
Grafica de probabilidad (z)
3

0
Z

-10 -5 0 5 10 15
-1

-2

-3
xi (resistencia)

La presencia de ligeras violaciones de este supuesto (normalidad) no resulta grave para el ANOVA, ya que
no afecta de forma importante la probabilidad de cometer Error de Tipo I.

HOMOGENEIDAD DE VARIANZAS (HOMOCEDASTICIDAD)


Las varianzas homogéneas son también conocidas como datos homocedàsticos, si no se cumple el
supuesto de homogeneidad de varianzas, este tipo de patrón es indeseable ya que puede llevarnos a
cometer errores en las conclusiones; frecuentemente se asocia con una mayor probabilidad de cometer
Error Tipo II.
La Prueba de Levene, que se construye como un ANOVA del valor absoluto de los residuos, fue diseñada
para concluir sobre la homogeneidad/heterogeneidad de los errores entre tratamientos.
Si el gráfico de dispersión de predichos vs residuos presentará una nube de puntos sin patrón alguno es
un indicador de un buen ajuste del modelo a sus datos.
Si la suposición de homogeneidad no se cumple, la prueba de F es afectada solo ligeramente en los
modelos balanceados (igual número de observaciones por tratamiento) de efectos fijos. Sin embargo, el
problema es más serio si el diseño esta desbalanceado o si una varianza es mucho mayor que las otras.
En un modelo de efectos aleatorios, la desigualdad en las varianzas del error puede perturbar
significativamente las inferencias sobre los componentes, aunque se use un diseño balanceado.
Entre los test para probar homogeneidad de varianzas se citan:
• Barlett
• Levene
• Hartley
• Cochran
• Fligner & Killen
• Lagard

TEST DE COCHRAN (igual número de unidades experimentales por tratamiento)


1.- Planteamiento de Hipótesis
𝑯𝑶 : 𝝈𝟏 𝟐 = 𝝈𝟐 𝟐 = 𝝈𝟑 𝟐 = 𝝈𝟒 𝟐 = 𝝈𝒌 𝟐 (Todas las varianzas son iguales)
𝑯𝟏 : 𝝈𝟏 𝟐 ≠ 𝝈𝟐 𝟐 ≠ 𝝈𝟑 𝟐 ≠ 𝝈𝟒 𝟐 ≠ 𝝈𝒌 𝟐 (No todas las varianzas son iguales o al menos una es diferente)
𝑺𝒊 𝟐 𝒎𝒂𝒔 𝒈𝒓𝒂𝒏𝒅𝒆 𝟏𝟏.𝟐
2.- 𝑮𝒄 = = = 𝟎. 𝟐𝟕𝟕𝟗
∑ 𝑺𝒊 𝟐 𝟒𝟎.𝟑

3.- Si 𝑮𝒄 > 𝑮𝜶,𝒌,𝒏𝒋 => 𝑹𝑯𝒐 , teniendo en cuenta que: 𝛼 = 0.05; 𝑘 = 5, 𝑛𝑗 = 5

𝑘 = 𝑁º 𝑑𝑒 𝑡𝑟𝑎𝑡𝑎𝑚𝑖𝑒𝑛𝑡𝑜

𝑛𝑗 = 𝑁º 𝑑𝑒 𝑢𝑛𝑖𝑑𝑎𝑑𝑒𝑠 𝑒𝑥𝑝𝑒𝑟𝑖𝑚𝑒𝑛𝑡𝑎𝑙𝑒𝑠 𝑝𝑜𝑟 𝑡𝑟𝑎𝑡𝑎𝑚𝑖𝑒𝑛𝑡𝑜 (5)

Si 0.2779 <0.544 AHo. Existe igualad de varianzas, las varianzas de todos los tratamientos son iguales

Análisis gráfico
Residuos
Xi Predichos (por
tratamiento)
7 9,8 -2,8
7 9,8 -2,8
15 9,8 5,2
11 9,8 1,2
9 9,8 -0,8
12 15,4 -3,4
17 15,4 1,6
12 15,4 -3,4
18 15,4 2,6
18 15,4 2,6
14 17,6 -3,6
18 17,6 0,4
18 17,6 0,4
19 17,6 1,4
19 17,6 1,4
19 21,6 -2,6
25 21,6 3,4
22 21,6 0,4
19 21,6 -2,6
23 21,6 1,4
7 10,8 -3,8
10 10,8 -0,8
11 10,8 0,2
15 10,8 4,2
11 10,8 0,2

Predichos vs residuos
6
5
4
3
2
1
0
-1 0 5 10 15 20 25
-2
-3
-4
-5

Si los puntos en esta gráfica se distribuyen de manera aleatoria en una banda horizontal (sin ningún patrón
claro y contundente), entonces es señal de que se cumple el supuesto de que los tratamientos tienen igual
varianza
Este tipo de gráficos de residuos aparecerán tiras verticales de puntos, por cada nivel, si la varianza es
constante la extensión de las tiras será aproximadamente igual, caso contrario aparecerá un patrón en la
dispersión vertical de los residuos y cuando no se cumple el supuesto de varianza constantes el gráfico de
residuos muestra una forma de embudo.

Valor ajustado = predichos =media de cada tratamiento


Fuente: (Gutiérrez Pulido & De la Vara Salazar, 2012)

Gráfico donde se cumple los supuestos:


Se visualiza normalidad y homogeneidad de varianzas en los 3 grupos (tratamientos)

RELACION LINEAL ENTRE VARIABLES


Algunos modelos estadísticos exigen una relación lineal entre variables implicada, es decir, que a medida
que aumenta o disminuye el valor de una de ellas, aumentará o disminuirá también el valor de la otra.
Una manera visual de verificar este supuesto es recurrir a los denominados gráficos de dispersión.
Cuando la técnica empleada tiene una variable dependiente, como ocurre en el caso de la regresión lineal
múltiple, existen diversos procedimientos para contrastar la linealidad de las relaciones basadas en el
análisis de los residuos.

ALEATORIEDAD
La no aleatoriedad de la selección de la muestra puede reflejarse en la falta de independencia de los ítems,
heterogeneidad de las varianzas, o en la no normalidad de la distribución.
ADITIVIDAD
Si la interacción está realmente presente entonces la prueba F será muy ineficaz y posiblemente induzca
a error si el efecto de la interacción es muy grande. Una verificación de este supuesto requiere o bien más
de una sola observación por casilla.
La aditividad se refiere a que cada variable independiente por sí sola, suma a la explicación de la variable
dependiente. En otras palabras, no hay relación entre las variables independientes.
La aditividad en las varianzas supone que la variación total en los datos puede ser expresada como suma
de variaciones procedentes de fuentes diversas:
(Variación total en los datos) = (Variación debida al primer factor) + (Variación debida al segundo factor)
+ (Variación debida al error aleatorio)

Causas que afectan la aditividad del modelo:


• Que existan interacciones, y no estén representadas en el modelo aditivo lineal
• Que los efectos sean multiplicativos
• Se tomen observaciones equivocadas
INDEPENDENCIA
La suposición de independencia es la más importante y difícil de corregir en caso que no se cumpla. En el
diseño del experimento, una adecuada aleatorización en la asignación de los tratamientos a las unidades
experimentales y, en fin, cada paso del experimento, debe asegurarnos que las observaciones son
independientes. (Oehlert, 2010)

Para verificar el cumplimiento del supuesto de independencia se realiza un gráfico del orden de la corrida
(eje x) vs residuos (eje y), si el comportamiento de los puntos es aleatorio dentro de una banda horizontal,
el supuesto se está cumpliendo. Una prueba analítica para verificar la independencia entre residuos
consecutivos es la prueba de Durbin –Watson

Residuos
Xi Orden por
tratamiento

7 15 -2,8
7 19 -2,8
15 25 5,2
11 12 1,2
9 6 -0,8
12 8 -3,4
17 14 1,6
12 1 -3,4
18 11 2,6
18 3 2,6
14 18 -3,6
18 13 0,4
18 20 0,4
19 7 1,4
19 9 1,4
19 22 -2,6
25 5 3,4
22 2 0,4
19 24 -2,6
23 10 1,4
7 17 -3,8
10 21 -0,8
11 4 0,2
15 16 4,2
11 23 0,2

Orden vs residuos (por tratamiento)


6
5
4
3
2
1
0
-1 0 5 10 15 20 25 30
-2
-3
-4
-5

Decimos que el comportamiento de los puntos es aleatorio.

- Planteamiento de hipótesis:
Ho: No existe autocorrelación entre los residuos. Los residuos son independientes
Ha: Existe correlación entre los residuos. Los residuos no son independientes

SOLUCIÓN AL INCUMPLIMINTO DE SUPUESTOS

Corrigiendo la no normalidad
El aumentar la muestra puede corregir el problema de no normalidad
Cabe señalar que “Desvíos moderados a la falta de normalidad no afectan los resultados de las
estadísticas t y F” (Melo et al., 2020)”
La no normalidad, sobre todo debida a la asimetría, a veces puede ser disminuida mediante la
transformación de la variable respuesta a una escala diferente. La asimetría hacia la derecha se
ve reducida (disminuye valores grandes) por √𝑦, 4√𝑦, ln y, 1/y, u otra transformación a una
potencia menor que uno, mientras que la asimetría a la izquierda se ve reducida (aumentan
valores pequeños) por un 𝑦 2, 𝑦 3u otra transformación a una potencia mayor que uno.(Oehlert,
2010), (Melo et al., 2020)

Existen trabajos teóricos que tratan el problema de escoger las transformaciones, pero no existen
métodos prácticos que indiquen la transformación adecuada. (Melo et al., 2020)

Corrigiendo la no constancia de la varianza


La forma habitual de solucionar la no constancia de la varianza es por la transformación de la
variable respuesta. Para algunas distribuciones, hay transformaciones estándar que igualan o
estabilizan la varianza.
Hay una teoría general de las transformaciones estabilizadoras de la varianza que se aplica a las
distribuciones donde la varianza depende de la media (Libro Oehlert, página 127, tabla 6.3. Libro
de Melo, página 263, tabla 6.7).

Transformar significa un cambio de métrica de la variable original por una medida en otra escala

Transformación de Box-Cox
Esta transformación permite estabilizar la varianza y corregir el problema de no normalidad
(Melo et al., 2020)
Cuando no tenemos una distribución con una transformación conocida para la estabilización de
la varianza, entonces por lo general se ensaya una familia de transformaciones de potencia.
El método de Box-Cox establece un procedimiento para determinar a partir de los datos, la
transformación de potencia (busca la mejor función para obtener el λ óptimo). La familia de
transformaciones de Box-Cox vienen dadas por

donde 𝑦̅ es la media geométrica de la variable respuesta.

La técnica de Box-Cox transforma los datos (variable respuesta) explorando un rango de valores
de λ y realizando un ANOVA para cada transformación (es decir, para cada valor de λ). En cada
ANOVA obtenemos una suma de cuadrados del error (SCE) que dependerá de la λ usada, SCE (λ).
La mejor transformación λ será aquella para la cual el SCE (λ) alcanza el mínimo valor (Oehlert,
2010), (Montgomery, 2004)

Si: λ=0 ⇒ ln (y)


λ=0.5 ⇒ √𝑦
λ=-1 ⇒ 1⁄𝑦
λ=2 ⇒ 𝑦 2
Los valores de λ próximos a 1 sugerirán que no es necesario ninguna transformación
Para ampliar los conocimientos ver libro de Montgomery, capítulo 14, página 590

Según Melo (2020), se menciona que los modelos robustos para hacer transformaciones, es
analizar los datos con modelos lineales generalizados (MLG) y modelos con presencia de sobre
dispersión (MS), en el libro de Melo, Montgomery, se aborda de forma general estas técnicas

Continuar con el ejercicio inicial, que, aunque aceptamos la constancia de varianzas, para
implementar la técnica Box-Cox vamos a utiliza en estos datos

Ante el incumplimiento de los supuestos, otra solución es aplicar un análisis estadístico no


paramétrico, donde se aplica pruebas de distribución libre, que no se apeguen a una función
de distribución de probabilidad, por ejemplo, el test no paramétrico de Kruskal-Wallis.

Cabe indicar que estos métodos podrían ser motivo de otro curso

Se recomienda buscar la técnica adecuada que es mejor que forzar los datos para que se ajusten
a utilizar un ANOVA

TAMAÑO DE LA MUESTRA
El tamaño de muestra difiere si se quiere hacer estimaciones (inferencia) o se requiere para un
contraste (pruebas de hipótesis). La estimación aproxima a un parámetro de una población,
mientras que la prueba de hipótesis permite medir un efecto. De manera que la muestra para un
contraste debe basarse en el tamaño del efecto

TAMAÑO DE MUESTRA (MAS) para estimaciones


Poblaciones finitas
𝑁𝑍𝛼2⁄ (𝑝 ∗ 𝑞) 𝑁𝑍𝛼2⁄ 𝜎 2
2 2
𝑛= ;𝑛 =
𝑒 2 (𝑁 − 1) + 𝑍𝛼2⁄ (𝑝 ∗ 𝑞) 𝑒 2 (𝑁 − 1) + 𝑍𝛼2⁄ 𝜎 2
2 2

Poblaciones infinitas
𝑍𝛼2⁄ (𝑝 ∗ 𝑞) 𝑍𝛼2⁄ 𝜎 2
2 2
𝑛= ;𝑛 =
𝑒2 𝑒2
Cabe señalar que las fórmulas que se podrían utilizar para calcular el tamaño de muestra,
necesitan que ciertas cantidades se conozcan a priori, como la varianza, para esto puede
adoptarse la estrategia de que, a partir de un estudio piloto, asignarse los valores estimados para
estos parámetros.

Ejm: No queremos saber el número de plantas necesarias para estimar la altura media, si no cual es el
tamaño de la muestra necesario para detectar un efecto en la altura de la planta debido a los tratamientos

TAMAÑO DE MUESTRA PARA UN CONTRASTE


Los tamaños de muestra se asocian con el tipo de error y la potencia de la prueba
Un aspecto importante del diseño de experimentos es saber cuántas observaciones se necesitan
para que las conclusiones tengan una cierta precisión y la confianza suficiente. Como es lógico
esperar, el tamaño de muestra necesario depende de muchos factores, incluyendo el tipo de
experimento previsto, la forma en que se llevará a cabo, los recursos, la sensibilidad deseada y la
confianza exigida. La sensibilidad es la diferencia entre medias que el experimentado desea
detectar.

Como se ha señalado anteriormente el aumentar el número de réplicas aumenta la sensibilidad


y hace que sea más fácil de detectar pequeñas diferencias entre las medias, la elección del
tamaño de la muestra, la probabilidad del error tipo II (β) y la potencia guardan una estrecha
relación

Tamaño de muestra a partir de la potencia


En arreglos de DCA, a menudo el investigador está interesado en determinar el número de
réplicas que le permitan detectar diferencias significativas entre los tratamientos, es decir,
determinar si hay o no evidencia para que con la prueba F del análisis de varianza se rechace o
no la hipótesis nula.

Potencia de un contraste
El objetivo es contrastar la hipótesis de que los efectos de los distintos tratamientos son iguales,
frente a la alternativa de que algunos no lo son, se expresa como
𝐻0 : 𝛼1 = · · · = 𝛼𝑎 = 0
ya que imponemos la restricción
𝑎

∑ 𝛼𝑖 = 0
𝑖=1
E implica que los 𝛼𝑖 son todos iguales a 0

Como sabemos, al realizar un contraste podemos cometer un error de tipo I con probabilidad
α= P [Rechazar 𝐻0 |𝐻0 es cierta]

o un error de tipo II si
β= P [Aceptar 𝐻0 |𝐻𝐴 es cierta] o no rechazar la Ho cuando es falsa

La técnica desarrollada en la teoría estadística para decidir sobre el número de réplicas necesarias
en un experimento es el cálculo de la potencia de las pruebas estadísticas de interés. En la prueba
F del ANOVA a una vía, el cálculo directo de la potencia es generalmente complejo, pero se han
construido algunas gráficas, llamadas curvas características de operación, que permiten estimar
un valor para la probabilidad β o error de tipo II. La potencia 1-β se deduce a partir de esta
probabilidad.

La potencia de un contraste se define como


1 − β = P [Rechazar 𝐻0 |𝐻𝐴 es cierta] o probabilidad de rechazar correctamente 𝐻0

es, por tanto, la probabilidad complementaria al error del tipo II, es la probabilidad de no cometer
un error tipo II. Diversos autores mencionan que la potencia mínima aceptada es del 80% (1-
β=0.2), esto quiere decir que existe un 80% de probabilidad de rechazar correctamente la H0,
por tanto, β=0.2, indica que el 20% restante de las veces el error de muestreo hará que no se
rechace la Ho cuando esta es falsa
Se trata de construir contrastes que tengan un nivel de significación fijo que controle α y una
potencia máxima (es decir un error tipo II pequeño).
En este marco queremos calcular la potencia del test F en el caso de efectos fijos, que son
estudiados hasta el momento:
1 − β = P [Fc > Fα(a − 1,n − a)| 𝐻𝐴 es cierta]

Para calcular esta probabilidad se necesita conocer la distribución de F=CME/CMR. La sensibilidad


de la prueba F o poder de la prueba, denotado por 1-β, que depende de 𝜙 2 (media del efecto)

Usualmente se toma α = 0.05 ó α = 0.10. Es razonable escoger 1 -β = 0.80. La escogencia más


difícil es de 𝜙, porque está representa el verdadero estado de la naturaleza, basados en un
experimento piloto, datos históricos y el conocimiento que el investigador tenga es muy
importante
Tamaño del efecto (𝜟) fija el investigador y no es aleatorio, se fundamenta en la teoría, basarse
en un experimento piloto, datos históricos y se lo define a priori
El tamaño del efecto depende del diseño, tradicionalmente se dispone de valores referenciales para
el tamaño del efecto según, el diseño experimental propuesto se puede tomar como referencia la
escala según Cohen para ANOVA (pg 275)

𝑽𝒂𝒓𝒊𝒂𝒄𝒊ó𝒏 𝒊𝒏𝒕𝒆𝒓𝒎𝒖𝒆𝒔𝒕𝒓𝒂𝒍 (𝒆𝒏𝒕𝒓𝒆 𝒕𝒓𝒂𝒕𝒂𝒎𝒊𝒆𝒏𝒕𝒐𝒔)


𝜟=
𝑽𝒂𝒓𝒊𝒂𝒏𝒛𝒂 𝒑𝒐𝒃𝒍𝒂𝒄𝒊𝒐𝒏𝒂𝒍

Fuente: (Cárdenas Castro & Arancibia Martini, 2014)

Potencia de un contraste en ANOVA ( ()) = Probabilidad de rechazar H0,


cuando al menos dos tratamientos difieren en 

Depende de los tamaños muestrales (ni), del número de tratamientos (a), del nivel de
significancia (), y de la varianza del error (𝜎 2 )

Existen curvas de operación características para calcular n, ver libro Montgomery página 41 (para
dos grupos). Existen dos métodos para calcular la potencia: uno consiste en utilizar tablas de
potencia (tabla D10. O página 155 del Libro de Oelther), sin embargo, tienen la limitación de no
ser precisas o no hay la tabla con esas referencias. En la actualidad, podemos usar la función
pwr.anova.test del paquete pwr de R o la función power.anova.test, (entre otros) para hallar
la potencia del test anova. La primera necesita 𝜙 y la segunda . A continuación, veamos un
ejemplo en el que aplicaremos los conceptos anteriores.

Hacer ejercicio guía 3 y 4, pág 11


Aspectos a considerar:
• Un tamaño de muestra demasiado grande representa un desperdicio de recursos, tanto
materiales como humanos. Además, la calidad del estudio, dado dicho incremento, puede
verse afectada en sentido negativo.
• Un tamaño demasiado pequeño es un desperdicio de esfuerzo, pues no podrá detectar
un efecto significativo o se tendrán menos probabilidades de hacerlo

FACTORES QUE AFECTAN AL CÁLCULO DEL TAMAÑO MUESTRAL


- Según autores como Gutiérrez, de la Vara y Camacho-Sandoval, entre otros, indican que
la determinación del tamaño muestral dependerá de varios factores, según los objetivos
de la investigación:
- La variación esperada en los datos, debido a fuentes de variación no controladas. A mayor
variación será necesario un tamaño muestral mayor
- El número de tratamientos que se desea comparar. A mayor número de ellos, menor
tamaño muestral
- El número de variables o factores de estudio. Cuanto más numerosas, más grandes tendrá
que ser la muestra.
- Riesgo que está dispuesto a tomar el investigador
- La complejidad de los análisis estadísticos. Cuanto más complejos el tamaño deberá ser
más grande.
- Disponibilidad de los recursos, el presupuesto o el equipo que estará en campo
- Cuanto más heterogénea sea una población, mayor deberá ser el tamaño de la muestra
para obtener un nivel óptimo de precisión.

REPLICACIÓN
Ya logrado determinar el tamaño de la muestra, esto nos servirá para determinar el número de
réplicas
𝑛
𝑹é𝒑𝒍𝒊𝒄𝒂𝒔 =
𝑡𝑟𝑎𝑡𝑎𝑚𝑖𝑒𝑛𝑡𝑜𝑠

La replicación es útil para:


- Proveer un estimado del error experimental
- Incrementar la precisión por medio de la reducción de errores estándar
- Calcular una estimación más precisa del efecto de un factor en el experimento
- Proveer un estimado del error experimental
- Incrementar la precisión por medio de la reducción de errores estándar
- Calcular una estimación más precisa del efecto de un factor en el experimento
Tamaños de muestras en Diseños Factoriales 2k

Fuente: (Gutiérrez Pulido & De la Vara Salazar, 2012)

Por experiencia el número de réplicas en la mayoría de situaciones experimentales en las que se


involucra un factor varía entre 5 y 10; incluso en algunos casos puede llegar hasta 30 (Gutiérrez
Pulido & De la Vara Salazar, 2012) Ver página 75 del libro
Libro de Melo capítulo 5,
Gutiérrez capítulo 3
Montgomery capítulo 2

MODELOS DE EFECTOS FIJOS Y ALEATORIOS


En ANOVA los factores son fijos o aleatorios. El investigador debe decidir sobre la conformación
de los tratamientos incluidos en el experimento, esto es: Modelo I, o efectos fijos o de análisis de
varianza, Modelo II o de efectos aleatorios, o de componentes de varianza
Los modelos de efectos fijos y aleatorios difieren en la concepción de la población de partida,
permite cuantificar el grado o magnitud en que se manifiesta el fenómeno.

MODELO DE EFECTOS FIJOS


En este modelo, el investigador decide que niveles concretos se van a considerar, lo cual significa
que todos los niveles de prueba en cada factor son todos los disponibles para ese factor, o bien,
se estudian todos los niveles de interés en ese factor y las conclusiones sólo son aplicables a esos
niveles, no pudiéndose hacer extensivas a otros niveles no incluidos dentro del estudio, (Lara
Porras).; es en este sentido los niveles están fijos, es decir los tratamientos usados en el
experimento no constituyen una muestra aleatoria.
Un modelo de efectos fijos es un modelo estadístico que representa las cantidades observadas
en las variables explicativas que son tratadas como si las cantidades fueran no-aleatorias
Se prueban hipótesis acerca de las medias de los tratamientos.

MODELO DE EFECTOS ALEATORIOS


Los efectos aleatorios son otro enfoque para diseñar experimentos y modelar datos. Los efectos
aleatorios son apropiados cuando los tratamientos son muestras aleatorios de una población de
tratamientos potenciales.(Oehlert, 2010)
Un efecto es aleatorio si se tiene una cantidad muy grande de tratamientos y es imposible poner
a todos ellos en el experimento. entonces, se toma una muestra aleatoria de tratamientos pero
se desea inferir sobre toda la población de tratamientos.

También se considera cuando los niveles de prueba utilizados en un factor son una muestra
aleatoria de la población de niveles para ese factor.
Es importante que el experimentador sea capaz de hacer inferencias acerca de una población de
tratamientos a través de un experimento en el que los tratamientos empleados se elijan al azar
de entre la población. Evidentemente se utilizan estos factores cuando tienen un número muy
grande de niveles y no es razonable o posible trabajar con todos ellos. En este caso se está
interesado en examinar la variabilidad de la respuesta debida a la población entera de niveles del
factor.
Ejemplo: una cadena de hipermercados que tiene en plantilla 300 trabajadores de caja está
interesada en estudiar la influencia del factor trabajador en la variable tiempo en el cobro a un
cliente (Marin, 2015).
Suponga que se tiene un factor denominado operador y que este tiene 3 niveles, si se selecciona
intencionalmente estos 3 operadores y desean que los resultados se apliquen únicamente a estos
operarios, el factor es fijo. Si se toma una muestra aleatoria de 3 operadores en un número más
grande de operadores y se desea que sus resultados se apliquen a todos los operadores, el factor
es aleatorio.
Se prueban hipótesis acerca de las varianzas de los tratamientos.
Ho: 𝜎A2 = 0, No existe variabilidad
H1: 𝜎A2 > 0, Existe variabilidad entre los tratamientos

Ejemplo de Modelos de efectos mixtos


ANÁLISIS DE VARIANZA DE DOS FACTOR O ANOVA DOS VÍA O DE BLOQUES O MODELO
ALEATORIZADO DE DOS VARIABLES O DE DOS CRITERIOS DE CLASIFICACIÓN DBCA

Efecto Bloque (Blocking)


Introducir bloques en los diseños es un medio para reducir y controlar la varianza del error
experimental con el fin de lograr una mayor precisión.
Cualquier factor que afecta la variable de respuesta y que varía entre las unidades experimentales
aumenta la varianza del error experimental y disminuye la precisión de los resultados del
experimento. Factores tales como el sexo, la edad o peso de los animales o humanos en tal caso,
lotes distintos de reactivos o material fabricado y separaciones físicas de parcelas son ejemplos
de variables externas al tratamiento que pueden aumentar la variación entre las observaciones
de la variable de respuesta. El uso de bloques estratifica las unidades experimentales en grupos
homogéneos, o unidades parecidas. Una buena elección de los criterios de bloqueo disminuye la
variación entre las unidades dentro de los bloques en comparación con las unidades de diferentes
bloques.

El diseño de bloques completos aleatorizados


El diseño de bloques completos aleatorizados es el más sencillo de este tipo de diseños utilizados
para controlar y reducir el error experimental, en él las unidades experimentales quedan
estratificadas en bloques de unidades homogéneas, cada tratamiento se asigna al azar a un
número igual (por lo general uno) de unidades experimentales en cada bloque, de manera que
los tratamientos no son asignados al azar en toda la muestra sino dentro de cada bloque y es
posible hacer comparaciones más precisas entre los tratamientos dentro del conjunto
homogéneo de unidades experimentales en un bloque.

Las unidades experimentales se reagrupan en bloques, a continuación, se determina la


distribución de los tratamientos en cada bloque y, por último, se asignan al azar las unidades
experimentales a los tratamientos dentro de cada bloque.

Así pues, los pasos que hay que seguir para conformar la muestra es:
1. Definir grupos (Bloque) en la población de estudio: por ejemplo, grupos de edad (>30, 30-40,
50-60, 60-70, >70), tamaño, sexo, etc
2. Seleccionar n individuos para cada grupo o bloque.
3. Asignar al azar cada uno de los a tratamientos (por ejemplo “A”, “B” y “C”) a los n individuos
escogidos de cada bloque.

Bloque1 Bloque2 Bloque3


A A C
B C B
C B A
Los individuos no se asignan a uno de los bloques ya que un individuo tiene una edad o un tamaño
o un sexo diferente y no se le puede cambiar en el experimento.

Ejemplos de diseño en bloques completamente aleatorizados:


• Comparación de 3 procedimientos para el infarto agudo de miocardio (IAM): Se elijen 4
hospitales al azar y para cada hospital se eligen 3 pacientes ingresados por IAM también al azar.
Finalmente aleatorizamos los 3 procedimientos a cada uno de los 3 pacientes de cada hospital.
En este caso los bloques son los hospitales.
• Comparación de 4 fertilizantes para la producción de manzanas: Se divide el terreno en 6
parcelas homogéneas. Para cada parcela, se escogen al azar 4 manzanos y a cada uno de ellos se
le asigna uno de los 4 fertilizantes al azar. Y hacemos lo mismo para cada parcela. Aquí la parcela
hace el papel de bloque.
• Comparación de 3 tipos de entrenamiento para atletas de velocidad: Se reclutan 10 atletas
profesionales y cada atleta hace una prueba después de cada entrenamiento de tal manera que
todos los atletas realizan los 3 tratamientos una vez y en orden aleatorio (por ejemplo, el primer
atleta le toca primero el entrenamiento B, luego el A y por último el C, mientas que el segundo
atleta le toca primero realizar el A, luego el B y finalmente el C, En este ejemplo el bloque es el
atleta

El diseño ANOVA 2 vías, permite estudiar simultáneamente los efectos de dos fuentes de
variación, variación debido al primer factor y variación debido a un segundo factor. Se trabaja
con dos factores, llamados tratamientos y bloques, cada uno con n niveles
Los bloques se forman con el objetivo de que las unidades experimentales al interior de ellos,
sean lo más homogéneas posibles, lo que permite disminuir el error experimentar, o sea, reducir
la variabilidad residual y obtener un diseño más eficiente para detectar diferencias entre
tratamientos. Lo que se busca es formar bloques de unidades con valores similares para
los factores y los tratamientos del experimento se pueden comparar entre sí en un entorno
más homogéneo

Si el experimento utiliza dos factor o variables independiente, entonces la suma de cuadrados


de la variación total observada en la variable respuesta se divide en: la primera que determina
la variación debido al efecto del primer factor, la segunda, que representa a la variación debido
al segundo factor y la variación debido al error experimental, lo que se traduce a la siguiente
identidad:
SCT = SCE + SCB + SCR.

MODELO A DOS CRITERIOS DE CLASIFICACION CON UNA OBSERVACIÓN


(POR FILA Y COLUMNA)
Interacción en los diseños de un factor con bloques
En los diseños de un factor en bloques completamente aleatorizado se suele disponer de un único
dato para cada combinación de bloque y tratamiento, con lo que se consigue el mínimo de
muestras necesaria. En el caso de una única réplica por condición experimental no se puede
incluir la interacción en el modelo.
Por lo contrario, si se consideran réplicas, habría que reclutar el doble o el triple de individuos
por bloque y asignar a cada dos o cada tres (etc.) de ellos uno de los tratamientos.

MODELO MATEMÁTICO (efectos fijos)

Xij = µ + αi + βj + εij
Donde:
Xij = Valor de la variable respuesta
µ = Es el promedio general o promedio poblacional
αi = Es el efecto del i-ésimo tratamiento
βj = Es el efecto del j-ésimo bloque o repetición.
εij = Es el error o valor residual del i-ésimo tratamiento y del j-ésimo bloque o
repetición, que se considera es independiente de observación a
observación y está normalmente distribuido con valor esperado igual a
cero y varianza igual a σ2 , Ν (0,σ2).
Restricción: ∑αi = ∑βj = 0.

Representación de datos

TRATAMIENTOS
B1 B2 Bj Bb ∑ Xi•
/BLOQUES
T1 X11 X12 X1j X1b X1•
T2 X21 X22 X2j X2b X2•
Ti Xi1 Xi2 Xij Xib Xi•
Ta Xa1 Xa2 Xaj Xab Xa•
∑ X•j X•1 X•2 X•j X•b X••

Fórmulas de cálculo:

FC = (Σ Xij)2/ab
SCT = Σ X2ij - FC
SCE =Σ (( ΣXi•)2 / b) - FC
SCB = Σ (( ΣX•j)2 / a) - FC
SCR = SCT – SCE – SCB

CUADRO DE ANALISIS DE VARIANZA


FUENTE DE GRADOS DE SUMA DE CUADRADO ESTADISTICA DE
VARIACION LIBERTAD CUADRADOS MEDIO PRUEBA
Tratamientos a-1 SCE CME = SCE / (a - 1) Fc = CME / CMR
Bloques b-1 SCB CMB = SCB / (b-1) Fc = CMB / CMR
Residual (Error) (a-1) (b-1) SCR CMR = SCR/(a-1)(b-
1)
TOTAL n-1 SCT

PRUEBA DE HIPÓTESIS
1. Formulación de la Hipótesis:

Tratamientos
H0: αi = 0 H0 :u1=u2=u3=……..=ui
HA: αi ≠ 0 HA : u1≠u2≠u3≠……..≠ui

Bloques
H0: βj = 0
HA : β j ≠ 0
2. Determinación de la estadística de prueba
Tratamientos: Fc = CME / CMR
Bloques: Fc = CMB / CMR
3. Criterio de Decisión
Rechazar la H0 si : Fc ≥ Fα/2,v1,v2 Tratamientos
Rechazar la H0 si : Fc ≥ Fα/2,v1,v2 Bloques

Contrastar método del valor p (Sig)


Rho Si valor p <α

Ejemplo resuelto:
En un experimento se estudió el proceso de maduración del aguacate (medido en día). El
propósito del experimento es conocer el efecto que tienen las diferentes técnicas sobre la
maduración de los diferentes aguacates. Los factores son: tipo de aguacate con dos niveles
(guatemalteco y criollo) y técnicas de maduración con tres niveles (aire libre, bolsa de papel
kraft, recipiente plástico), se obtuvo los siguientes resultados. Construya una anova 2 vías y
pruebe cuales son los factores significativos
Técnica de maduración (B)
Dentro de
Dentro de un
Tipo de Aire una bolsa
recipiente
Aguacate(A) libre de papel
plástico
Kraft
Guatemalteco 6 3 4
Criollo 4 2 4

ANÁLISIS DE VARIANZA
FV SC GL CM Fc Valor p Ft
Tipo de
aguacate 1,5000 1,0000 1,5000 3,0000 0,2254 18,5128
Maduración 6,3333 2,0000 3,1667 6,3333 0,1364 19,0000
Error 1,0000 2,0000 0,5000
Total 8,8333 5,0000

Solución:
Formulación de la Hipótesis:
Filas
H0: µ1 = µ2 No existe diferencia significativa en la maduración promedio del aguacate ,
debido si es aguacate guatemalteco o criollo
HA: µ1 ≠ µ2 Existe diferencia significativa en la maduración promedio del aguacate, debido
si es aguacate guatemalteco o criollo

Columnas
H0: µ1 = µ2 = µ3 No existe diferencia significativa en la maduración promedio del aguacate
, debido a las técnicas de maduración
HA: µ1 ≠ µ2 ≠ µ3 Existe diferencia significativa en la maduración promedio del aguacate ,
debido a las técnicas de maduración

Determinación de la estadística de prueba


Fc = CME / CMR = 1,5/0,5 = 3
Fc = CME / CMR = 3,1667/0,5 =6,3334

Criterio de Decisión
Rechazar la H0 si : Fc ≥ Fα,v1,v2
Filas
3> F 0,05 ; 2, 9
3> 18,5128 Aho
Columnas
3> F 0,05 ; 2, 9
6,3334> 19 Aho

Filas
P-valor: Rechazo la Ho, el p-valor es menor al nivel de significancia (0,05)
0,2254 > 0,05 Aho
Columnas
0,1364 > 0,05 Aho

No existe diferencia significativa en la maduración promedio del aguacate, debido si es


aguacate guatemalteco o criollo
No Existe diferencia significativa en la maduración promedio del aguacate, debido a las
técnicas de maduración

Ejercicio resuelto:
Una empresa agrícola quiere saber si la cantidad de agua y el tipo de terreno influyen en el
crecimiento de las semillas en su periodo de germinación. Para ello se utilizó semilla de lenteja
en donde la cantidad de gua fueron de (2, 4 y6) ml, el tipo de terreno fue de (tierra y algodón).
Realizar un análisis de varianzas
Lo resultados en 15 días del crecimiento del tallo de las semillas fueron de:
cant_agua/ terreno Tierra Algodón

2ml 6,3 8,6


4ml 10,8 11,3
6ml 8,6 10,6

Solución:
ANÁLISIS DE VARIANZA
FV SC GL CM Fc Valor p Ft
Cantidad de agua
13,1233333 2 6,56166667 14,1111111 0,06617647 19
Terreno 3,84 1 3,84 8,25806452 0,10276455 18,5128205
Error 0,93 2 0,465
Total 17,8933333 5

Formulación de la Hipótesis:
Filas
H0 : µ1 = µ2 = µ3 No existe diferencia significativa en el crecimiento promedio de la semilla
, debido a la cantidad de agua
HA : µ1 ≠ µ2 ≠ µ3 No existe diferencia significativa en el crecimiento promedio de la semilla
, debido a la cantidad de agua

Columnas
H0 : µ1 = µ2 No existe diferencia significativa en el crecimiento promedio de la semilla ,
debido al tipo de terreno
HA : µ1 ≠ µ2 Existe diferencia significativa en el crecimiento promedio de la semilla, debido
al tipo de terreno

Determinación de la estadística de prueba


Fc = CME / CMR = 6,5616/0,465 =14,1111
Fc = CME / CMR = 3,84/0,465 = 8,258

Criterio de Decisión
Rechazar la H0 si : Fc ≥ Fα,v1,v2
Filas
14,1111 < F 0,05 ; 2, 9
14,1111 <18,5128 Aho

Columnas
8,258 < F 0,05 ; 2, 9
8,258 < 18,5128 Aho

Filas
P-valor: Rechazo la Ho, el p-valor es menor al nivel de significancia (0,05)
0,0662 > 0,05 Aho
Columnas
0,1028 > 0,05 Aho

No existe diferencia significativa en el crecimiento promedio de la semilla, debido a la


cantidad de agua
No existe diferencia significativa en el crecimiento promedio de la semilla, debido al tipo de
terreno

PARTICIÓN DE LA SUMA DE CUADRADOS DE TRATAMIENTOS O BLOQUES

En la comparación entre diferentes tratamientos, es posible fraccionar la suma de cuadrados de


tratamientos o bloques en el análisis de varianza.

La comparación de los tratamientos se realiza particionando la SCE, utilizando la función lineal

Partición de la SCE: L2 / (r ∑λi2)


Donde:
Combinación lineal L = λ1T1 + λ2T2 + λjTi + .... λaTa
λi = Coeficiente ortogonal correspondiente al i-ésimo tratamiento.
Ti = Total del i-ésimo tratamiento.
r =nj = Número de observaciones en uno cualquiera de los tratamientos

Restricción: ∑ λi = 0

Para que dos o más funciones lineales formen parte independiente o sean componentes
independientes de la suma de cuadrados de tratamientos, es indispensable que éstas sean
mutuamente ortogonales.

Dos funciones lineales:

L1 = λ11T1 + λ12T2 + λ1iTi + .... λ1aTa


L2 = λ21T1 + λ22T2 + λ2iTi + .... λ2aTa

son mutuamente ortogonales si:


λ11λ21 + λ12λ22 + ... + λ1iλ2i + ... + λ1aλ2a = 0

o lo que es lo mismo: ∑ λ1iλ2i = 0

Por lo tanto, si dos comparaciones son mutuamente ortogonales, sus contribuciones son partes
independientes de la suma de cuadrados de tratamientos o bloques.
Si las comparaciones de L1 , L2 , L3 , ... La-1 son mutuamente ortogonales, entonces, sus
contribuciones son componentes individuales de la suma de cuadrados de tratamientos, entonces:

𝐿21 𝐿22 𝐿2𝑎−1


𝑆𝐶𝐸 = 2 + 𝑟 ∗ ∑ 𝜆2 + 𝑟 ∗ ∑ 𝜆2
𝑟 ∗ ∑ 𝜆1𝑖 2𝑖 𝑎−1𝑖

Por lo tanto, si dos comparaciones son ortogonales, sus contribuciones son partes independientes
de la suma de cuadrados de tratamientos o bloques, cada una con un grado de libertad.

Cuando son mutuamente ortogonales, P (A U B) = P(A) + P(B)

Cuando no son mutuamente ortogonales, P(A U B)= P(A) + P(B) – P(A ∩ B)

Eficiencia de un DBCA frente a DCA pág. 292, (Melo et al., 2020)


Si CMB>CMR DBCA, entonces ER>1; y es mejor usar DBCA
Si CMB≤CMR DBCA, entonces ER≤1; y es mejor usar DCA
Nota: a=K=t; SCE=SCR

MODELO A DOS CRITERIOS DE CLASIFICACION CON DOS O MAS OBSERVACIONES POR


CELDA. (Efectos fijos)

MODELO MATEMÁTICO
El modelo matemático del diseño es:
Xijk = µ + αi + βj + Iij + εijk
Xijk = Valor de la variable respuesta correspondiente en el iésimo tratamiento del j-
ésimo bloque.
µ = Es el promedio general o promedio poblacional
αi = Es el efecto del i-ésimo tratamiento

βj = Es el efecto del j-ésimo bloque o repetición.


Iij = α βij = Interacción del i-ésimo tratamiento con el j-ésimo bloque
εijk = Es el error o valor residual del i-ésimo tratamiento, del j-ésimo bloque y de la
c-ésima repetición, que se considera es independiente de observación a
observación y está normalmente distribuido con valor esperado igual a cero y
varianza igual a σ2 , Ν (0,σ2).
Se acepta además que: ∑αi = ∑βj = ∑Iij = 0.
Representación gráfica
TRATAMIENTO BLOQUE
Repetición B1 B2 ... Bj ... Bb ∑

T1 1 X111 X121 X1j1 X1b1


2 X112 X122 X1j2 X1b2
X11• X12• X1j• X1b• X1••

T2 1 X211 X221 X2j1 X2b1


2 X212 X222 X2j2 X2b2
X21• X22• X2j• X2b• X2••
....
Ti 1 Xi11 Xi21 Xij1 Xib1
2 Xi12 Xi22 Xij2 Xib2 Xi••
Xi1• Xi2• Xij• Xib•
....
Ta 1 Xa11 Xa21 Xaj1 Xab1
2 Xa12 Xa22 Xaj2 Xab2
Xa1• Xa2• Xaj• Xab• Xa••
X•••
∑ X•1• X•2• X•j• X •b •

Las formulaciones de cálculo para las sumas de cuadrados son las siguientes:
FC = (Σ Xijk)2/abc
SCT = Σ X2ijk - FC
SCE = Σ(Σ Xi••)2 / bc) - FC
SCB = Σ(Σ X•j•)2 / ac) - FC
SCI = (Σ (ΣXij• )2/ c) – FC) – (SCE + SCB)
SCR = SCT – (SCE + SCB +SCI)

CUADRO DE ANALISIS DE VARIANZA


FUENTE DE GRADOS DE SUMA DE CUADRADO MEDIO ESTADISTICA DE
VARIACION LIBERTAD CUADRADOS PRUEBA
Tratamientos a-1 SCE CME = SCE / (a - 1) Fc = CME / CMR
Bloques b-1 SCB CMB = SCB / (b-1) Fc = CMB / CMR
Interacción (a-1) (b-1) SCI CMI = SCI /(a-1)(b-1) Fc = CMI / CMR
Residual (Error) a*b (c-1) SCR CMR = SCR/ab(c-1)
TOTAL n–1 SCT

PRUEBAS DE HIPÓTESIS
A diferencia del diseño a dos criterios con una observación, en este diseño se analiza la interacción
entre los factores, de manera que la hipótesis adicional a las anteriores es:
H0 : Iij = 0 , La interacción no tiene efecto significativo en la variable
respuesta. No existe interacción entre factores. Existe independientes
HA : Iij ≠ 0 La interacción tiene efecto significativo en la variable
respuesta. Existe interacción entre factores. Existe dependientes

DISEÑO CUADRADO LATINO- DCL


El DCL es otro tipo de diseños que utiliza el principio de la formación de bloques, que es reducir el error
residual, a diferencia del DBCA el DCL se usa para eliminar dos fuentes de variabilidad perturbadora que
representan las filas y las columnas, por lo tanto, las filas y las columnas representan dos restricciones
sobre la aleatorización

El nombre de cuadrado latino se deriva del hecho que se forma un arreglo cuadrado (matriz cuadrada),
donde el factor principal, y los dos de bloqueo deben tener igual número de niveles, las letras latinas
representan los niveles del factor principal, mientras que las filas y columnas los niveles de los factores de
bloqueo
El DCL optimiza el modelo, reduciendo el número de unidades experimentales. La principal restricción es
que no se puede calcular interacciones.
El número de tratamientos K=a determina el número de filas y de columnas, los tratamientos se denotan
con letras latinas mayúsculas, el número de ensayos es K 2

Se recomienda DCL de dimensiones: 4*4 hasta 7*7. Debe cumplirse la regla que cada letra debe aparecer
solo una vez en cada fila y columna. Si la primera columna y primera fila aparecen las letras en orden
alfabético, se tiene un cuadro latino estándar ejm:

A B C D
B C D A
C D A B
D A B C

La estrategia de seleccionar y aleatorizar recomendad en la práctica es:


1. Se selecciona el cuadro latino
2. Se aleatoriza el orden de las columnas y después el de las filas o primero filas y después columnas
3. Por último, los tratamientos a comparar se asignan en forma aleatoria a las letras latinas

En el DCL se controlan dos factores de bloque y se estudia un factor tratamiento, por lo tanto, se tiene 4
fuentes de variabilidad que puede afectar la respuesta observada, estos son: tratamientos, el factor
bloque I (columnas), el factor bloque II (filas) y el error aleatorio. Cabe señalar que no hay interacciones
entre filas, columnas y tratamientos, puesto que hay una sola observación por cada celda, de manera que
cada tratamiento aparece una vez exactamente en cada fila y columna

Entonces la variabilidad total se descompone en: SCT=SCF+SCC+SCE+SCR

MODELO MATEMÁTICO
La función matemática del modelo cuadrado latino, efectos fijos es:

Xijk = µ + αi + βj + γk + εij k
Donde:

Xijk = Valor de la variable respuesta correspondiente al i ésimo nivel del factor fila, al j-
ésimo nivel del factor columna y al k-ésimo tratamiento.
µ = Es el promedio general o promedio global
αi = Es el efecto del i-ésimo nivel del factor fila
βj = Es el efecto del j-ésimo nivel del factor columna.
γk = Es el efecto del k-ésimo tratamiento.
εijk = Es el error o valor residual del k-ésimo tratamiento, del i-ésimo factor fila y del j-
ésimo factor columna, que se considera es independiente de observación a observación y
está normalmente distribuido con valor esperado igual a cero y varianza igual a σ2, Ν (0, σ2).
El modelo postula además que: ∑αi = ∑βj = ∑γk = 0.

Las formulaciones de cálculo para las sumas de cuadrados son las siguientes:
FC = (Σ Xijk)2/a2
SCT = Σ X2ijk - FC
SCF = Σ((Σ Xi••)2 / a) - FC
SCC = Σ((ΣX•j•)2 / a) - FC
SCE = Σ((ΣX••k)2 / a) - FC
SCR = SCT – (SCF + SCC+ SCE)

Representación gráfica (4*4)

Fila/Columna C1 C2 C3 C4
Sumatorias
F1 A B C D X1..
F2 B C D A X2..
F3 C D A B X3..
F4 D A B C Xi..
Sumatorias X.1. X.2. X.3. X.j. X…
SumasTratamientos X..A X..B X..C X..D X..K

CUADRO DE ANALISIS DE VARIANZA


FUENTE DE GRADOS DE SUMA DE CUADRADO MEDIO ESTADISTICA DE
VARIACION LIBERTAD CUADRADOS PRUEBA
Tratamientos a-1 SCE CME = SCE / (a -1) Fc = CME / CMR
Filas a-1 SCF CMF = SCF / (a-1) Fc = CMF / CMR
Columnas a-1 SCC CMC = SCC / (a-1) Fc = CMC / CMR
Residual (Error) (a-1) (a-2) SCR CMR = SCR/(a-1)(a-2)
TOTAL a2 - 1 SCT

PRUEBA DE HIPÓTESIS
1. Formulación de la Hipótesis:

Factor fila
H0: αi = 0
HA: αi ≠ 0

Factor columna
H0: βj = 0
HA : β j ≠ 0

Factor tratamiento
H0: γk = 0
HA : γ k ≠ 0
2. Determinación de la estadística de prueba

Factor fila: Fc = CMF / CMR


Factor columna: Fc = CMC / CMR
Factor tratamiento: Fc = CME / CMR

3. Criterio de Decisión
Rechazar la H0 si : Fc ≥ Fα/2,v1,v2 Filas
Rechazar la H0 si : Fc ≥ Fα/2,v1,v2 Columnas
Rechazar la H0 si : Fc ≥ Fα/2,v1,v2 Tratamientos

Eficiencia de un DCL frente a un DCA y un DBCA (Libro de Melo. Página 343)

Ejercicio resuelto
Un ingeniero investigador estudió la eficiencia en tiempo de cuatro métodos de fabricación (A,…D) de un
componente electrónico, se eligieron cuatro técnicos para el estudio, pero como el proceso de fabricación
produce fatiga de manera que el tiempo requerido por el técnico aumenta al cambiar de un método a
otro sin importar el orden, el ingeniero utilizó un diseño de cuadrado latino con los técnicos en las
columnas, los periodos en los renglones. Los métodos de fabricación se asignaron al azar a los técnicos.
Los valores son los tiempos de fabricación en minutos requeridos para el componente. Se pide analizar
los datos con un nivel de significancia del cinco por ciento.
Período de Técnico
tiempo T1 T2 T3 T4
P1 C D A B
90 96 84 88
P2 B C D A
90 91 96 88
P3 A B C D
89 97 98 98
P4 D A B C
104 100 104 106

CARACTERÍSTICAS:
➢ Factores: Periodo de tiempo, Técnico y Métodos de fabricación
➢ Filas: Periodos de tiempo P1,..P4
➢ Columna: Técnicos T1,.T4
➢ Letra Latina: Métodos de fabricación A,…, D
➢ Unidad experimental: Componente electrónico
➢ Variable respuesta: Tiempos de fabricación en minutos
➢ Nivel de significancia: 0.05
➢ Modelo matemático: 𝑋𝑖𝑗𝑘 = 𝑢 +∝𝑖 + 𝛽𝑗 + 𝑌𝑘 + 𝐸𝑖𝑗𝑘

Formulación de hipótesis
Periodo de tiempo
H0 : αi = 0 No existe diferencia significativa en el tiempo promedio de fabricación en minutos de
los componentes electrónicos debido a los diferentes periodos de tiempo.

Ha : αi ≠ 0 Existe diferencia significativa en el tiempo promedio de fabricación en minutos de los


componentes electrónicos debido a los diferentes periodos de tiempo.

Técnico

H0 : βj = 0 No existe diferencia significativa en el tiempo promedio de fabricación en minutos de


los componentes electrónicos debido a los diferentes técnicos.

Ha : βj ≠ 0 Existe diferencia significativa en el tiempo promedio de fabricación en minutos de los


componentes electrónicos debido a los diferentes técnicos.

Métodos de fabricación

H0 : Yk = 0 No existe diferencia significativa en el tiempo promedio de fabricación en minutos de


los componentes electrónicos debido a los diferentes métodos de fabricación.

Ha : Yk ≠ 0 Existe diferencia significativa en el tiempo promedio de fabricación en minutos de los


componentes electrónicos debido a los diferentes métodos de fabricación.
Estadístico de prueba
Periodo de tiempo
CMF
Fc =
CMR
Técnico
CMC
Fc =
CMR
Métodos de fabricación
CME
Fc =
CMR
Criterio de decisión
si 𝐅𝐂 ≥ 𝐅𝐓,𝛂,𝐯𝟏,𝐯𝟐 , con alfa v1 y v2 grados de libertad se rechaza la hipótesis nula H0
Cálculos
ANOVA
F. de Variación GL SC CM Fc Ft
Periodos de tiempo 3 467,19 155,73 40,8470 4,76
Técnicos 3 17,1875 5,73 1,5027 4,76
Métodos 3 145,6875 48,56 12,7377 4,76
Residual 6 22,88 3,81
Total 15 652,94

5. Decisión
Periodo de tiempo
➢ Como 40.85 > 4.76 se rechaza la hipótesis nula H0
Con un nivel de significancia del 5% se puede concluir que existe diferencia significativa en el tiempo
promedio de fabricación en minutos de los componentes electrónicos debido a los diferentes periodos de
tiempo.

Técnico
➢ Como 1.5 < 4.76 se acepta la hipótesis nula H0
Con un nivel de significancia del 5% se puede concluir que no existe diferencia significativa en el tiempo
de fabricación en minutos de los componentes electrónicos debido a los diferentes técnicos que realizan
el experimento.

Métodos de fabricación
➢ Como 12.74 > 4.76 se rechaza la hipótesis nula H0
Con un nivel de significancia del 5% se puede concluir que existe diferencia significativa en el tiempo
promedios de fabricación en minutos de los componentes electrónicos debido a los diferentes métodos
de fabricación.

Ejercicio 4.2. Gutiérrez, página 93

CUADRADO GRECO LATINO-DCGL


El DCGL es otro tipo de diseños que utiliza el principio de la formación de bloques, que es reducir el error
residual, a diferencia del DCL se usa para eliminar tres fuentes de variabilidad perturbadora que
representan las filas, las columnas, y las letras griegas
El DCGL es una extensión del cuadrado latino en el que se incluye una tercera variable de control o de
bloque, es decir considera un solo factor tratamiento con k niveles y tres factores de bloque. Las letras
latinas representan los niveles del factor principal (tratamiento), mientras que las filas, las columnas y las
letras griegas los niveles de los factores de bloqueo y el número de observaciones necesarias es K * K.

Se llama cuadro grecolatino porque los cuatro factores involucrados se prueban en la misma cantidad de
niveles formando una matriz cuadrada, se utilizan letras latinas para denotar a los tratamientos y letras
griegas para nombrar a los niveles del tercer factor de bloque. Al igual que en el DCL cada letra latina y
griega debe aparecer sólo una vez en cada fila y en cada columna, y cada par de letras debe aparecer sólo
una vez en todo el arreglo

Diseño del cuadro grecolatino 4*4


Aα Bβ Cγ D δ
Bδ Aγ Dβ Cα
Cβ Dα A δ Bγ
Dγ C δ Bα Aβ
Al superponer las letras latinas y griegas se tiene un arreglo DCGL
Los tratamientos se asignan a las unidades experimentales de manera tal que cada tratamiento ocurre
una sola vez en cada fila, cada columna y en cada letra griega

El DCGL controla tres factores de bloque y se estudia un factor tratamiento, por lo tanto, se tiene cinco
fuentes de variabilidad que puede afectar la respuesta observada, estos son: tratamientos, el factor
bloque I (columnas), el factor bloque II (filas), el factor bloque III (letras griegas) y el error aleatorio
Entonces la variabilidad total se descompone en: SCT=SCF+SCC+SCE+SCG+SCR.

El análisis de varianza es muy parecido al de un DCL. Se recomienda cuadrados grecolatinos para todo K
≥ 3, excepto K=6

MODELO MATEMÁTICO
La función matemática del modelo cuadrado greco latino de efectos fijos es:

Xijkl = µ + αi + βj + γk + δL + εij kL
Donde:

XijkL = Valor de la variable respuesta correspondiente al iésimo nivel del factor fila, al j-
ésimo nivel del factor columna, al k-ésimo tratamiento y l-ésimo letra griega
µ = Es el promedio general o promedio poblacional
αi = Es el efecto del i-ésimo nivel del factor fila
βj = Es el efecto del j-ésimo nivel del factor columna.
γk = Es el efecto del k-ésimo tratamiento, o letra latina
δL = Es el efecto del L-ésimo nivel del factor letra griega
εijk = Es el error o valor residual del k-ésimo tratamiento, del i-ésimo factor fila y del
j-ésimo factor columna, l-ésimo letra griega, que se considera es
independiente de observación a observación y está normalmente
distribuido con valor esperado igual a cero y varianza igual a σ2 , Ν (0,σ2).
Dichos efectos están sujetos a la restricción: ∑αi = ∑βj = ∑γk = ∑ δL = 0.

Las formulaciones de cálculo para las sumas de cuadrados son las siguientes:
FC = (Σ xijkL)2/a2
SCT = Σ x2ijkL - FC
SCF = Σ((Σ xi•••)2 / a) - FC
SCC = Σ((Σx•j••)2 / a) - FC
SCE= Σ((Σx••k•)2 / a) - FC
SCG = Σ((Σx•••L)2 / a) - FC
SCR = SCT – (SCF + SCC+ SCL + SCG)

Representación gráfica 4*4


Cuadro de Análisis de Varianza cuyo contenido y representación es la siguiente:

C1 C2 C3 C4 Sumatorias
Fila/Columna

F1 Aβ B γ Cδ Dα X1…
F2 Bα Cδ D γ A β X2…
F3 Cδ Dα A β B γ X3…
F4 D γ A β Bα Cδ Xi…
Sumatorias X.1.. X.2.. X.3.. X.4.. X….

SumasLetras
X..A. X..B. X..C. X..D. X..K.
Latinas
SumasLetras
X…α X…β X… γ X… δ X…L
Griegas

CUADRO DE ANALISIS DE VARIANZA

FUENTE DE GRADOS DE SUMA DE CUADRADO MEDIO ESTADISTICA DE


VARIACION LIBERTAD CUADRADOS PRUEBA
Filas a-1 SCF CMF = SCF / (a-1) Fc = CMF / CMR
Columnas a-1 SCC CMC = SCC / (a-1) Fc = CMC / CMR
Letra latina a-1 SCL CME = SCL / (a -1) Fc = CML / CMR
Letra griega a -1 SCG CME = SCG / (a -1) Fc = CMG / CMR
Residual (Error) (a-3) (a-1) SCR CMR = SCR/(a-3)(a-1)
TOTAL a2 - 1 SCT

PRUEBA DE HIPÓTESIS
1. Formulación de la Hipótesis:
Factor fila
H0 : αi = 0
HA : αi ≠ 0

Factor columna
H0 : β j = 0
HA : β j ≠ 0

Factor Latina
H0 : γk = 0
HA : γ k ≠ 0

Factor Griega
H 0 : δL = 0
H A : δL ≠ 0

2. Determinación de la estadística de prueba

Factor fila: Fc = CMF / CMR


Factor columna: Fc = CMC / CMR
Factor letra latina: Fc = CML / CMR
Factor letra griega: Fc = CMG / CMR

3. Criterio de Decisión
Rechazar la H0 si : Fc ≥ Fα/2,v1,v2 Filas
Rechazar la H0 si : Fc ≥ Fα/2,v1,v2 Columnas
Rechazar la H0 si : Fc ≥ Fα/2,v1,v2 Letra latina
Rechazar la H0 si : Fc ≥ Fα/2,v1,v2 Letra griega

Ejercicios de Gutiérrez, pág 98, ejercicio 4.3

DISEÑO FACTORIAL (con réplicas)

A diferencia de los diseños antes tratados la estructura de los diseños factoriales combina los niveles de
dos o más factores para crear “a” tratamientos, de manera que los tratamientos tienen una estructura
factorial, además nos centraremos en diseños balanceados, es decir, tienen n observaciones en cada
tratamiento. El objetivo de un diseño factorial es estudiar el efecto de varios factores sobre la variable
respuestas. A diferencia de los diseños anteriormente estudiados, los diseños factoriales permiten
combinar factores y niveles por factor, se puede analizar cuantitativamente los efectos que tienen en la
variable dependiente, las variables independientes o factores por sí mismos y en todas las combinaciones,
se puede determinar la relación entre los factores
Entre las principales ventajas de la utilización del diseño factorial es un ahorro considerable de
tiempo y dinero; permite detectar e identificar los efectos simples y principales, así como aquellos
debidos a una combinación particular de niveles de los factores, proporcionando información sobre
los efectos de los factores y sobre sus relaciones entre sí.

Por ejemplo, con k = 2 factores, ambos con dos niveles, se forma el diseño factorial 2 × 2 = 22 , que consiste
en cuatro combinaciones o puntos experimentales. Si ahora uno tiene tres niveles y el otro dos, se pueden
construir 3 × 2 combinaciones que dan lugar al diseño factorial 3 × 2, que equivale a 6 tratamientos. Para
obtener el número de corridas experimentales se multiplica el número de tratamientos por el número de
réplicas

En general, la familia de diseños factoriales 2𝑘 consiste en k factores, todos con dos niveles de prueba, y
la familia de diseños factoriales 3𝑘 consiste en k factores cada uno con tres niveles de prueba, si los k
factores no tienen la misma cantidad de niveles, debe escribirse el producto de manera explícita; por
ejemplo, con k = 3 factores, el primero con cuatro niveles y los dos restantes con dos niveles, se tiene el
diseño factorial 4 × 2 × 2 o 4 ×22 , es lo que se conoce como diseños factoriales generales

Otros ejemplos: si el factor A interviene con dos niveles: a1 y a2; y el factor B interviene con niveles
b1 y b2, entonces el número de tratamientos del experimento es 2*2=4, y los tratamientos: a1b1, a1b2,
a2b1 y a2b2; otro ejemplo si A interviene con dos niveles: a1 y a2; y si el factor B tuviese tres niveles,
entonces el número de tratamientos del experimento será 2*3=6 y los tratamientos: a1b1, a1b2, a1b3,
a2b1, a2b2 y a2b3.

Cabe señalar que los diseños factoriales completos 2𝑘 (k factores con dos niveles de prueba cada
uno), son los diseños de mayor impacto en la industria y la investigación debido a su eficacia y
versatilidad

EFECTOS E INTERACCIONES
Los factores se representan con letras mayúsculas y los niveles con letras minúsculas
FACTOR A FACTOR B
b1 b2
a1 𝑎1 𝑏1 𝑎1 𝑏2
(1) (b)
(-,-) (-,+)
a2 𝑎2 𝑏1 𝑎2 𝑏2
(a) (a,b)
(+,-) (+,+)

Si a1 representa el nivel inferior del factor A y a2 el nivel superior del factor, entonces la diferencia
(a2 - a1) proporciona una medida del cambio del factor A. De similar manera, si b 1 representa el
nivel inferior del factor B y b2 el nivel superior del factor, entonces la diferencia (b2 - b1) proporciona
una medida del cambio del factor B.

𝑎2 −𝑎1= Medida de cambio del factor A


𝑏2 −𝑏1 = Medida de cambio del factor B

Efectos simples o parciales


𝑎2 𝑏1 - 𝑎1 𝑏1 = Medida de cambio del factor A en b1
𝑎2 𝑏2 - 𝑎1 𝑏2 = Medida de cambio del factor A en b2

𝑎1 𝑏2 - 𝑎1 𝑏1= Medida de cambio del factor B en a1


𝑎2 𝑏2 - 𝑎2 𝑏1 = Medida de cambio del factor B en a2

Efecto principal se mide promediando los efectos del factor en todos los niveles del otro factor. Son los
cambios en la medida de la variable de respuesta que se deben a la acción individual de cada factor
A= ((a2b1 - a1b1)+( a2b2 - a1b2))/2
B= ((a1b2 - a1b1)+( a2b2 - a2b1))/2

Interacción entre factores es un efecto adicional debido a la influencia combinada de dos, o más,
factores. Dos factores interactúan entre sí o tienen un efecto de interacción sobre la variable de
respuesta, cuando el efecto de un factor depende del nivel en que se encuentra el otro. Por ejemplo,
los factores A y B interactúan si el efecto de A es muy diferente en cada nivel de B, o viceversa.

AB=(( a2b2 - a2b1)-( a1b2 - a1b1))/2


AB=(( a2b2 - a1b2)-( a2b1 - a1b1))/2
Nota: Se debe interpreter el valor de los efectos principales y parciales de los factores, y la gráfica de
las interacciones, no así el valor de las interacciones, sin embargo, el ANOVA nos puede indicar si hay
o no interacciones

Realizar ejemplos:
Ejemplo 5.1 pág 116. Libro de Gutierrez

𝑎1 𝑏1 =2; 𝑎1 𝑏2 =5; 𝑎2 𝑏1 =6; 𝑎2 𝑏2 =9

𝑎1 𝑏1 =2; 𝑎1 𝑏2 =4; 𝑎2 𝑏1 =4; 𝑎2 𝑏2 =10

Si A y B estuvieran actuando independientemente, el efecto de a en b1 y el efecto de a en b2 sería


el mismo, es decir no varía; cualquier diferencia en estos dos efectos es una medida del grado de
interdependencia entre los factores, esto es, de la forma en la que interactúan A y B en la variable
respuesta.

Cuando hay interacción, las conclusiones que se obtienen a partir de los efectos principales no
siempre son ciertos. En general sólo se interpretan los efectos principales de aquellos factores que
no interactúan con ningún otro (Gutiérrez Pulido & De la Vara Salazar, 2012)

A través de las gráficas es sencillo localizar el mejor tratamiento

Representación e interpretación de efectos principales e interacción


Resulta que cuando existe interacción las líneas obtenidas tienen una pendiente muy diferente, y si no
hay interacción las líneas tienen pendientes similares, que son aproximadamente paralelas, o la variable
Y aumenta de forma similar para ambos niveles del factor B
Véase las siguientes figuras:
Fuente: (Gutiérrez Pulido & De la Vara Salazar, 2012)
Para entender e interpretar de qué manera un efecto de interacción afecta la variable de respuesta, se debe
ser cuidadoso y analizar con detalle lo que pasa en Y cuando se mueve un factor dependiendo del nivel en
el que esté el otro. Por ejemplo, en el caso del inciso c) de la figura 5.1 se aprecia que si A se cambia de su
nivel (–1) al (1), cuando B = –1, la respuesta Y también se incrementa; pero si B = 1, la respuesta decrece.
El factor A tiene un efecto positivo o negativo sobre Y, dependiendo del nivel de B. En el caso del inciso
b) de esta misma figura se puede ver que si B se incrementa (cambia) de (–1) al (1), cuando A = l, la
respuesta Y se incrementa ligeramente; pero si A = –1, la respuesta se incrementa
mucho.
De esta manera, con un efecto de interacción como el de la figura 5.1, si se quiere maximizar, minimizar
o llevar a un valor objetivo a Y, no se puede mover al factor A sin tomar en cuenta en qué nivel está B, y
viceversa.

Una de las principales utilidades de una gráfica de interacción es que ayuda a seleccionar la condición en
la que debe operarse el proceso para mejorar su desempeño. Por ejemplo, en el caso de la figura 5.1b, el
mínimo de Y se logra en A = –1 y B = –1; mientras que el máximo en A = –1 y B = +1.

Realizar ejercicio de interacciones para interpretar

Análisis de la varianza en diseños balanceados


El Análisis de la Varianza descansa en un algoritmo para la descomposición de la variabilidad de los datos.
Hay una fuente de variabilidad para cada término en el modelo; en un análisis de dos factores éstos son
el factor A, el factor B, la interacción AB y el error. De tal manera que la suma de cuadrados totales se
descompone en la suma de cuadrados de cada término, esto es,
SCT = SCA + SCB + SCAB + SCR

DISEÑO FACTORIAL 22
(con más de una réplicas)

Este diseño es aquel en el que intervienen dos factores a dos niveles cada factor; en la expresión 22,
la base corresponde el número de niveles por factor y el exponente al número de factores.

Con el diseño factorial 22 se estudia el efecto de dos factores considerando dos niveles en cada uno.
Cada réplica de este diseño tiene 2x2=4 combinaciones o tratamientos.
Los factores son A y B, cada uno a dos niveles: a1 y a2 para el factor A; y, b1 y b2 para el factor B. El número
de tratamientos posibles es igual al número de niveles del factor A por el número de niveles del factor B,
esto es: 2 x 2 = 4 tratamientos específicos: a1b1, a1b2, a2b1 y a2b2.
Esos tratamientos se pueden representar de la siguiente manera:

Fuente: (Gutiérrez Pulido & De la Vara Salazar, 2012)

Todas estas notaciones se utilizan en situaciones muy particulares, por ejemplo:


+1,-1 se utiliza a la hora de hacer cálculos para ajustar por mínimos cuadrados un modelo de regresión a
los datos
La notación de signos +, – se utiliza para escribir las matrices de diseño; esta notación, combinada con la
de Yates permite representar y calcular fácilmente los efectos de interés.
La notación con letras A+, A– se utiliza para escribir, al final del análisis del experimento, el mejor punto
o tratamiento ganador que se ha encontrado.
La notación de Yates (1),a, b, ab tiene un significado diferente a las demás: con ella se representa el total
o la suma de las observaciones en cada tratamiento, más que al tratamiento mismo. Hay que observar
que la lógica de esta notación es que, si una letra minúscula está presente, entonces el factor
correspondiente se encuentra en su nivel alto; si está ausente, el factor está en su nivel bajo; por ejemplo,
ab se refiere al tratamiento en el que los factores A y B están en su nivel alto.

Representación geométrica

Fuente: (Gutiérrez Pulido & De la Vara Salazar, 2012)

El diseño factorial 22 se representa de manera geométrica por los vértices del cuadrado. Cada vértice
representa un punto de diseño o tratamiento. El área limitada por este cuadrado se conoce como región
experimental y, en principio, las conclusiones que se obtengan del experimento sólo tienen validez sobre
esta región.

La suma de cuadrados de tratamientos puede ser particionada para obtener los efectos principales
de cada factor, así como su interacción: SCE=SCA+SCB+SCAB
Los efectos principales, simples e interacciones se sintetizan en el siguiente cuadro, que muestra los
multiplicadores ortogonales que serán utilizados para obtener los efectos principales y la interacción
entre tratamientos. De igual manera, expresa la forma de obtener la contribución a la suma de
cuadrados de tratamientos.

CALCULO DE EFECTOS PRINCIPALES E INTERACCIONES, SC DISEÑO FACTORIAL DE 22

Tratamientos MULTIPLICADOR PARA EL TOTAL


A B AB
a1 b1 = (1) -1 -1 1
a2 b1 = a 1 -1 -1
a1 b2 = b -1 1 -1
a2 b2 = ab 1 1 1
Sumatoria (A) (B) (AB)
Efecto principal (A)/2r (B)/2r (AB)/2r
Contribución suma de cuadrados de (A)2 / 4r (B)2 / 4r (AB)2 / 4r
tratamientos

(Ver página 220 del libro de Montgomery, para más detalle)

Una forma sencilla y útil para establecer los signos de los coeficientes ortogonales consiste en que, para
obtener el efecto principal de un factor, los coeficientes serán positivos si el tratamiento tiene el nivel
superior del factor y será negativo si tiene el nivel inferior del factor.

Modelo matemático: representación con un modelo de regresión del experimento factorial de dos
factores
Ŷ= β0 + β1 X 1+ β2 X2 + β12 X 1 X2

Nota: la interacción es otra variable X1*X2 (en SPSS), se recomienda trabajar con -1 y 1 o 0 y 1 como
nivel bajo y alto respectivamente, lleva a la misma estimación

Modelo matemático lineal del diseño de efectos fijos (con réplicas):

Xijk = µ + αi + βj + αβij + εijk


en el que:
Xij = Valor de la variable respuesta.
µ = Es el promedio general o promedio poblacional
αi = Es el efecto del i-ésimo nivel del factor A.
βj = Es el efecto del j-ésimo nivel del factor B
αβij = Representa el efecto de la interacción de los factores A y B.
εijk = Es el error o valor residual que se considera es independiente de observación
a observación y está normalmente distribuido con valor esperado igual a
cero y varianza igual a σ2 , Ν (0,σ2).

Para i = j Número niveles del factor A y B


k = 1, 2, ... r, Número de replicaciones

Dichos efectos están sujetos a las restricciones: ∑αi = ∑βj =∑ αβij = 0.

La identidad fundamental de la suma de cuadrados se expresa por:

SCT = SCA + SCB + SCAB + SCR


En donde:
SCT = Suma de Cuadrados Total
SCA = Suma de Cuadrados del factor A
SCB = Suma de Cuadrados del factor B
SCAB = Suma de Cuadrados de la interacción AB
SCR = Suma de Cuadrados del error.

Debemos notar que en el modelo matemático los elementos: αi, βj y αβij, corresponden a los
componentes independientes de los tratamientos, de forma que el modelo matemático, expresado
en función de los tratamientos y de las replicaciones, puede escribirse como un diseño ANOVA dos
factores o solo en función de tratamientos ANOVA un factor
Xij = µ + Φi + γk + εij ANOVA dos factores (una sola réplica)
Xij = µ + Φi + εij ANOVA un factores (con más de una réplica)

Las hipótesis que se prueban en el diseño 22 corresponden a la dómima para cada factor e
interacción:
Factor A
H0 : αi = 0
HA: αi ≠ 0

Factor B
H0 : βj = 0
HA : βj ≠ 0

Factor AB
H0 : αβij = 0 La interacción no tiene un efecto significativo en la variable
respuesta. No existe interacción. Independencia
HA : αβij ≠ 0 La interacción tiene un efecto significativo en la variable
respuesta. Existe interacción. Dependencia

La estadística de prueba que se utiliza es la F


Criterio de decisión: se rechaza la Ho, si Fc > Ft,v1,v2

El cuadro de análisis de varianza para un diseño factorial de 22 con “r” replicaciones por
tratamiento es:

CUADRO DE ANALISIS DE VARIANZA

FUENTE DE GRADOS DE SUMA DE CUADRADO MEDIO ESTADISTICA DE


VARIACION LIBERTAD CUADRADOS PRUEBA
Tratamientos
A a-1 SCA CMA = SCA / (a-1) Fc = CMA / CMR
B b-1 SCB CMB = SCA / (b-1) Fc = CMB / CMR
AB (a-1)(b-1) SCAB CMAB = SCA /(a-1)(b-1) Fc = CMAB / CMR
Residual (Error)
TOTAL n–1 SCT

Modelo de regresión (con dos niveles)

Ŷ= β0 + β1 X 1+ β2 X2 + β1,2 X 1 X2

Es útil ajustar un modelo de regresión a los datos experimentales con la finalidad de predecir
el valor de Y en diferentes niveles (2 niveles) de los factores estudiados. Los coeficientes del
modelo de regresión son iguales a los estimados que resultaron significativos divididos entre
2. Esta división se hace para lograr una escala unitaria, que es la escala usual en regresión,
de manera que el coeficiente X1 es igual al efecto de A/2. El término independiente β0 es la
media global u. Es necesario resaltar lo que se indicó, considerando únicamente para un
diseño factorial 2^K

Nota: en SPSS es necesario trabajar con los niveles (con 2 niveles): -1 nivel bajo y 1 nivel alto,
para que se verifique que el coeficiente X1 es igual al efecto de A/2, a diferencia de R, para
hacer la estimación de la predicción en R se trabaja con 0 nivel bajo y 1 nivel alto, como es
de esperar, se tiene la misma predicción predicha. Esto es útil en diseños factoriales 2^k, no
en diseños factoriales generales o mixtos

La predicción predicha Ŷ en un punto dado es un estimador de la respuesta promedio en


dicho punto, por ejemplo, la predicción en uno de los tratamientos (-1,1) si es un diseño 22,
se obtiene al sustituir este punto en el modelo:

Ŷ= β0 + β1 X 1+ β2 X2 + β3 X 1 X2
Ŷ(-1,1)= u + β1 (-1)+ β2( 1) + β3 (-1)(+1)

De la misma manera, es posible sustituir cualquier punto de la región experimental en el modelo


de regresión y obtener la respuesta predicha sobre el punto; dicho valor es un estimador de la
media de ese tratamiento

La precisión de la predicción obtenida depende de la calidad del ajuste del modelo


2
pudiéndose evaluar a través del coeficiente de determinación 𝑅𝑎𝑗

El coeficiente de determinación cuantifica el porcentaje de variabilidad presente en los


datos y que es explicado por el modelo. En general para fines de predicción se recomienda
un coeficiente de determinación ajustado de al menos 70%. Cuando hay muchos factores se
2
prefiere el 𝑅𝑎𝑗 en vez del 𝑅 2 determinación, puesto que este último se incrementa de
2
manera artificial con cada término que se agrega al modelo, a diferencia el 𝑅𝑎𝑗 baja de
valor cuando el término que se agrega no aporta mucho. Si el coeficiente de determinación
es alto, entonces los factores estudiados junto con la interacción son responsables o
explican un alto porcentaje de la variabilidad observada en la variable respuesta.

Realizar: Ejercicio 6 – 9 Libro de Montgomery, página 278

Nota: en R los efectos “effects” están divididos para 2, de manera que en diseños 22 los efectos no son
efectos principales en R, pasan a ser los coeficientes del modelo de regresión. Razón por lo cual se debe
interpretar mejor los efectos medios que son las medias aritméticas, que pasan a ser 𝑦̂ de la regresión en
el punto indicado

DISEÑO FACTORIAL 23
• Con el diseño factorial 23 se estudian tres factores en dos niveles cada uno. Consta
de 23 =2 × 2 × 2 = 8 tratamientos diferentes.
• Con este diseño se pueden estudiar los 23 – 1 = 7 efectos: tres efectos principales A, B, C;
tres interacciones dobles o de primer orden AB, AC, BC y una interacción triple o de segundo
orden ABC, por lo general el interés se enfoca en estudiar los efectos principales y las
interacciones

Representación geométrica

Fuente: (Gutiérrez Pulido & De la Vara Salazar, 2012)

La región experimental es un cubo regular centrado en el origen (0,0,0), cuyos vértices son los 8
tratamientos

Modelo matemático de efectos fijos

Xijkl = µ + αi + βj + γk + αβij + αγik + βγjk + αβγijk +eijkl


Xijkl = Variable respuesta.
µ = Media global.
αi = efecto del nivel i-ésimo nivel del factor A.
βj = efecto del nivel j ésimo nivel del factor B.
γk = efecto del nivel k ésimo nivel del el factor C.
αβij = efectos de interacción entre factor A y B.
αγik = efectos de interacción entre factor A y C.
βγjk = efectos de interacción entre factor B y C.
αβγijk = efectos de interacción entre factor A, B y C.
eijkl = Es el error o valor residual que se considera es independiente de observación a observación
y está normalmente distribuido con valor esperado igual a cero y varianza igual a σ2, Ν (0, σ2).

Para i=j=k Número de niveles del factor A, B y C


l = 1,2,3,….,r Número de replicaciones
Dichos efectos están sujetos a las restricciones: ∑αi = ∑βj = ∑ γk = ∑ αβij = ∑ αγik = ∑ βγjk = ∑ αβγijk = 0

Planteo de hipótesis del modelo factorial 2^3.


Ho: αi = 0 Ho: βj = 0 Ho: γk = 0
H1: αi ≠ 0 H1: βj ≠ 0 H1: γk ≠ 0
H0: αβij = 0 H0: αγik = 0 H0: βγjk = 0
H1: αβij ≠ 0 H1: αγik ≠ 0 H1: βγjk ≠ 0

H0: αβγijk = 0
H1: αβγijk ≠ 0

Combinaciones 23
Las combinaciones serán únicas y no pueden repetirse.

c1 c2
b1 b2 b1 b2
a1 a1b1c1 a1b2c1 a1b1c2 a1b2c2
a2 a2b1c1 a2b2c1 a2b1c2 a2b2c2

Matriz de diseño o arreglo factorial 23


Total A B C AB AC BC ABC
(1) a1b1c1 - - - + + + -
a (a2b1c1) + - - - - + +
b (a1b2c1 - + - - + - +
ab (a2b2c1 + + - + - - -
c (a1b1c2) - - + + - - +
ac (a2b1c2) + - + - + - -
bc(a1b2c2) - + + - - + -
abc(a2b2c2) + + + + + + +

Cálculo de Efectos principales y Sumas de cuadrados


Multiplicadore ortogonales
Tratamientos
A B C AB AC BC ABC
-1 - - - + + + -
a + - - - - + +
b - + - - + - +
ab + + - + - - -
c - - + + - - +
ac + - + - + - -
bc - + + - - + -
abc + + + + + + +
Sumas A B C AB AC BC ABC
Efecto principal A/4r B/4r C/4r AB/4r AC/4r BC/4r AB/4r
Contruibución a
(A)2 / 8r (B)2 / 8r (C)2 / 8r (AB)2 / 8r (AC)2 / 8r (BC)2 / 8r (ABC)2 / 8r
SC

Efectos Principales
Los efectos principales son los cambios en la media de la variable de respuesta que se deben a
la acción individual de cada factor.

1
𝐴= [ 𝑎 + 𝑎𝑏 + 𝑎𝑐 + 𝑎𝑏𝑐 − (1) − 𝑏 − 𝑐 − 𝑏𝑐]
4𝑟
1
𝐵= [ 𝑏 + 𝑎𝑏 + 𝑏𝑐 + 𝑎𝑏𝑐 − (1) − 𝑎 − 𝑐 − 𝑎𝑐]
4𝑟
1
𝐶= [ 𝑐 + 𝑎𝑐 + 𝑏𝑐 + 𝑎𝑏𝑐 − (1) − 𝑎 − 𝑏 − 𝑎𝑏]
4𝑟

Efectos de interacción
Tres factores interactúan de manera significativa sobre una variable de respuesta cuando el
efecto de uno depende del nivel en el que se encuentra el otro.
La interacción permite conocer cómo actúan los factores sobre la variable de respuesta.
Cuando una interacción tiene un efecto estadísticamente significativo sobre la respuesta, su
interpretación tiene prioridad sobre los correspondientes efectos principales, aunque estos
también sean significativos.
Esto se debe a que la interacción termina dominando el proceso y ayuda a seleccionar la
condición en la que debe operarse el proceso para mejorar su desempeño.
1
𝐴𝐵 = [ (1) − 𝑎 − 𝑏 + 𝑎𝑏 + 𝑐 − 𝑎𝑐 − 𝑏𝑐 + 𝑎𝑏𝑐]
4𝑟
1
𝐴𝐶 = [ (1) − 𝑎 + 𝑏 − 𝑎𝑏 − 𝑐 + 𝑎𝑐 − 𝑏𝑐 + 𝑎𝑏𝑐]
4𝑟
1
𝐵𝐶 = [ (1) + 𝑎 − 𝑏 − 𝑎𝑏 − 𝑐 − 𝑎𝑐 + 𝑏𝑐 + 𝑎𝑏𝑐]
4𝑟
1
𝐴𝐵𝐶 = [ −(1) + 𝑎 + 𝑏 − 𝑎𝑏 + 𝑐 − 𝑎𝑐 − 𝑏𝑐 + 𝑎𝑏𝑐]
4𝑟

Cuadro de análisis de varianza


FV SC GL CM Fc
Efecto A SCA a-1 CMA CMA / CMR
Efecto B SCB b-1 CMB CMB / CMR
Efecto C SCC c-1 CMC CMC / CMR
Efecto AB SCAB (a-1)(b-1) CMAB CMAB / CMR
Efecto AC SCAC (a-1)(c-1) CMAC CMAC / CMR
Efecto BC SCBC (a-1)(c-1) CMBC CMBC / CMR
Efecto ABC SCABC (a-1)(b-1)(c-1) CMABC CMABC / CMR
Error SCR abc (n-1) CME
Total SCT abcn-1

Ejemplo
Se quiere realizar un estudio para medir el tiempo en que madura el aguacate (VR). Con las
variables: Tipo de aguacate, método de conservación y temperatura.
A Tipo de Aguacate a1 Criollo
a2 Guatemalteco
B Método de conservación b1 Funda negra
b2 Periódico
C Temperatura c1 Ambiente
c2 Caliente

Realizar ejemplo “Biorremediación de suelos contaminados por hidrocarburos”, 23

DISEÑO FACTORIAL 24
En este diseño intervienen cuatro factores a dos niveles cada factor; es una extensión de los diseños
descritos anteriormente y su procedimiento de prueba y cálculo son similares.
El número de tratamientos es 16 que corresponden a la multiplicación del número de niveles de cada
factor: 2 x 2 x 2 x 2 = 16
Si denotamos a los factores con A, B, C y D, los tratamientos y su notación se presenta a continuación:

Para el cálculo de los efectos principales (A, B, C, D), las interacciones de primer orden (AB, AC, AD,
BC,BD,CD), la de segundo orden (ABC, ABD, ACD, BCD) y la de tercer grado (ABCD), se utilizarán los
multiplicadores ortogonales
Al igual que en los casos anteriores, la presencia o ausencia de la letra del factor en la denominación del
tratamiento determina el signo “+” en presencia o “-” en ausencia; para las interacciones se multiplican
los signos de los factores que intervienen en la interacción.

El modelo matemático, de efectos fijos:


𝑋𝑖𝑗𝑐𝑚𝑘 = 𝜇 + 𝛼𝑖 + 𝛽𝑗 + 𝛼𝛽𝑖𝑗 + 𝛾𝑐 + 𝛼𝛾𝑖𝑐 + 𝛽𝛾𝑗𝑐 + 𝛼𝛽𝛾𝑖𝑗𝑐 + 𝛿𝑚 + 𝛼𝛿𝑖𝑚 + 𝛽𝛿𝑗𝑚 + 𝛼𝛽𝛿𝑖𝑗𝑚 + 𝛾𝛿𝑐𝑚
+ 𝛼𝛾𝛿𝑖𝑐𝑚 + 𝛽𝛾𝛿𝑗𝑐𝑚 + 𝛼𝛽𝛾𝛿𝑖𝑗𝑐𝑚 + 𝜀𝑖𝑗𝑐𝑚𝑘
Donde:
𝑋𝑖𝑗𝑐𝑚𝑘 = Valor de la variable respuesta correspondiente.
𝜇 = Es el promedio global o promedio poblacional
𝛼𝑖 = Es el efecto del i-ésimo nivel del factor A.
𝛽𝑗 = Es el efecto del j-ésimo nivel del factor B.
𝛾𝑐 = Es el efecto del c-ésimo nivel del factor C.
𝛿𝑚 = Ese el efecto del m-ésimo nivel del factor D
𝛼𝛽𝑖𝑗 , 𝛼𝛾𝑖𝑐 , 𝛽𝛾𝑗𝑐 , 𝛼𝛽𝛾𝑖𝑗𝑐 , 𝛼𝛿𝑖𝑚 , 𝛽𝛿𝑗𝑚 , 𝛼𝛽𝛿𝑖𝑗𝑚 , 𝛾𝛿𝑐𝑚 , 𝛼𝛾𝛿𝑖𝑐𝑚 , 𝛽𝛾𝛿𝑗𝑐𝑚 , 𝛼𝛽𝛾𝛿𝑖𝑗𝑐𝑚 Representa las
interacciones de los factores.
𝜀𝑖𝑗𝑐𝑚𝑘 = Es el error o valor residual que se considera es independiente de observación a observación
y está normalmente distribuido con valor esperado igual a cero y varianza igual a σ2 , Ν (0,σ2).

Para i = j = c = m = 1, 2; número niveles del factor A, B, C y D


k= 1,2,3,….r Número de replicaciones
Dichos efectos están sujetos a las restricciones:
∑ 𝜶𝒊 = ∑ 𝜷𝒊 = ∑ 𝜶𝜷𝒊𝒋 = ∑ 𝜸𝒄 = ∑ 𝜶𝜸𝒊𝒄 = ∑ 𝜷𝜸𝒋𝒄 = ∑ 𝜶𝜷𝜸𝒊𝒋𝒄 = ∑ 𝜹𝒎 = ∑ 𝜶𝜹𝒊𝒎 = ∑ 𝜷𝜹𝒋𝒎 =
∑ 𝜶𝜷𝜹𝒊𝒋𝒎 = ∑ 𝜸𝜹𝒄𝒎 = ∑ 𝜶𝜸𝜹𝒊𝒄𝒎 = ∑ 𝜷𝜸𝜹𝒋𝒄𝒎 = ∑ 𝜶𝜷𝜸𝜹𝒊𝒋𝒄𝒎 = 𝟎

Las 15 hipótesis que se prueban corresponden a cada factor, interacción y a las replicaciones, su
procedimiento es exactamente igual al utilizando en los ejemplos anteriores.
Tabla Anova
Fuente de Grados Suma de Cuadro Medio Estadística de prueba
variación de Cuadrados
libertad
Tratamientos abcd-1 SCE CME=SCE/(abcd-1) Fc=CME/CMR

A a-1 SCA CMA=SCA/(a-1) Fc=CMA/CMR

B b-1 SCB CMB=SCB/(b-1) Fc=CMB/CMR

C c-1 SCC CMC=SCC/(c-1) Fc=CMC/CMR

D d-1 SCD CMD=SCD/(d-1) Fc=CMD/CMR

AB (a-1)(b-1) SCAB CMAB=SCAB/(a-1)(b-1) Fc=CMAB/CMR

AC (a-1)(c-1) SCAC CMAC=SCAC/(a-1)(c-1) Fc=CMAC/CMR

AD (a-1)(d-1) SCAD CMAD=SCAD/(a-1)(d-1) Fc=CMAD/CMR

BC (b-1)(c-1) SCBC CMBC=SCBC/(b-1)(c-1) Fc=CMBC/CMR

BD (b-1)(d-1) SCBD CMBD=SCBD/(b-1)(d-1) Fc=CMBD/CMR

CD (c-1)(d-1) SCCD CMCD=SCCD/(c-1)(d-1) Fc=CMCD/CMR

ABC (a-1)(b- SCABC CMABC=SCABC(a-1)(b- Fc=CMABC/CMR


1)(c-1) 1)(c-1)
ABD (a-1)(b- SCABD CMABD=SCABD/(a-1)(b- Fc=CMABD/CMR
1)(d-1) 1)(d-1)
ACD (a-1)(c- SCACD CMACD=SCACD/(a-1)(c- Fc=CMACD/CMR
1)(d-1) 1)(d-1)
BCD (b-1)(c- SCBCD CMBCD=SCBCD/(b-1)(c- Fc=CMBCD/CMR
1)(d-1) 1)(d-1)
ABCD (a-1)(b- SCABCD CMABCD=SCABCD/(a- Fc=CMABCD/CMR
1)(c-1)(d- 1)(b-1)(c-1)(d-1)
1)
Residual (error) (abcd- SCR CMR=SCR/(abcd-1)(r-1)
1)(r-1)
Total n-1 SCT

Ver archivo interacciones, para hacer gráficos manualmente (Ruta: Documentos-UCE-Diseño de


experimentos)

DISEÑO FACTORIAL GENERAL O FACTORIALES MIXTOS O EXPERIMENTOS


FACTORIALES
DE DOS O TRES FACTORES
Es el diseño en el que al menos uno de los factores tiene más de dos niveles. Estos diseños
aunque menos utilizados que los 2k , también son útiles en muchas situaciones prácticas

Se tiene un diseño factorial mixto cuando los factores estudiados no tienen el mismo
número de niveles. Es aquel en el que intervienen dos o tres factores, el factor A con a
niveles y el factor B con b niveles y el factor C con c niveles; el número de tratamientos es
igual a “a x b” o “a x b x c”, respectivamente; si tenemos r replicaciones en el experimento,
entonces el número de observaciones o unidades experimentales es de “a x b x r” o “a x b
x c x r”, si es de dos o tres factores respectivamente, en el que éstas se asignan
aleatoriamente a cada tratamiento.
Si se tuviera tres factores entonces los niveles son: nivel alto, medio y bajo o nivel inferior,
intermedio y superior

Modelo matemático del diseño factorial dos generales (de efectos fijo)

Xijk = µ + αi + βj + αβij + εijk


en el que:
Xij = Valor de la variable respuesta.
µ = Es el promedio general o promedio poblacional
αi = Es el efecto del i-ésimo nivel del factor A.
βj = Es el efecto del j-ésimo nivel del factor B
αβij = Representa el efecto de la interacción de los factores A y B.
εijk = Es el error o valor residual que se considera es independiente de
observación a observación y está normalmente distribuido con
valor esperado igual a cero y varianza igual a σ2 , Ν (0,σ2).

Para i = j Número niveles del factor A y B


k = 1, 2, ... r, Número de replicaciones

Dichos efectos están sujetos a las restricciones: ∑αj = ∑βj =∑ αβij = 0.

Al igual que el diseño factorial 2k; debemos notar que en el modelo matemático los
elementos: αi, βj y αβij, corresponden a los componentes independientes de los
tratamientos, de forma que el modelo matemático, expresado en función de los
tratamientos y de las replicaciones, puede escribirse como un diseño ANOVA dos factores
o solo en función de tratamientos ANOVA un factor

Xij = µ + Φi + γk + εij ANOVA dos factores (una sola réplica)


Xij = µ + Φi + εij ANOVA un factores (con más de una réplica)

Se probarán hipótesis para cada factor e interacción entre los factores y el efecto de los
tratamientos y de las replicaciones. El procedimiento de cálculo, elaboración, y
conformación del cuadro de análisis de varianza se explica a continuación
Pasos para realizar diseños factoriales generales:
1. Se listan los tratamientos con sus respectivas observaciones conformando un cuadro
de doble entrada: tratamiento y réplicas. Con esto se obtiene un diseño con un factor
o dos factores. Calcular el FC
2. Se tiene que formar una tabla de dos vías por cada par de factores, por ejemplo, A X B,
sumando las observaciones que correspondan para cada combinación de los niveles de
cada factor
3. Se calcula el total de cada cuadro de dos vías = se eleva al cuadrado cada valor de Xij,
la sumatoria de estos valores se divide para el número de observaciones que contiene
cada Xij, y se le resta el FC
4. Para calcular la SC de un factor, sume el cuadrado de los totales marginales del factor, y
divida para el número de observaciones que contiene cada total marginal y reste menos
FC. El resultado es la contribución del factor, a la suma de cuadrados de tratamientos
5. La interacción de cada par de factores = total de cuadro de dos vías (paso 3), menos el
aporte de cada factor
Y así se trabaja con cada cuadro de dos vías
El cuadro de análisis de varianza para un diseño factorial dos general con “r” replicaciones
por tratamiento es:

CUADRO DE ANALISIS DE VARIANZA


FUENTE DE GRADOS DE SUMA DE CUADRADO MEDIO ESTADISTICA DE
VARIACION LIBERTAD CUADRADOS PRUEBA
Tratamientos
A a-1 SCA CMA = SCA / (a-1) Fc = CMA / CMR
B b-1 SCB CMB = SCA / (b-1) Fc = CMB / CMR
AB (a-1)(b-1) SCAB CMAB = SCA /(a-1)(b-1) Fc = CMAB / CMR
Residual (Error)
TOTAL n–1 SCT

Modelo matemático del diseño factorial tres general (efectos fijos)

Xijkl = µ + αi + βj + γk + αβij + αγik + βγjk + αβγijk +eijkl


Xijkl = Variable respuesta.
µ = Media general.
αi = efecto del nivel i-ésimo nivel del factor A.
βj = efecto del nivel j ésimo nivel del factor B.
γk = efecto del nivel k ésimo nivel del el factor C.
αβij = efectos de interacción entre factor A y B.
αγik = efectos de interacción entre factor A y C.
βγjk = efectos de interacción entre factor B y C.
αβγijk = efectos de interacción entre factor A, B y C.
Para i=j=k Número de niveles del factor A, B y C
l = 1,2,3,….r Número de replicaciones
Dichos efectos están sujetos a las restricciones: ∑αj = ∑βj = ∑ γk = ∑ αβij = ∑ αγik = ∑ βγjk = ∑
αβγijk = 0
Para calcular la SC de cada factor y sus interacciones se procede de igual manera que el
diseño factorial dos general, en el cual se empieza formando las tabla de dos entrada, por
ejemplo A X B, A x C y B x C

El cuadro de análisis de varianza para un diseño factorial tres general con “r” replicaciones
por tratamiento es:

CUADRO DE ANALISIS DE VARIANZA


FV SC GL CM Fc
Tratamientos
Efecto A SCA a-1 CMA CMA / CME
Efecto B SCB b-1 CMB CMB / CME
Efecto C SCC c-1 CMC CMC / CME
Efecto AB SCAB (a-1)(b-1) CMAB CMAB / CME
Efecto AC SCAC (a-1)(c-1) CMAC CMAC / CME
Efecto BC SCBC (a-1)(c-1) CMBC CMBC / CMR
Efecto ABC SCABC (a-1)(b-1)(c-1) CMABC CMABC / CME
Error SCE abc (n-1) CME
Total SCT abcn-1
Según Cisneros Guzmán, se recomienda que en los diseños factoriales puede ser importante
discriminar de la variación total aquella que corresponda a las replicaciones, esto disminuye la
variación del error experimental y hace más sensible las pruebas para factores e interacciones

Nota: en la guía 5 y 6 de Diseño de experimentos consta diseños factoriales, ubicación:

Ejercicios propuestos PEC2

DISEÑOS CON EFECTOS ALEATORIOS


Los efectos aleatorios son otro enfoque para diseñar experimentos y modelar datos. Los
efectos aleatorios son apropiados cuando los tratamientos son muestras aleatorias de
una población de tratamientos potenciales.
Supongamos la siguiente situación experimental. Una empresa cuenta con 50 máquinas
que fabrican cajas de cartón para conservas, y quieren entender la variación en la fuerza
de los cartones. Eligen 10 máquinas al azar de los 50 y hacen 40 cartones en cada
máquina, asignando al azar 400 lotes de materia prima para cartón a las diez máquinas.
Los cartones resultantes se someten a pruebas de resistencia. Este es un diseño
aleatorizado, con diez tratamientos (máquinas) y 400 unidades (10 * 40)

La aplicación de un modelo de efectos aleatorios conlleva la necesidad de considerar la


incertidumbre asociada con la elección aleatoria de los niveles de prueba.
Es decir, ya no tiene sentido, para un factor A, preocuparse por el efecto 𝛼𝑖 del nivel i
como con efectos fijos. Lo que ahora (con efectos aleatorios) tiene sentido es hablar de la
varianza con la que el factor aleatorio contribuye a la variación total; es decir, es preciso estimar
dicha varianza y probar su contribución a la variabilidad

En modelo de efectos aleatorios sigue teniendo sentido descomponer la variabilidad de


los datos en la media general, el efecto de los tratamientos y el error, es decir, los
componentes del modelo son los mismos que de efectos fijos, si estudiamos un factor,
entonces tendíamos

Modelo de un factor aleatorio


Los componentes del modelo son:
yij = μ + Ai + eij
Asumimos que:
Yij es la variable respuesta, tiene 𝜎𝐴2 +𝜎 2 , llamamos 𝜎𝐴2 ,𝜎 2 componentes de varianza
Ai son variables aleatorias con distribución normal de media cero y varianza 𝜎𝐴2 (usamos
letras latinas para indicar que son efectos aleatorios).
eij son independientes con distribución normal de media cero y varianza 𝜎 2

Los parámetros de los modelos de efectos aleatorios son la media general μ, la varianza
del error 𝜎 2 y la varianza de los efectos 𝜎𝐴2 . Los efectos Ai son variables aleatorias, no
parámetros. Para contrastar si el factor aleatorio es significativo, planteamos el
contraste de hipótesis sobre 𝜎𝐴2
H0 : 𝜎𝐴2 = 0
H1 : 𝜎𝐴2 > 0 Los diferentes niveles del factor provocan efectos sobre la variable
respuesta

La tabla ANOVA en los modelos de un factor con efectos aleatorios, es idéntica a la tabla
ANOVA de un factor con efectos fijos. La tabla ANOVA tiene exactamente las mismas
filas; factor, residuo y total, y las mismas columnas; Fuente de variación, suma de
cuadrados, grados de libertad, cuadrados medios y F.

Para estimar las componentes de la varianza, 𝜎𝐴2 y 𝜎 2 , debemos tener en cuenta la


esperanza matemática de
los cuadrados medios del error y del factor A
E(CMA ) = 𝜎 2 + n𝜎𝐴2
Error = 𝜎 2

Por tanto, la estimación de las componentes de la varianza 𝜎𝐴2 y 𝜎 2 ,se obtiene igualando
los E(CM) con los
cuadrados medios respectivos en la tabla ANOVA. Esto es,
𝜎 2 + n𝜎𝐴2 =CMA
𝜎 2 =CMR

Y, aplicando el método de los momentos para obtener las estimaciones, aislamos las
sigmas
𝜎̂ 2 =CMR
𝐶𝑀𝐴−𝐶𝑀𝑅
𝜎̂𝐴2 =
𝑛

Modelo de dos factores aleatorios


Los componentes del modelo son:
yijk = μ + Ai + Bj + ABij + eijk
donde i = 1, ..., a, j = 1, ..., b y k = 1, ..., n.
Asumimos que:
eijk son independientes con distribución normal de media 0 y varianza 𝜎 2 , es decir
eijk~N(0; 𝜎 2 )
Ai es el efecto del factor A, son variables aleatorias con distribución normal de media
cero y varianza 𝜎𝐴2 , es decir Ai~N(0; 𝜎𝐴2 )
Bj es el efecto del factor B, son variables aleatorias con distribución normal de media
cero y varianza 𝜎𝐵2 , es decir Bj~N(0; 𝜎𝐵2 )
ABij es el efecto de la interacciónAB, son variables aleatorias con distribución normal
2 2
de media cero y varianza 𝜎𝐴𝐵, es decir ABij~N(0; 𝜎𝐴𝐵 )
Yijk es la variable respuesta, es una variable aleatoria N(0; 𝜎𝑌2 ) , cuya varianza es 𝜎𝑌2 =
𝜎𝐴2 + 𝜎𝐵2 + 𝜎𝐴𝐵
2
+ 𝜎 2, llamamos 𝜎𝐴2 , 𝜎𝐵2 , 𝜎𝐴𝐵 2
, 𝜎 2 componentes de la varianza

Contrastes de interés
H0 : 𝜎𝐴2 = 0
H1 : 𝜎𝐴2 > 0
H0 : 𝜎𝐵2 = 0
H1 : 𝜎𝐵2 > 0

2
H0 : 𝜎𝐴𝐵 =0
2
H1 : 𝜎𝐴𝐵 > 0

En resumen, la tabla ANOVA para un diseño experimental con dos factores aleatorios
con interacción es de la forma

Factor SC GL CM Fc
A SCA a-1 CMA CMA/CMAB
B SCB b-1 CMB CMB/CMAB
AB SCAB (a-1)(b-1) CMAB CMAB/CMR
Error SCR ab(r-1) CMR

Las estimaciones de las varianzas 𝜎𝐴2 , 𝜎𝐵2 , 𝜎𝐴𝐵


2
, 𝜎 2 las obtendremos identificando los
cuadrados medios de cada factor con las esperanzas de los cuadrados medios, de
manera que los componentes de varianza son:
𝜎̂ 2 =CMR
2
𝐶𝑀𝐴−𝜎2 −𝑟𝜎𝐴𝐵 𝐶𝑀𝐴−𝐶𝑀𝐴𝐵
𝜎̂𝐴2 = =
𝑟𝑏 𝑏𝑟
2 2
2 𝐶𝑀𝐵−𝜎 −𝑟𝜎𝐴𝐵 𝐶𝑀𝐵−𝐶𝑀𝐴𝐵
𝜎̂𝐵 = =
𝑟𝑎 𝑎𝑟
𝐶𝑀𝐴𝐵−𝜎 2 𝐶𝑀𝐴𝐵−𝐶𝑀𝑅
2
𝜎̂𝐴𝐵 = =
𝑟 𝑟

La varianza de la variable respuesta es 𝜎𝑌2 = 𝜎𝐴2 + 𝜎𝐵2 + 𝜎𝐴𝐵 2


+ 𝜎 2, es necesario
interpretar que factor es atribuible a la mayor parte de variabilidad

Cabe señalar que a diferencia de los modelos de efectos fijos ahora no se realiza
comparaciones múltiples, pero sí se evalúa los componentes de la varianza

Nota: En R, la función “aov” asume que todos los factores son fijos, mientras que la
función lm del paquete mixlm permite especificar los factores aleatorios, mediante la
función r
En SPS, la ruta es: Analizar-Modelo lineal general-univariado, …. . Mientras que para
sacar los componentes de varianza: Analizar-Modelo lineal general- Componentes de
varianza

Realizar ejemplo “evaluación del rendimiento de un instrumento” Guía 7y 8

Modelos con efectos mixtos


Un experimento que tiene tanto factores con efectos fijos como factores con efectos
aleatorios se dice que tienen efectos mixtos. La interacción de un efecto fijo y un efecto
aleatorio debe ser tratada como un factor aleatorio, ya que una nueva muestra
aleatoria de los niveles de factor también conducirá a una nueva muestra aleatoria de
interacciones.

Realizar ejemplo “evaluación del rendimiento de un instrumento” Guía 13 y14

You might also like