Técnicas para interpretar
resultados de Análisis de Varianza:
con Ejemplos usando SAS:
Por
Prof. S. P. Sinha
 Indice del Contenido:
  Objetivos de esta Página:
(1):  Diseño Completamente aleatorio
(2):  Diseño en bloques aleatorios  
(3):  Diseño Cuadrado Latino 
(4):  Experimentos Factoriales 
(5):  Diseño de Parcelas Divididas 
(6)Diseño de Parcelas Sub Divididas 
 
Esta sección hace uso de programas fuentes, salidas  SAS
y esquemas de Análisis de varianza, que Ud. puede consultar
por los enlaces que se presentan a continuación:
                                                        Programa Fuente y Salida SAS       Andeva Esquemático
IMPORTANT NOTICE ABOUT THE COPYRIGHTS.
Análisis Gráfico: 1     2     3     4
 



Objetivos de esta Página:
 
 Diseño Completamente aleatorio
 
                                                                  
                                           (1.1): Caso fijo y balanceado: Tratamientos cualitativos
  Este ejemplo proviene del libro de Montgomery, D. (2da. edición: inglés), Página 63.
  Se trata de un modelo fijo balanceado. Hay 5 tratamientos que representan diferentes porcentaje de algodón, que son :
  15, 20, 25, 30 y 35 respectivamente. Se usaron 5 replicaciones. La variable respuesta es la resistencia de fibra sintética
  (lb/in cuadrado.) . Ejemplo 1 no toma en cuenta la información que los 5 tratamientos se pueden considerar cuantitativos
  caracterizados así por sus valores respectivos de porcentaje de algodón. Los datos de este experimento se vuelven a
  analizar en el ejemplo 1.2 considerando los tratamientos como cuantitativos.

     Tabla 1.1.1:  Datos experimentales:
     Los datos que corresponden a un mismo tratamiento se tabulan en una misma fila.
       Tratamiento 1:      7     7   15   11    9
       Tratamiento 2:    12   17   12   18  18
       Tratamiento 3:    14   18   18   19  19
       Tratamiento 4:    19   25   22   19  23
       Tratamiento 5:      7   10   11   15  11
                                                                                   Salida SAS

 
Tabla 1.1.2: Tabla de ANDEVA: Diseño Completamente aleatorio
                
Tabla 1.1.3:   Comparación de promedios de tratamientos por el método de Duncan:
                            General Linear Models Procedure
                   Duncan's Multiple Range Test for variable: Y
            NOTE: This test controls the type I comparisonwise error rate,
                  not the experimentwise error rate
                     Alpha= 0.05  df= 20  MSE= 8.06
                Number of Means     2     3     4     5
                Critical Range  3.745 3.931 4.050 4.132

      Means with the same letter are not significantly different.

              Duncan Grouping              Mean      N  X

                            A            21.600      5  30

                            B            17.600      5  25
                            B
                            B            15.400      5  20

                            C            10.800      5  35
                            C
                            C             9.800      5  15
 
(2): Caso fijo y balanceado: Tratamientos cuantitativos
(Este Ejemplo usa datos de la Tabla 1.1.1)
 
    La información mas importante que se consigue en la tabla 1.2.2 es la función polinómica  estimada de tercer grado, la cual es:  
    Y(estimada)  =  62.61142857  -9.01142857*X + 0.48142857*X*X  -0.0076*X*X*X  
    en que Y es la resistencia y X es el porcentaje del algodón.  
    Se puede maximizar esta función y para hacer esto se calcula la derivada de Y(estimada ) con respecto X. Luego se iguala  la expresión de la derivada  a cero  y se obtiene una ecuación cuadrática cuya solución produce el valor del X para el cual se obtiene máximo de Y(estimada).  
    Se podrá verificar que el máximo de la resistencia se produce para X = 28.23 y el valor del máximo es 20.90
                                                                             
 Diseño Bloques aleatorios:
         (2.1): Diseño Bloques aleatorios:    (balanceado con efectos fijos)
          Fuente de datos: Li, J.C.R. Capítulo 14
         Hay 6 tratamientos de Variedades y 5 bloques.  Este experimento se hizo en el campo experimental.
         Tabulación de datos: por filas como Variedades  y por columnas como bloques;
         La variable repuesta es el rendimiento.
        Datos:
        32.6    41.0    17.9    23.8    19.6
        38.4    39.4    37.1    42.8    21.8
        65.1    59.9    41.9    36.1    21.1
        54.2    46.4    43.6    35.1    43.4
        83.7    37.9    69.3    63.8    50.7
        77.1    70.8    57.7    51.1    46.5
Comentarios:
                   Tabla 2.1.2: Análisis posterior por el Método de Duncan:               
                    General Linear Models Procedure
              Duncan's Multiple Range Test for variable: Y
      NOTE: This test controls the type I comparisonwise error rate, 
            not the experimentwise error rate
                   Alpha= 0.05  df= 20  MSE= 101.6705
             Number of Means     2     3     4     5     6
             Critical Range  13.30 13.96 14.38 14.68 14.89

      Means with the same letter are not significantly different.

           Duncan Grouping              Mean      N  VARIEDAD
                                 
                         A            61.080      5  5
                         A       
                         A            60.640      5  6
                                 
                         B            44.820      5  3
                         B       
                         B            44.540      5  4
                         B       
                 C       B            35.900      5  2
                 C               
                 C                    26.980      5  1
 
 
 
Diseño Cuadrado Latino
(3.1): Cuadrado Latino:
 
     4 Filas:  4 Columnas: 4 Tratamientos(Variedades de Trigo) ;
     y = Rendimiento por parcela en Kg. ;
     Ejemplo: Steel, R.G.D y Torrie, J.H.: Capitulo 8 ;
    DATOS:
    C  10.5  D   7.7  B  12.0  A  13.2
    B  11.1  A  12.0  C  10.3  D   7.5
    D   5.8  C  12.2  A  11.2  B  13.7
    A  11.6  B  12.3  D   5.9  C  10.2
  (4):  Experimentos Factoriales
(4.1): Experimento Factorial 2x4 en el Diseño B. A.
 
 (4.1): Experimento Factorial 2x4 en el Diseño B. A.
                          
        * Datos: Li, J C. R., Capitulo 18: Introduction to Statistical Inference
        * Factores:  Fecha de siembra con 2 niveles: Temprana , Tardía ;
        * Factor: Abono con 4 niveles: Abono estándar, Aéreo, Na, y, K  ;
        * Número de bloques = 4 ;
        * Variable respuesta:  rendimiento por parcela de soya ;
        * Tabulación de datos:
        *                                            Bloques               ;
        * Fecha de siembra  Abono       1       2       3       4          ;
        *   Temprana       Abono estándar -       -       -       -          ;
        *   Temprana       Aéreo        -       -       -       -          ;
        *   Temprana       Na           -       -       -       -          ;
        *   Temprana       K            -       -       -       -          ;
        * .... Después siguen 4 lineas siguientes para fecha de siembra tardía ....;

        Datos:
        28.6  36.8  32.7  32.6
        29.1  29.2  30.6  29.1
        28.4  27.4  26.0  29.3
        29.2  28.2  27.7  32.0
        30.3  32.3  31.6  30.9
        32.7  30.8  31.0  33.8

        30.3  32.7  33.0  33.9
        32.7  31.7  31.8  29.4
 
  Diseños de Parcelas Divididas:
          A continuación se muestra la Tabla de Andeva definitiva.
                               Análisis de Varianza
     Fuentes de Variación    G.L.       S.C.        C.M.        F      Pr > F
     BLOQUES                  3     2842.8731     947.6244    13.79    0.0010       
     TRATPRIN                 3     2848.0219     949.3406    13.82    0.0010 
     Error(a)                 9      618.2944      68.6994     
     SUBTRAT                  3      170.5369      56.8456     2.80    0.0539
     TRATPRIN*SUBTRAT         9      586.4656      65.1628     3.21    0.0059  
     Error(b)                36      731.2025      20.3112
     Corrected Total         63     7797.3944
                               Parcelas subdivididas                        
                         General Linear Models Procedure

Dependent Variable: Y
                                  Sum of         Mean
Source                  DF       Squares       Square  F Value    Pr > F
Model                   62     25921.472      418.088    46.83    0.0001
Error                   81       723.188        8.928           Nombrar esta F.V. como Error(c)
Corrected Total        143     26644.660

                  R-Square          C.V.     Root MSE             Y Mean

                  0.972858      3.074926       2.9880             97.174


Source                  DF     Type I SS  Mean Square  F Value    Pr > F

BLOQUES                  3        48.410       16.137     1.81    0.1524  No usar esta Fila.
TECNICO                  2       248.347      124.174    13.91    0.0001  No usar esta Fila. 
BLOQUES*TECNICO          6       161.153       26.859     3.01    0.0105  Nombrarla como Error(a) 
DOSIS                    2     20570.056    10285.028  1151.97    0.0001  No usar esta Fila.
TECNICO*DOSIS            4       125.944       31.486     3.53    0.0105  No usar esta Fila.
BLOQUE*DOSIS(TECNIC)    18       226.000       12.556     1.41    0.1514  Nombrarla como Error(b)
GROSOR                   3      3806.910     1268.970   142.13    0.0001
TECNICO*GROSOR           6       126.486       21.081     2.36    0.0375
DOSIS*GROSOR             6       402.278       67.046     7.51    0.0001
TECNICO*DOSIS*GROSOR    12       205.889       17.157     1.92    0.0435

Tests of Hypotheses using the Type I MS for
BLOQUES*TECNICO as an error term

Source                  DF     Type I SS  Mean Square  F Value    Pr > F
BLOQUES                  3      48.40972     16.13657     0.60    0.6378
TECNICO                  2     248.34722    124.17361     4.62    0.0609

Tests of Hypotheses using the Type I MS for
BLOQUE*DOSIS(TECNIC) as an error term

Source                  DF     Type I SS  Mean Square  F Value    Pr > F
DOSIS                    2     20570.056    10285.028   819.16    0.0001
TECNICO*DOSIS            4       125.944       31.486     2.51    0.0784
A continuación se muestra la Tabla de Andeva definitiva.
                               Análisis de Varianza
Fuentes de Variación    G.L.       S.C.        C.M.        F      Pr > F
BLOQUES                  3      48.40972     16.13657     0.60    0.6378
TECNICO                  2     248.34722    124.17361     4.62    0.0609
Error(a)                 6       161.153       26.859     
DOSIS                    2     20570.056    10285.028   819.16    0.0001
TECNICO*DOSIS            4       125.944       31.486     2.51    0.0784
Error(b)                18       226.000       12.556    
GROSOR                   3      3806.910     1268.970   142.13    0.0001
TECNICO*GROSOR           6       126.486       21.081     2.36    0.0375
DOSIS*GROSOR             6       402.278       67.046     7.51    0.0001
TECNICO*DOSIS*GROSOR    12       205.889       17.157     1.92    0.0435
Error(c)                81       723.188        8.928           
Corrected Total        143     26644.660
Comentarios:
El valor de F para Técnico no es significativo. Esto indica que los tres Técnicos han tenido éxito en conducir el experimento de una manera uniforme. Puesto que F para dosis es significativo, podemos concluir que existen diferencias significativas entre las potencias de las 3 dosis que se han probado en este experimento. La interacción Técnico*Dosis al no ser significativa, asegura que las 3 dosis entre ellas mantienen las mismas diferencias relativas del tiempo de absorción , no importa cual es el Técnico quién lo prepara. Esta información es importante ya que esto asegura la uniformidad en la calidad del producto elaborado.
Grosor es significativo, lo cual implica que la potencia del antibiótico depende del grosor de la pared de cápsula. La interacción  DOSIS*GROSOR es significativa. Esto indica que  el factor dosis y el factor grosor de la cápsula no son independientes. La interacción TECNICO*GROSOR es significativa indicando que el nivel del factor grosor que tenga el mejor  tiempo de absorción depende del técnico quién ha elaborado el antibiótico. La interacción triple Tecnico*Dosis* Grosor, por ser una interacción de tres factores puede ser causada de una manera compleja por la significación de cualesquiera de las siguientes interacciones:  Técnico por Dosis*Grosor,  o Dosis por Técnico*Grosor o por Grosor por Técnico*Dosis. 
A continuación se presenta la información necesaria para hacer el Análisis gráfico de las 3 interacciones dobles:
      Análisis Gráfico:
                Sabemos que una interacción doble es causada por una o ambas de las siguientes razónes:
               (1): Existe diferencia en  la magnitud de respuesta. (Se identifica esta situación en la gráfica cuando algunas o todas
                     de las líneas no son  paralelas pero no existe intersección entre ellas.)               En las  3 gráficas que se presentan arriba, podemos observar que:
              (1): Ninguna de las 3 gráficas muestran líneas paralelas y en consecuencia suma de cuadrados para interacción para
                    cada una de los 3 interacciones será mayor que cero.
              (2): Ninguna de las 3 gráficas presentan  la diferencia en la dirección de respuesta, ya que no existe intersección
                     entre las líneas.
              (3): Cada una de las 3 gráficas muestra diferencia en la magnitud de respuesta, siendo esta de un grado leve para la
                    interaccion  Técnico*Dosis la cual no alcanza significación  para a = 0,05 .
                    En cambio, las interacciones Técnico*grosor  y  Dosis*Grosor muestran las diferencias en la magnitud de
                    respuesta en un grado más  pronunciado y así alcanzan significación para a = 0,05 en la tabla de ANDEVA.

              Análisis Posterior:
               Ya que la interacción triple Tecnico*Dosis*Grosor y dos interacciones dobles son significativas, no se puede hacer
               el análisis posterior sobre los promedios de  los  niveles de ninguno de los 3 factores.
               Podemos realizar el análisis de Duncan sobre los promedios tridimensionales de Técnico, Dosis y Grosor. Este
               cálculo requiere la estimación de la varianza del promedio tridimensional y  se puede obtener por el promedio
               ponderado de los cuadrados medios de los 3 tipos de errores a, b, y c. Esta estimación tendrá 105 g.l.. A
               continuación se representa en forma resumida el resultado obtenido por el uso del análisis de Duncan:

                 Duncan Grouping       Mean      N  TRAT
                           A           115.250      4  413
                           A
                           A           115.000      4  313
                           A
                           A           115.000      4  433
                           A
                   B       A           112.750      4  423
                   B       A
                   B       A           112.000      4  421
                   ........................................
                       Se omiten los valores intermedios  
                   ........................................  
                           N            71.750      4  112
                           N
                           N            71.000      4  132
                           N
                           N            69.000      4  122
                 El grupo de combinaciones de tratamiento con promedios que tengan valores más altos de la variable respuesta
                 son:    413, 313 y 433 . Asimismo, el grupo formado por las combinaciones de tratamientos: 112, 132 y 122, tiene
                 promedios con valores más bajos de la respuesta.
 
                 Tomando en cuenta los resultados del del Análisis de Duncan, también se puede determinar:
                (a):  El mejor Técnico  para cada una de las combinaciones de Dosis por Grosor.
                (b):  La mejor Dosis  para cada una de las combinaciones de Técnico por Grosor.
                (c):  El mejor Grosor   para cada una de las combinaciones de Técnico por Dosis.
                (No se requiere a volver a hacer otro cómputo del método de Duncan, sino usar los resultados del Análisis de
                Duncan ya disponible.)