PRACTICA Nº 5 DISEÑO EXPERIMENTAL Los experimentos deben planificarse previamente, de modo que al finalizar el análisis de los resultados pueda responderse a la problemática que se intenta resolver con el experimento. Un plan experimental implica: a) la formulación de los objetivos del trabajo; b) la determinación y clara definición de los métodos que se utilizarán en la obtención de datos, y c) una decisión acerca de las técnicas de análisis de datos a ser empleadas. Este plan debe incluir necesariamente el diseño del experimento, que en estadística significa la organización de una serie de pruebas experimentales cuyo objeto es minimizar los efectos de factores o fuentes de variabilidad en los estudios de biodisponibilidad. La variabilidad que se presenta en estos estudios puede ser: - variabilidad entre los sujetos sometidos al estudio; - variabilidad intrasujetos, es decir, variaciones en las características de absorción que pueden producirse en un mismo voluntario en períodos diferentes del estudio; - efecto de los períodos de administración, causados especialmente por la acción residual de los tratamientos; - variabilidad causada por el tratamiento o producto, por ejemplo diferentes dosis o diferentes formulaciones y qué es lo que en definitiva se intenta establecer en los estudios de biodisponibilidad, y - error residual o experimental, que incluye cualquier fuente de variación que no haya sido identificada, tal como errores en el método de análisis. Esta variabilidad biológica puede resolverse, por ejemplo, empleando diseños cruzados o alternados, en los cuales a los voluntarios se les administran los productos en estudio alternadamente mientras dure el experimento. El caso más simple de un estudio cruzado consistiría en usar dos productos, uno de los cuales se administra a un individuo y, después de obtener las muestras sanguíneas o de orina para su análisis, se le hace descansar un período en el cual se supone que todo el fármaco absorbido ha sido eliminado. En seguida, se le administra el segundo producto y se comparan los resultados de absorción. De esta manera, se elimina, evidentemente, la variación intrasujetos. Este esquema experimental tan simple no es aplicable si se requiere resultados más precisos. Mientras mayor sea el número de sujetos que intervienen en el estudio, mayor será la precisión de los resultados, ya que las diferencias individuales serán minimizadas.
ANALISIS DE LA VARIANZA 1) Análisis de Varianza: Es una técnica que se usa para comprobar si existen diferencias significativas entre los promedios de los tratamientos.
2) Tipos de Diseño Experimental 2.1) Diseños completamente Aleatorios: Supondremos que el experimentador cuenta con los resultados de k muestras aleatorias independientes, cada una de tamaño n, de k diferentes poblaciones; y le interesa probar la hipótesis que las medias de esas k poblaciones son toas iguales. Si denotamos j-esima observación
en la i-esima muestra por Yij, el esquema general para un criterio de clasificación es como sigue: Medias Muestra 1: Y11, Y12,...., Y1j, ....... Y1 Muestra 2: Y21, Y22,...., Y2j, ....... Y2 .
.
.
.
.
.
.
.
.
Muestra i: Yk1, Yi2,...., Yij, ........ Yi .
.
.
.
.
.
Muestra a: Yk1, Yk2,...., Ykj, ....... Yk / Y
Modelo Estadístico Lineal (Balanceado): Yij = μ + Ti + Eij Yij = Valor de la pésima observación ubicada en el pésimo tratamiento. μ=
Promedio General
Ti = Efecto del iésimo tratamiento Bj = Efecto de jésimo tratamiento Eij = Variación de las observaciones ubicada en el pésimo bloque, utilizando el iésimo tratamiento.
Hipotesis: Ho: μ1= μ2=..... = μk H1: No todas μ’is son iguales Nivel de significación: α=
0.05 ó 0.01
Estadístico de Prueba: F = S1²/S² Regla de Decisión:
Si f>f α [(k -1), (k (n-1) ) ] se rechaza Ho
Tomar una muestra y llegar a una decisión.
Suma de Cuadrados STC = Suma total de cuadrado STC = ∑ ∑ Yij² - Y².. n.k
SCT = Suma de cuadrados de los tratamientos SCT = ∑ Yi² - Y².. n
n.k
SCE =Suma de cuadrado del error SCE = STC-SCT Cuadrados Medios S1²= Cuadrado medio de los tratamientos S1²= SCT k-1
S² = Cuadrado medio del error S² = SCE K(n-1)
Fuente
de Suma
de Grados
de Cuadros
variación
cuadrados
libertad
Medios
Tratamiento
SCT
K-1
S1²
Error
SCE
K(n-1)
S²
Total
STC
n(K-1)
Valor de F F=S1²/S²
2.2) Modelo no Balanceado: Hipotesis: Ho: μ1= μ2=..... = μk H1: No todas μ’is son iguales Nivel de significación: α =
0.05 ó 0.01
Estadístico de Prueba: F = S1²/ S² Regla de Decisión: Si f>f α [(k -1), (k (n-1) ) ] se rechaza Ho
Tomar una muestra y llegar a una decisión.
Suma de Cuadrados STC = Suma total de cuadrado STC = ∑ ∑ Yij² - Y².. N
N = Numero total de observaciones SCT = Suma de cuadrados de los tratamientos SCT = ∑ Yi² - Y².. ni
N
SCE = Suma de cuadrado del error SCE = STC-SCT Cuadrados Medios S1²= Cuadrado medio de los tratamientos S1²= SCT k-1
S² = Cuadrado medio del error S² = SCE N-K
Fuente
de Suma
de Grados
de Cuadros
variación
cuadrados
libertad
Medios
Tratamiento
SCT
K-1
S1²
Error
SCE
N-k
S²
Total
STC
n-1
Valor de F F=S1²/S²
2.3) Diseño de Bloques Aleatorios: La estimación de variable aleatoria a menudo puede reducirse, esto es , liberarse de la variabilidad debida a causas extrañas, dividiendo las observaciones de cada clasificación en bloques. Conviniendo en que Yij denote la observación relativa al i-esimo bloque Yi. la media de las b observaciones para el i-esimo tratamiento, Y.j la media de las a observaciones en el j-esimo bloque y Y.. la gran media de las ab observaciones, empleamos el siguiente esquema en esta clase de clasificación con dos criterios:
Bloques
B1 B2 .......Bj ....……Bh
Medias
Tratamiento 1: Y11, Y12,...., Y1j, .......Y1h
Y1.
Tratamiento 2: Y21, Y22,...., Y2j, .......Y2h
Y2.
.
.
.
.
.
.
.
.
.
Tratamiento i: Yk1, Yi2,...., Yij, ........Yih .
.
.
.
.
.
Tratamiento a: Ya1, Ya2,...., Yaj, ....... Yah
Medias
Y.1
Y.2
Y.j .......
Y.h
Yi.
Ya.
Y..
Este tipo de esquema se denomina también diseño en bloques aleatorios, siempre que los tratamientos sean asignados el azar dentro de cada bloque. Nótese que cuando un punto se usa en lugar de un subíndice, esto significa que la moda se obtiene sumando sobre èl. En el análisis de clasificación con dos criterios cada tratamiento es representado una vez dentro de cada bloque, el bloque principal consiste en probar la significancia de las diferencias entre las Yi., o sea probar la hip ótesis nula
α1 = α2 = ..... = α a = 0
Mas aun , quizá convenga probar si la división en bloques ha sido eficaz, esto es, si la hipótesis nula
β1 = β2 = ..... = β b = 0 puede rechazarse. En
cualquier caso, la hipótesis alterna establece que al menos uno de los efectos no es cero.
Yij= μ + Ti + Eij Yij = Valor de la i-ésima observación ubicada en el i-ésimo tratamiento. μ=
Promedio General
Ti = Efecto del i-ésimo tratamiento Bj = Efecto de j-ésimo tratamiento Eij = Variación de las observaciones ubicada en el pésimo bloque, utilizando el iésimo tratamiento.
B = Cantidad de bloques Y.. = Suma de todas las observaciones Yi. = Suma de todas las observaciones por tratamiento Y.j = Suma de todas las observaciones por bloques. Análisis de Varianza
Hipótesis: Ho: μ1= μ2=..... = μk H1: no todas μ’ks son iguales Ho: μ1= μ2=..... = μj H1: no todas μ’js son iguales Nivel de significación: α =
0.05 ó 0.01
Estadístico de Prueba: F1= S1²/S² ; F2= S2²/S² Regla de Decisión: Si f>f α [(k-1), (k (n-1) (b-1)) ] se rechaza Ho Tomar una muestra y llegar a una decisión.
Suma de Cuadrados STC = Suma total de cuadrado STC = ∑ ∑ Yij² - Y².. n.b
SCT = Suma de cuadrados de los tratamientos SCT = ∑ Yi² - Y².. b
b.k
SCB = Suma de cuadrados de los bloques SCB = ∑ Y.j² - Y².. k
b. k
SCE = Suma de cuadrado del error SCE = STC- SCT- SCB Cuadrados Medios S1²= Cuadrado medio de los tratamientos S1²=SCT
S2²= SCB
k-1
b-1
S² = Cuadrado medio del error S² = SCE____ (K-1)(b-1)
Fuente variación
de Suma
de Grados
cuadrados
libertad
de Cuadros Medios
Valor de F
Tratamiento
SCT
K-1
S1²
Error
SCB
b-1
S²
Bloques
STE
(k-1)(b-1)
Total
STC
B k-1
F = S1²/S² F2=S2²/S²
CUADRADOS LATINOS 2.4) Diseño a Cuadros Latinos: El diseño en bloques aleatorios es adecuado cuando una fuente de variabilidad extraña se elimina comparando un conjunto de medias muestrales. Una Característica importante de este tipo de diseño es su balance, que se logra asignando el mismo numero de observaciones a cada tratamiento de cada bloque. La misma clase de balance puede lograrse en otros tipos de diseño mas complicados, en los cuales es conveniente eliminar el efecto de varias fuentes extrañas de variabilidad. Con el fin de comparar tres tratamientos, A, B, C, en presencia de otras fuentes de variabilidad. Por ejemplo, los tres tratamientos pueden ser métodos de soldadura para conductores eléctricos, y las dos fuentes extrañas de variabilidad pueden ser diferentes operadores aplicando la soldadura y la utilización de diversos fundentes para soldar. Si tres operadores y tres fundentes para soldar. Si tres operadores y tres fundentes son considerados, el experimento podría disponerse según el patrón siguiente:
Fund.1
Fund. 2
Fund. 3
Operador1
A
B
C
Operador2
C
A
B
Operador3
B
C
A
Aquí cada método de soldadura se aplica una sola vez por cada operador junto con cada fundente, y si existiesen efectos sistemáticos debido a diferencias entre los operadores o entre los fundentes, dichos efectos estarían presentes de igual manera en cada tratamiento, esto es, en cada método de soldadura. 5x5
4x4
A
B
C
D
E
B
A
E
C
D
A
B
C
D
C
D
A
E
B
B
C
D
E
D
E
B
A
C
C
D
A
B
E
C
D
B
A
D
A
B
C
Un arreglo experimental como el que se describió se denomina cuadrado latino. Un cuadrado latino n x n es un arreglo cuadrado de n distintas, las cuales
aparecen solo una vez en cada renglón y en cada columna. Un experimento de cuadrado latino sin repetición da solo (n-1) (n-2) grados de libertad para estimar el error experimental. Así, tales experimentos son efectuados en contadas ocasiones sin repetición cuando n es pequeña, esto es, sin repetir el patrón completo de cuadrado varias veces. Modelo Estadístico Lineal
Yij = μ + Ti + Bj + rk + Eijk Yijk = valor de la i-ésima observación ubicada en la
k-ésima
columna con la j-esima fila usando el i-esimo tratamiento. μ=
Promedio General
Ti = Efecto del iésimo tratamiento Bj = Efecto de la j-ésima columna Rk = efecto de la k-esima fila Eijk = Variación de las observaciones ubicada en la k-ésima columna, con la jesima fila, usando el i-esimo tratamiento. An ális is de Varian za
Hipótesis: Ho: μ1= μ2=..... = μi H1: no todas μ’is son iguales Ho: μ1= μ2=..... = μj
H1: no todas μ’js son iguales Ho: μ1= μ2=..... = μk H1: no todas μ’ks son iguales Nivel de significación: α =
0.05 ó 0.01
Estadístico de Prueba: F1= S1²/S² ; F2= S2²/S² ; F3= S3²/S² Regla de Decisión: Si f>f α [(r -1) ; (r-2) (r-1)] se rechaza Ho
Tomar una muestra y llegar a una decisión.
Suma de Cuadrados STC = Suma total de cuadrado STC = ∑∑∑ Yijk² - Y².. r²
SCT = Suma de cuadrados de los tratamientos SCT = ∑ Yi..² - Y².. r
r²
SCF = Suma de cuadrados de las filas SCF = ∑ Y.j² - Y...² r
r²
SCC = Suma de cuadrados de las columnas SCC = ∑ Y...k² - Y...² r
r²
SCE = Suma de cuadrado del error SCE = STC- SCT- SCE - SCC
Cuadrados Medios S1²= Cuadrado medio de los tratamientos S1²= SCT
S2²= SCF
r-1
r-1
S3²= SCC r-1
S² = Cuadrado medio del error S² = SCE____ (r-2)(r-1)
Fuente
de Suma
de Grados
de Cuadros
Valor de
variación
cuadrados
libertad
Medios
F
Tratamiento
SCT
r-1
S1²
Filas
SCF
r-1
S2²
F1=S1²/S²
Bloques
SCC
r-1
S3²
F2=S2²/S²
Error
STE
(r-2)(r-1)
Total
STC
r²-1
F3=S3²/S²
2K FACTORIAL Diseño factorial de dos factores
El primer diseño de la serie 2 2 es aquel en el que solo dos factores, A y B, cada uno con dos niveles. Este diseño se conoce como diseño factorial 2 2. Arbitrariamente, los niveles del factor pueden llamarse “bajo” y “alto”.
Ejemplo 1 Considérese una investigación llevada a cabo para estudiar el efecto que tiene la concentración de un reactivo y la presencia de un catalizador sobre el tiempo de reacción de un proceso químico. Sea la concentración del reactivo el factor A con dos niveles de interés, 15% y 20%. El catalizador constituye el factor B; el nivel alto o superior denota el uso de dos sacos de catalizador y el nivel bajo o inferior denota el uso de un solo saco. El experimento se realiza (“replica o repite”) tres veces, y los datos son como sigue:
Combinación de Replica tratamientos
I
II
III Total
A baja, B baja
28 25 27 80
A alta, B baja
36 32 32 100
A baja, B alta
18 19 23 60
A alta, B alta
31 30 29 90
En la figura 4 siguiente se presentan gráficamente las combinaciones de tratamiento para este diseño, el efecto de un factor se denota por la letra latina minúscula. De este modo, “A” se refiere al efecto del factor “A”, y “B” se refiere al efecto del factor “B”, y “AB” se refiere a la interacción entre AB. En el diseño 2 2 los niveles bajo y alto de A y B se denotan por “ -“ y “+” respectivamente, en los ejes A
y B. Así – en el eje B representa el nivel bajo de catalizador mientras que + denota el nivel alto. Así
“a” representa la combinación de tratamientos, en la que A se encuentra en el nivel superior y B en el nivel inferior;
“b” representa aquella en la que A se halla en el nivel inferior y B en el superior, y
“ab” representa a ambos factores en el nivel superior.
Por convención (1) se usa para representar a ambos factores en el nivel inferior .
El efecto promedio de un factor se define como el cambio en la respuesta producida por un cambio en el nivel de ese factor, promediado sobre los niveles del otro factor .
Como se ilustra en la figura 3, las letras minúsculas (1), a, b y ab también se usan para representar los totales de las n replicas de las combinaciones de tratamientos correspondientes. Ahora bien, el efecto de A en el nivel B es {a(1)}/n. Mientras que el nivel superior B es {ab-b}/n. Tomando el promedio de estas dos cantidades se obtiene:
1
A
2n
1
ab b a (1)
ab a b (1)
2n
El efecto promedio de B se determina a partir de su efecto en el nivel inferior de A (esto es, {b-(1)}/n, y de su efecto en el nivel superior de A (que es igual a [ab-a]/n obteniéndose:
B
1 2n
ab a b (1)
El efecto de la interacción
1 2n
ab b - a (1)
AB se define como la diferencia promedio entre el
efecto de A en el nivel superior de B y su efecto en el nivel inferior de B, así:
AB
1
1
ab b a (1)
2n
ab (1) a (b)
2n
Por otro lado se puede definir AB como la diferencia promedio entre el efecto de B en el nivel superior de A y el efecto de B en el nivel inferior de A.
Las formulas para los efectos de A, B y AB pueden deducirse por otro método. El efecto de A puede hallarse como la diferencia en la respuesta promedio de las dos combinaciones de tratamiento en la mitad derecha (que llamaremos
Y A+,
puesto
que es la respuesta promedio para las combinaciones de tratamientos a las que A que se encuentra en el nivel alto) y las dos combinaciones de tratamientos en la mitad izquierda (o
Y A).
Esto es,
A Y A YA
ab a
b (1)
2n
1
2n
ab a b (1)
2n
Este es exactamente el mismo resultado, el efecto de B se encuentra como la diferencia entre el promedio de las dos combinaciones de tratamientos en la parte superior del cuadrado ( Y B+) y el promedio de las dos combinaciones de tratamientos en la parte inferior ( Y B-), o
B YB YB
ab b
a (1)
2n 1
2n
ab b a (1)
2n Finalmente el efecto de interacción AB es el promedio de las combinaciones de tratamientos en la diagonal de derecha a izquierda del cuadrado ab y (1) menos el promedio de las combinaciones de tratamientos en la diagonal de izquierda a derecha (a y b), o
AB
ab (1) 2n
ab 2n
1
ab (1) a b
2n Con los datos que aparecen
en la figura 1, las estimaciones de los efectos
promedio son:
1
A
90 100 60 80 8.33
2(3) 1
B
90 60 100 80 5.00
2(3)
AB
1
90 80 100 60 1.67
2(3)
El efecto de A (concentración de reactivo) es positivo; esto sugiere que al elevar A del nivel bajo (15%) al nivel alto (25%) incrementará el rendimiento. El efecto de B (catalizador) es negativo; esto sugiere que elevar la cantidad del catalizador agregada
al proceso reducirá el rendimiento. Al parecer, el efecto de
interacciones es pequeño comparado con los dos efectos principales. En muchos experimentos que implican diseños 2 K se examina la magnitud y la dirección de los efectos de los factores para determinar cuales variables es probable que sean importantes. Por lo general puede emplearse el análisis de varianza para confirmar esta interpretación. En el diseño 2 k existen algunos métodos rápidos especiales para realizar los cálculos del análisis de varianza.
Consideremos la suma de cuadrados para A, B y AB.
Obsérvese la primera
ecuación que se utiliza un contraste para estimar A; esto es,
ContrasteA ab a b (1) Este contraste suele llamarse efecto total de A. A partir de la segunda y tercera ecuación, puede apreciarse que también se utilizan contraste para estimar B y AB. Además, estos tres contrastes son ortogonales. La suma de cuadrados de cualquiera de ellos puede calcularse usando la siguiente ecuación:
2 a SSc 1ciyi.
a 2 na ci .
Esta ecuación establece que la suma de cuadrados de contraste es igual al contraste elevado al cuadrado entre el producto del número de las observaciones de cada total del contraste por la suma de cuadrados de los coeficientes del mismo. En consecuencia, se obtiene que las sumas de cuadrados de A, B y AB sean:
2
SS A
ab a b (1) n*4
SSB
ab b a (1)2 n*4
SS AB
ab (1) a b2 n*4
Con los datos de la figura 1, las sumas de cuadrados se pueden calcular aplicando las ecuaciones anteriores, obteniéndose:
SS A
50
2 208.33
4(3) SSB
30
2 75.00
4(3) SS AB
10
2 8.33
4(3)
La suma total de cuadrados se determina de la manera usual mediante:
2 2 2 n SST i1 j1 k 1 Y ijk
2 Y .. . 4n
En general SS T tiene 4n –1 grados de libertad. La suma de cuadrados del error, con 4(n-1) G.L. se puede calcular en la forma usual, por diferencia, mediante.
2 Y 2 SS E Yijk 9398.00 9075.00 323.00 i1 j1k 1 4(3) 2 2 3
SS E SS T SS A SS B SS AB
323.00 208.33 75.00 8.33 31.34 El análisis de varianza completo se presenta en la tabla siguiente. Ambos efectos principales son significativos al 1%.
A menudo se es conveniente escribir las combinaciones de tratamientos en el orden (1), a, b, y ab. Este orden se conoce como orden estándar. Cuando se
utiliza es posible apreciar que los coeficientes de los contrastes usados para estimar los efectos son
Efectos (1) a
b
Ab
A:
-1 +1 -1 +1
B:
-1 -1 +1 +1
AB:
+1 -1 -1 +1
Tabla ANOVA para los datos del ejemplo 3.1 es la siguiente:
Fuente de variación SS
G.L. MS
Fo
A
208.33 1
208.33 53.15a
B
75.00
1
75.00
19.13a
AB
8.33
1
8.33
2.13
Error
31.34
8
3.92
Total
323.00 11
a
significativo al 1%
Signos algebraicos para calcular los efectos en un diseño 2
2
Combinación Efecto Factorial De Tratamientos I A B AB (1)
+ - - +
a
+ + - -
b
+ - + -
ab
+ + + +
Observe que los coeficientes de los contrastes usados para estimar la interacción son iguales al producto de los coeficientes correspondientes a los dos efectos
principales. Los coeficientes de los contrastes siempre son +1 o –1 y se puede usar una tabla de signos positivos y negativos como la mostrada en la de signos algebraicos para determinar el signo apropiado de cada combinación de tratamientos. En el encabezado de las columnas de tabla y se encuentran los efectos principales (A y B), la interacción AB, e I, que representa el total el total o el promedio de todo el experimento. Se observa que la columna encabezada por I se compone de solo de signos positivos. Los renglones corresponden a las combinaciones de tratamientos.
Para encontrar un contraste con el fin de estimar cualquier efecto, simplemente se multiplican los signos de la columna apropiada de la tabla por la correspondiente combinación de tratamientos, y se suma. Por ejemplo, el contraste para estimar A es –(1) + a – b + ab, lo cual concuerda con la ecuación.
A
1
ab b a (1)
2n
1
ab a b (1)
2n
Los tipos más sencillos de diseños factoriales implican sólo dos factores o conjuntos de tratamientos. Haya “a” niveles del factor A y “b” niveles del factor B,
dispuestos en un diseño factorial; esto es, cada A repetición o réplica del experimento contiene todas las combinaciones de tratamiento ab. En general, hay n repeticiones.
BIBLIOGRAFIA http://mazinger.sisib.uchile.cl/repositorio/lb/ciencias_quimicas_y_farmaceuticas/cid e02/capitulo06/05.html http://es.scribd.com/doc/56554927/3K http://zip.rincondelvago.com/analisis-de-la-varianza