Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
UNIVERSIDAD NACIONAL AUTÓNOMA DE MÉXICO FACULTAD DE ESTUDIOS SUPERIORES “ZARAGOZA” La Metodología de Superficie de Respuesta en la Optimización de Formulaciones Farmacéuticas. Aplicación de los Diseños Box-Behnken. TESINA QUE PARA OBTENER EL TÍTULO DE QUÍMICO FARMACÉUTICO BIÓLOGO PRESENTA: JUAN DÍAZ OLIVARES Director. M. en C. Armando Cervantes Sandoval Asesora. M. en C. María José Marques Dos Santos México, D. F., 2010 UNAM – Dirección General de Bibliotecas Tesis Digitales Restricciones de uso DERECHOS RESERVADOS © PROHIBIDA SU REPRODUCCIÓN TOTAL O PARCIAL Todo el material contenido en esta tesis esta protegido por la Ley Federal del Derecho de Autor (LFDA) de los Estados Unidos Mexicanos (México). El uso de imágenes, fragmentos de videos, y demás material que sea objeto de protección de los derechos de autor, será exclusivamente para fines educativos e informativos y deberá citar la fuente donde la obtuvo mencionando el autor o autores. Cualquier uso distinto como el lucro, reproducción, edición o modificación, será perseguido y sancionado por el respectivo titular de los Derechos de Autor. TABLA DE CONTENIDO I. RESUMEN………………………………………………………………… 1 II. INTRODUCCIÓN………………………………………………………… 2 III. PLANTEAMIENTO DEL PROBLEMA………………………………… 3 IV. JUSTIFICACIÓN…………………………………………………………. 3 V. OBJETIVOS……………………………………………………………… 4 VI. MARCO TEÓRICO………………………………………………………. 5 A. FUNDAMENTOS DE LA METODOLOGÍA DE SUPERFICIE DE RESPUESTA…………………………………………………………. 5 B. GRAFICAS DE SUPERFICIE DE RESPUESTA…………………. 5 C. MODELOS POLINOMIALES APROXIMADOS A LA RESPUESTA REAL…………………………………………………. 7 D. METODOS PARA DETERMINAR PUNTOS ÓPTIMOS EN UNA SUPERFICIE DE RESPUESTA…………………………. 8 1 Naturaleza del problema……………………………………….. 8 2 Método del factor único………………………………………... 10 3 Método del ascenso más pronunciado……………………… 11 4 Localización del punto estacionario………………………… 13 5 Caracterización de la superficie de respuesta mediante el análisis canónico…………………………………………….. 13 6 Respuestas múltiples…………………………………………... 14 7 Análisis Ridge…………………………………………………… 15 E. DISEÑOS EXPERIMENTALES PARA AJUSTAR SUPERFICIES DE RESPUESTA………………………………….. 16 1 Diseños para ajustar el modelo de primer orden…………. 17 1.1 Diseños Ortogonales…………………………………………. 17 1.2 Diseños Simplex…………………………………………….... 17 1.2.1 Estudio de los sesgos en un diseño Simplex……… 18 2 Diseños para ajustar el modelo de segundo orden………. 19 2.1Diseños Factoriales 3k……………………………........ 19 2.2 Diseños Compuestos Centrales (DCC)……………………. 20 2.3 El DCC esférico……………………………………………….. 21 2.4 DCC con centros en las caras………………………………. 21 2.5 Otros diseños…………………………………………………. 22 3 Diseños Box-Behnken…………………………………………. 22 VII. EJEMPLOS DE APLICACIÓN………………………………………….. 27 A. EVALUACIÓN Y OPTIMIZACIÓN DE UNA FORMULACIÓN DE MICROESFERAS QUE CONTIENEN β-ESTRADIOL BIODEGRADABLE…………………………………………………... 27 1 Planteamiento del problema…………………………………... 27 2 Resultados en statgraphics…………………………………... 29 2.1 Eficiencia de encapsulación (Y1)…………………………… 29 2.2 Porciento acumulado de fármaco liberado (Y2)………….. 35 2.3 Porciento de producción de microesferas (Y3)…….......... 40 2.4 Optimización de la formulación analizando de manera simultánea las tres variables de respuesta (Y1, Y2 y Y3)…. 46 3 Discusión…………………………………………………………. 49 B. OPTIMIZACIÓN DE UNA FORMULACIÓN QUE CONTIENE MICROESFERAS DE LIBERACIÓN SOSTENIDA DE DICLOFENACO…………………………………………………........ 50 1 Planteamiento del problema…………………………………... 50 2 Resultados en statgraphics………………………………….... 51 2.1 Porciento de fármaco liberado a las 3 horas (Y1)………… 52 2.2 Porciento de fármaco liberado a las 4 horas (Y2)………… 54 2.3 Porciento de fármaco liberado a las 6 horas (Y3) 57 2.4 Optimización de la formulación analizando de manera simultánea las tres variables de respuesta (Y1, Y2 y Y3)….. 60 3 Discusión………………………………………………………….. 63 VIII. GUÍA DE USUARIO DEL SOFTWARE ESTADÍSTICO STATGRAPHICS VERSIÓN 5.0 PLUS, PARA ANÁLISIS DE SUPERFICIE DE RESPUESTA. DISEÑOS BOX-BEHNKEN………. 64 IX. CONCLUSIONES………………………………………………………… 79 X. REFERENCIAS…………………………………………………………… 81 ÍNDICE DE FIGURAS Figura 1 Gráfico de superficie de respuesta tridimensional………………………. 6 Figura 2 Gráfica de contorno combinada con una superficie de respuesta…….. 6 Figura 3 Búsqueda del punto óptimo en una gráfica de contornos………………. 9 Figura 4 Superficie de respuesta de primer orden y trayectoria del ascenso más pronunciado…………………………………………………………….. 12 Figura 5 Forma canónica del modelo de segundo orden…………………………. 14 Figura 6 Círculos concéntricos del análisis Ridge en los cuales se localizan valores máximos de la respuesta………………………………………….. 15 Figura 7 El diseño simplex para a) k = 2 variables y b) k = 3 variables…………. 18 Figura 8 Diseños centrales compuestos para a) k = 2 y b) k = 3 factores………. 21 Figura 9 Cubo del Diseño Box-Behnken para k = 3……………………………….. 23 Figura 10 Gráfico de residuales para Y1 (eficiencia de encapsulación)…………... 29 Figura 11 Gráfico de superficie de respuesta para Y1 con X3 constante…………. 31 Figura 12 Gráfico de contornos para Y1 con X3 constante…………………………. 32 Figura 13 Gráfico de superficie de respuesta para Y1 con X2 constante...……….. 32 Figura 14 Gráfico de contornos para Y1 con X2 constante…………………………. 33 Figura 15 Gráfico de superficie de respuesta para Y1 con X1 constante………….. 33 Figura 16 Gráfico de contornos para Y1 con X1 constante…………………………. 34 Figura 17 Gráfico de residuales para Y2 (Fármaco liberado acumulado)………… 35 Figura 18 Gráfico de superficie de respuesta para Y2 con X3 constante……….... 37 Figura 19 Gráfico de contornos para Y2 con X3 constante…………………………. 37 Figura 20 Gráfico de superficie de respuesta para Y2 con X2 constante………..... 38 Figura 21 Gráfico de contornos para Y2 con X2 constante…………………………. 38 Figura 22 Gráfico de superficie de respuesta para Y2 con X1 constante………….. 39 Figura 23 Gráfico de contornos para Y2 con X1 constante…………………………. 39 Figura 24 Gráfico de residuales para Y3 (producción de microesferas)………….. 41 Figura 25 Gráfico de superficie de respuesta para Y3 con X3 constante ………… 42 Figura 26 Gráfico de contornos para Y3 con X3 constante…………………………. 43 Figura 27 Gráfico de superficie de respuesta para Y3 con X2 constante………….. 43 Figura 28 Gráfico de contornos para Y3 con X2 constante…………………………. 44 Figura 29 Gráfico de superficie de respuesta para Y3 con X1 constante……….... 44 Figura 30 Gráfico de contornos para Y3 con X1 constante………………………… 45 Figura 31 Gráfico de superficie de respuesta para deseabilidad………………….. 47 Figura 32 Gráfico de contornos para deseabilidad………………………………….. 48 Figura 33 Gráfico superpuesto de las tres variables para microesferas de - estradiol biodegradable…………………………………………………….. 48 Figura 34 Gráfico de residuales para % de fármaco liberado a las 3 horas (Y1).... 52 Figura 35 Gráfico de superficie de respuesta para el % de fármaco liberado a las 3 horas…………………………………………………………………… 53 Figura 36 Gráfico contornos para el % de fármaco liberado a las 3 horas………. 54 Figura 37 Gráfico de residuales para % de fármaco liberado a las 4 horas (Y2).... 55 Figura 38 Grafico de superficie de respuesta para el % defármaco liberado a las 4 horas…………………………………………………………………… 56 Figura 39 Grafico de contorno para el % de fármaco liberado a las 4 horas……. 57 Figura 40 Gráfico de residuales para % de fármaco liberado a las 6 horas (Y3).... 58 Figura 41 Grafico de superficie de respuesta para el % de fármaco liberado a las 6 horas…………………………………………………………………… 59 Figura 42 Grafico de contorno para el % de fármaco liberado a las 6 horas……. 59 Figura 43 Gráfico de superficie de respuesta para deseabilidad……………......... 61 Figura 44 Gráfico de contornos para la función de deseabilidad…………………. 62 Figura 45 Gráfico superpuesto de las tres variables de respuesta…………......... 62 ÍNDICE DE TABLAS Tabla 1 Incremento del número de experimentos a medida que aumenta el número de factores…………………………………………………………... 20 Tabla 2 Diseño de bloques incompleto con tres tratamientos y tres bloques…... 22 Tabla 3 Diseño Box – Behnken para k = 3………………………………………… 23 Tabla 4 Diseño Box-Behnken para 4 factores…………………………………….. 25 Tabla 5 Diseño Box-Behnken para 5 factores…………………………………….. 26 Tabla 6 Variables en el diseño Box-Behnken para microesferas de -estradiol biodegradable………………………………………………………………… 28 Tabla 7 Respuestas observadas para el diseño Box-Behnken para microesferas de -estradiol biodegradable……………………………….. 28 Tabla 8 Análisis de Varianza para eficiencia de encapsulación (Y1)…………….. 29 Tabla 9 Estimación de resultados para eficiencia de encapsulación (Y1) a Partir de la ecuación del modelo encontrado…………………………...... 30 Tabla 10 Ruta del ascenso (o descenso) más pronunciado para eficiencia de encapsulación (Y1)…………………………………………………………… 31 Tabla 11 Respuesta optimizada de eficiencia de encapsulación (Y1)…………….. 34 Tabla 12 Análisis de Varianza para fármaco liberado acumulado (Y2)……………. 35 Tabla 13 Estimación de resultados para fármaco liberado acumulado (Y2) a partir de la ecuación del modelo encontrado……………………………… 36 Tabla 14 Ruta del ascenso (o descenso) más pronunciado para fármaco liberado acumulado (Y2)…………………………………………………….. 36 Tabla 15 Respuesta optimizada para fármaco liberado acumulado (Y2)………… 40 Tabla 16 Análisis de Varianza para producción de microesferas (Y3)…………… 40 Tabla 17 Estimación de resultados para producción de microesferas (Y3) a partir de la ecuación del modelo encontrado…………………………….. 41 Tabla 18 Ruta del ascenso (o descenso) más pronunciado para producción de microesferas (Y3)……………………………………………………………. 42 Tabla 19 Respuesta optimizada para producción de microesferas (Y3)…………. 45 Tabla 20 Optimización de respuestas múltiples para microesferas de - estradiol biodegradable…………………………………………………….. 46 Tabla 21 Optimización de la deseabilidad para microesferas de -estradiol biodegradable………………………………………………………………… 47 Tabla 22 Variables en el diseño Box-Behnken para microesferas de liberación sostenida de diclofenaco……………………………………………………. 50 Tabla 23 Variables en el diseño Box-Behnken para microesferas de liberación sostenida de diclofenaco…………………………………………………… 51 Tabla 24 Análisis de varianza para % de Fármaco liberado a las 3 horas (Y1)….. 52 Tabla 25 Respuesta optimizada para % fármaco liberado a las 3 horas (Y1)……. 53 Tabla 26 Análisis de varianza para % de Fármaco liberado a las 4 horas (Y2)….. 54 Tabla 27 Respuesta optimizada para % fármaco liberado a las 4 horas (Y2)……. 55 Tabla 28 Análisis de varianza para % de Fármaco liberado a las 6 horas (Y3)….. 57 Tabla 29 Respuesta optimizada para % fármaco liberado a las 6 horas (Y3)……. 58 Tabla 30 Optimización de respuestas múltiples para la formulación de microesferas de diclofenaco de liberación sostenida ……………………. 60 Tabla 31 Optimización de la deseabilidad para la formulación de microesferas de diclofenaco de liberación sostenida ……………………………………. 61 1 I. RESUMEN Los diseños Box-Behnken son una herramienta estadística eficiente, basados en la Metodología de superficie de Respuesta, usados para la optimización en el Desarrollo Farmacéutico. Estos diseños son adecuados para la exploración de superficies de respuesta cuadráticas y para la elaboración de un modelo polinomial de segundo orden así como facilitar la optimización de un proceso utilizando un número pequeño de experimentos. La aplicación de esta técnica es limitada en el área farmacéutica, debido a la escasa difusión de sus fundamentos, aplicaciones y ventajas. El presente trabajo contiene la información teórica necesaria, que abarca aspectos como: fundamentos de la metodología de superficie de respuesta, fundamentos de los diseños Box-Behnken, así como ejemplos experimentales para optimizar formulaciones farmacéuticas en donde se visualiza la aplicación de estos diseños, la manera de trabajarlos en el paquete estadístico Statgraphics Versión 5.0 Plus y como interpretar los resultados obtenidos. De acuerdo con los resultados obtenidos podemos concluir que los diseños Box- Behnken son una técnica estadística de bastante utilidad en la industria farmacéutica en particular en la optimización de formulaciones dentro del desarrollo farmacéutico. 2 II. INTRODUCCIÓN En años recientes las herramientas estadísticas se han utilizado más frecuentemente en la industria farmacéutica en diferentes áreas como son: control de calidad; pruebas de estabilidad; validación y desarrollo de métodos analíticos; protocolos de diseños preclínicos; validación de procesos y desarrollo farmacéutico, siendo este último el de mayor interés en el presente trabajo. La tendencia actual por optimizar los recursos con que se cuenta en la industria y en la obtención de productos innovadores y de calidad que cumplan con los lineamientos establecidos en la normatividad nacional, hace importante conocer la existencia de herramientas que apoyen en la localización de la mejor respuesta a las variables estudiadas, de una forma segura, rápida y con el menor número de experimentos. El análisis de un proceso o sistema a menudo apunta a la relación que existe entre la variable o variables de respuesta y los factores o variables independientes involucrados. Si los factores involucrados son cuantitativos y mínimos la Metodología de Superficie de Respuesta es una herramienta efectiva para analizar la relación que existe entre ellos. Una estrategia de experimentación secuencial es considerada, la cual facilita una investigación eficiente de los factores a considerar en todo el espacio a analizar, es decir, usando experimentos de primer orden seguidos por experimentos de segundo orden. El análisis de un experimento de segundo orden puede ser realizado mediante aproximación de la relación que existe entre la superficie de respuesta con el modelo de regresión de segundo orden encontrado. Los diseños que permiten que los modelos de segundo orden sean estimados de forma eficiente son considerados en la optimización de formulaciones farmacéuticas, tales como los Diseños Box-Behnken con los cuales se puede realizar un análisis de cada variable de respuesta por separado y un análisis simultáneo de las variables de respuesta estudiadas. Los diseños Box-Behnken son parte de la Metodología de Superficie de Respuesta que se utiliza con escasa frecuencia en nuestro país, debido probablemente a que es poco conocida y porque su análisis era muy complejo, facilitándose actualmente con el uso de paquetes estadísticos, haciendo de estetipo de diseños una herramienta muy eficiente en la optimización de formulaciones dentro de la industria farmacéutica. 3 I. PLANTEAMIENTO DEL PROBLEMA Actualmente en nuestro país herramientas estadísticas que utilizan la Metodología de Superficie de Respuesta como son los Diseños Box-Behnken son utilizados con escasa frecuencia tanto en el sector industrial como a nivel académico, debido probablemente a que es poco conocida y porque su análisis sin ayuda de paquetes estadísticos es muy complejo. Debido a la importancia actual por optimizar los recursos con que se cuenta en la industria y en la obtención de productos innovadores y de calidad que cumplan con los lineamientos establecidos en la normatividad nacional, es importante conocer la existencia de herramientas de este tipo que nos apoyen en la localización de la mejor respuesta a las variables estudiadas de una forma rápida y con el menor número de experimentos. II. JUSTIFICACIÓN En el presente trabajo se desarrollará una propuesta para aplicar los diseños Box- Behnken a la investigación farmacéutica. Mostrando a los profesionistas de esta área una manera sencilla y accesible de conocer y aplicar esta herramienta, enfatizando en la interpretación de resultados que genera el software de análisis estadístico Statgraphics Versión 5.0 Plus. Con lo que se pretende difundir este tipo de diseños y promover su aplicación. 4 I. OBJETIVOS Objetivo General Desarrollar una propuesta metodológica, para mostrar el potencial de aplicación de los diseños Box-Behnken en la optimización de formulaciones dentro del desarrollo farmacéutico. Objetivos Particulares Conjuntar y describir los elementos teóricos de la Metodología de Superficie de Respuesta. Describir los fundamentos, ventajas y limitaciones de los Diseños Box- Behnken. Mostrar la aplicación de los Diseños Box – Behnken, mediante ejemplos reales, en la optimización de formulaciones farmacéuticas. Elaborar una guía de usuario para realizar el procedimiento de captura y análisis de datos, así como la interpretación de resultados para los Diseños Box – Behnken, utilizando el software estadístico Statgraphics Versión 5.0 Plus. 5 I. MARCO TEÓRICO A. FUNDAMENTOS DE LA METODOLOGÍA DE SUPERFICIE DE RESPUESTA La metodología de superficie de respuesta (MSR) es la alternativa más adecuada en el modelado y el análisis de problemas en los que una respuesta de interés recibe la influencia de diversas variables y donde el objetivo es optimizar esta respuesta(1, 2). La MSR está conformada por un conjunto de herramientas estadísticas y matemáticas que se aplican de acuerdo con las siguientes etapas: 1. Diseño y recopilación de datos experimentales, los cuales se usan en la determinación de una ecuación que se emplea para hacer predicciones. 2. Aplicación de las técnicas de regresión lineal múltiple para obtener la mejor ecuación que represente el comportamiento de los datos. 3. Análisis de la superficie ajustada mediante gráficas de contorno y otras técnicas matemáticas y numéricas (3). Dentro de estas herramientas, los diseños experimentales tienen la ventaja de explorar la relación entre los factores y la variable dependiente en toda la región experimental, y no solamente en las fronteras. B. GRÁFICAS DE SUPERFICIE DE RESPUESTA La superficie de respuesta permite que el investigador inspeccione de manera visual, la respuesta para cierta zona de los niveles de los factores de interés y evaluar su sensibilidad a los factores de tratamiento. En ciertas aplicaciones industriales, las superficies de respuesta se exploran para determinar la combinación de niveles de los factores que proporcionan una condición operativa óptima, como en la combinación de temperatura-tiempo que maximizan la producción química. En otras aplicaciones, se exploran para encontrar la combinación de niveles de los factores que proporcionan mejoras económicas a las respuestas de las condiciones operativas urgentes, si no es demasiado costoso lograr esas condiciones óptimas. Por lo general, se evalúa a Y como una función de las variables independientes, es decir, Y = f(X1, X2,…, Xk) + ε, donde ε representa el error observado en la respuesta. Si la respuesta esperada se denota por E(Y) = f(X1, X2,…, Xk) entonces la superficie representada por η = f(X1, X2,…, Xk) se denomina superficie de respuesta. La representación gráfica de la respuesta es posible, por ejemplo, para un problema en el cual se desea maximizar el rendimiento Y de un proceso que está determinado por dos factores X1 (Temperatura) y X2 (Presión) obtenemos la figura 1 donde la respuesta Y que es el rendimiento esperado (η) se representa como una superficie sólida en un espacio tridimensional. 6 Figura 1 Gráfica de superficie de respuesta tridimensional. Con el propósito de visualizar mejor la forma de una superficie de respuesta con frecuencia se grafican los contornos de dicha superficie en forma bidimensional: en la cual se trazan líneas de respuesta en el plano X1, X2. cada contorno corresponde a una altura específica de la superficie de respuesta. La gráfica de contornos es útil para estudiar los niveles de X1 y X2 que dan por resultado cambios en la forma o altura de la superficie, y por lo tanto con este tipo de gráficas se facilita la interpretación de las relaciones cuando existen dos o más factores, figura 2 (1, 4). Figura 2 Gráfica de contornos combinada con una superficie de respuesta. Rendimiento (%) 86.5 87.0 87.5 88.0 88.5 89.0 89.5 90.0 90.5 Temperatura °C Presión (psi) R en d im ie n to (% ) 80 84 88 92 96 100 200 205 210 215 220 225 230 86 87 88 89 90 91 Temperatura °C Presión (psi) R en d im ie n to ( % ) 80 84 88 92 96 100 200 205 210 215 220 225 230 86 87 88 89 90 91 7 C. MODELOS POLINOMIALES APROXIMADOS A LA RESPUESTA REAL En la mayoría de los problemas de MSR, la forma de la relación entre la respuesta y las variables independientes se desconoce. Por lo tanto, el primer paso de la MSR es encontrar una aproximación adecuada de la verdadera relación funcional entre Y y el conjunto de variables independientes. Por lo general se emplea un polinomio de orden inferior en alguna región de las variables independientes. Si la repuesta está bien modelada por una función lineal de las variables independientes, entonces la función de aproximación es el modelo de primer orden. Y = β0 + β1X1 + β2X2 + … +βkXk + Si hay una curvatura en el sistema, entonces debe usarse un polinomio de orden superior, tal como el modelo de segundo orden. k k Y= β0 + ∑ βiXi + ∑ βiiX 2 ,i+∑ ∑ βijXiXj + i=1 i=1 i < j En casi todos los problemas de MSR se usa uno de estos modelos, o ambos. Desde luego, es probable que un modelo polinomial sólo sea una aproximación razonable de la verdadera relación funcional en el espacio completo de las variables independientes, pero para una región relativamente pequeña suelen funcionar bastante bien. La MSR es un procedimiento secuencial. Muchas veces, cuando se está en un punto de la superficie de respuesta alejado del óptimo, el sistema presenta una curvatura moderada y el modelo de primer orden será apropiado. El objetivo en este caso es llevar al experimentador de manera rápida y eficiente por la trayectoria del mejoramiento hasta la vecindad general del óptimo. Una vez que se ha encontrado la región del óptimo, puede emplearse unmodelo más elaborado, como el de segundo orden, y llevar a cabo un análisis para localizar el óptimo. Para estimar los parámetros de los polinomios de aproximación se utiliza el método de mínimos cuadrados. Después se realiza el análisis de la superficie de respuesta utilizando la superficie ajustada, siempre y cuando la superficie ajustada sea un equivalente aproximado del análisis del sistema real. Los parámetros del modelo pueden estimarse de manera más eficiente cuando se emplean los diseños experimentales apropiados para recolectar los datos. Los diseños para ajustar superficies de respuesta se denominan diseños de superficie de respuesta. El objetivo último de la MSR es determinar las condiciones de operación óptimas del sistema o determinar una región del espacio de los factores en la que se satisfagan los requerimientos de operación (1, 4). 8 D. MÉTODOS PARA DETERMINAR PUNTOS ÓPTIMOS EN UNA SUPERFICIE DE RESPUESTA 1 Naturaleza del problema Se supone que una respuesta Y está afectada por un número de factores cuantitativos X1, X2, …, Xk. Se lleva a cabo un programa experimental para descubrir el nivel al cual cada uno de estos factores debe ser establecido para llevar al óptimo la respuesta. Este problema es común en trabajos de investigación y desarrollo en la industria donde el investigador está buscando los medios de manufacturar un producto nuevo con ciertas características deseables u obtener un producto de manera más económica. La respuesta puede ser la cantidad real de producto o una medida de la cantidad del mismo. En ocasiones, el objetivo es minimizar Y, como cuando Y representa la cantidad de un subproducto no deseado o el costo de manufactura por unidad de producción. Localizar el mínimo no requiere explicación separada, ya que un cambio en el signo de la respuesta lo transforma en uno de maximización. Además de localizar el máximo de Y, es valioso aprender algo de cómo varía Y en la vecindad del máximo, cuando los niveles de los factores se cambian de sus valores óptimos. Esto es por varias razones. i) En aplicación a gran escala de los resultados puede no ser factible establecer cada factor exactamente a su nivel óptimo. Alguna combinación de niveles diferente del óptimo puede ser más económica de mantener. ii) Frecuentemente, más de una característica del producto es importante. Un cambio en la Xi, alejándola del óptimo, puede ser preferible a causa de su efecto sobre una de estas otras características. iii) La forma de la superficie de respuesta cerca del óptimo puede dar indicios de la naturaleza del proceso. iv) La superficie puede carecer de un máximo verdadero en la región experimental (o en la región en la cual el proceso se está llevando a cabo en la práctica). En este caso, se desea conocer la naturaleza de la superficie en zonas de respuesta relativamente altas. Existen varios procedimientos para determinar las condiciones bajo las cuales obtendremos el mejor valor de respuesta, es decir, las condiciones óptimas. En aplicaciones prácticas, cada método requiere de un considerable criterio por parte del investigador y los métodos no pueden presentarse como un conjunto de reglas inflexibles. 9 Al final, el experimentador debe decidir sobre los factores que se deben incluir en el programa. Los métodos por describir se han aplicado, en su mayor parte, para un número de factores entre 2 y 6, y no son aplicables para mayor número de ellos. Se aconseja una depuración preliminar de factores que probablemente sean de menor importancia. Debe seleccionarse también el intervalo dentro del cual varía el nivel de cada factor (1, 5) . Los pasos a seguir en la localización de las condiciones óptimas son: 1. Identificar las variables que presentan mayor influencia en la respuesta, generalmente son pocas y se identifican con facilidad. 2. Expresar la respuesta de interés como una función de las variables, para lo cual usualmente se utiliza un modelo polinomial de primer orden, este modelo dará las bases para realizar las pruebas iniciales, y también hará posible modelar los valores del área de respuesta estimada sobre la región experimental, dicha representación tomará la forma de una gráfica de contorno del área estimada (figura 3), dentro de esta gráfica las líneas de contorno son establecidas mediante la conexión de dos ejes (X1 y X2) en la región experimental que produce los mismo valores de Y. Temperatura (°C) P re si ó n ( p si ) Rendim ie nto (%) 76.0 76.5 77.0 77.5 78.0 78.5 79.0 79.5 80.0 80.5 80 82 84 86 88 90 17 0 17 2 17 4 17 6 17 8 18 0 Figura 3 Búsqueda del punto óptimo en una gráfica de contornos. 10 2 Método del factor único En este método el experimentador hace primero una estimación preliminar de la combinación óptima de niveles del factor, la cual se identificará por X11, X21, …, Xk1 ya que cada experimento trata con un factor único, los factores deben arreglarse por el orden en el cual van a ser probados. En general, un buen plan es principiar con el factor que se espera que dé la mayor respuesta. En el primer experimento, todos los factores excepto el primero, se mantienen constantes a sus niveles iníciales X21, X31, …, Xk1. El propósito de este experimento es encontrar el nivel de X1, el cual maximiza Y para esta combinación particular de niveles de los otros factores. Hay varias formas como puede llevarse acabo el experimento. Para establecer un máximo, deben compararse cuando menos tres niveles de X1. Son aconsejables 4 ó 5 niveles, si el rango de X1 es amplio y la posición de su óptimo casi no se conoce o quizá un experimento inicial con 5 niveles, ampliamente espaciados, seguidos de un segundo experimento con tres niveles a un espaciamiento estrecho. Se ha demostrado que el igual espaciamiento de los niveles no es, en general, el procedimiento más eficiente para localizar el óptimo. Para experimentos con tres niveles se ha llevado a cabo el espaciamiento más eficiente en situaciones donde la posición del óptimo X1, por anticipado está bien determinada. Cuando está claro que los puntos experimentales no definen un máximo de Y, tal posición puede ser estimada ajustando una parábola a las respuestas observadas. Si la ecuación de la parábola ajustada es: Y= β0 + β1X1+ β2X 2 ,1 (3) con β2 negativo, se sabe por el cálculo que el óptimo X1 es: X12 = -βi /(2 β2) (4) En ocasiones, el valor de X1 que da la mayor Y observada está suficientemente cercano al óptimo estimado. El óptimo estimado se identifica por X12. En el segundo experimento, X1 se fija al nivel X12 y los valores de X3 …, Xk permanecen fijos a sus niveles iníciales. Varios niveles del segundo factor se comparan para encontrar el nivel óptimo de X2. El tercer experimento trata a X3 de la misma manera; los otros factores se mantienen a los niveles X12, X22, X41, …, Xk1, respectivamente. El proceso se continúa hasta que se ha estimado un óptimo para los k factores. Esto finaliza la primera etapa de experimentos: la combinación de factores óptima estimada hasta este momento es el conjunto de niveles X12, X22, …, Xk2. Si este nuevo conjunto de niveles es parecido al conjunto inicial X11, X21, …, Xk1; y si los 11 valores de Y han mejorado poco durante la primera etapa, el investigador puede tomar la decisión de terminar los experimentos, dando por cierto que no es posible una ganancia apreciable en la estimación inicial del óptimo. Si han ocurrido cambios más considerables, entra en una segunda etapa el proceso integro, principiándose con niveles fijos X22, X32, …, Xk2 y probando varios niveles de X1 para determinar si la posición del óptimo ha cambiadodel nivel X12. Al final de esta etapa, se ha obtenido un nuevo conjunto de estimaciones X13, X23, …, Xk3, entonces el experimentador estudia la situación otra vez y decide sobre si la lleva a término o continúa con una tercera etapa. Al principio de la tercera etapa, todas las variables X se cambian simultáneamente: el cambio en Xi es proporcional a (Xi3 — Xi2). Esta sugerencia se asemeja al método del ascenso más pronunciado que se describe a continuación. Puede tomarse la decisión de omitir algunos de los factores en etapas posteriores sobre la base de que no han demostrado efectos en las primeras etapas. Este método no da una estimación de la forma de la curva de respuesta. Cuando el proceso ha terminado, será aconsejable hacer experimentos adicionales para este propósito (5). 3 Método del ascenso más pronunciado El método del ascenso más pronunciado es un procedimiento para moverse secuencialmente sobre la trayectoria del ascenso más pronunciado, es decir, en la dirección del incremento máximo de la respuesta. Desde luego, si lo que se pretende es una minimización, entonces esta técnica se llama método del descenso más pronunciado. El modelo ajustado de primer orden es ٨ k ٨ Ŷ= β0 + ∑ βiXi (5) i=1 y la superficie de respuesta de primer orden, es decir, los contornos de Ŷ, es una serie de líneas paralelas como las que se muestran en la figura (4). 12 Figura 4 Superficie de respuesta de primer orden y trayectoria del ascenso más pronunciado. La dirección del ascenso más pronunciado es aquella en la que Ŷ se incrementa con mayor rapidez. Esta dirección es paralela a la normal de la superficie de respuesta ajustada. Por lo general se toma como la trayectoria del ascenso más pronunciado a la recta que pasa por el centro de la región de interés y que es normal a la superficie ajustada. Por lo tanto, los pasos sobre la trayectoria son proporcionales a los coeficientes de regresión {β} El tamaño real del paso lo determina el experimentador con base en el conocimiento del proceso o de otras consideraciones prácticas. Se conducen experimentos sobre la trayectoria del ascenso más pronunciado hasta que deja de observarse un incremento adicional en la respuesta. Entonces se puede ajustar un nuevo modelo de primer orden, determinar una nueva trayectoria del ascenso más pronunciado y el procedimiento continúa. En última instancia, el experimentador llegará a la vecindad del óptimo, en general, la falta de ajuste del modelo de primer orden indica que se ha llegado a ella, en este momento se realizan experimentos adicionales para obtener una estimación más precisa del óptimo (1, 4, 5). Trayectoria del ascenso más pronunciado Región de la superficie de respuesta de primer orden ajustada ŷ = 10 ŷ = 20 ŷ = 30 ŷ = 50 ŷ = 40 X2 X1 13 4 Localización del punto estacionario Una región estacionaria es definida como una región donde la inclinación del área, o los gradientes a lo largo de los ejes de las variables, es menor comparada con el estimado, del error experimental. El punto estacionario de una región estacionaria es el punto en el cual la inclinación del área de respuesta es cero cuando es tomada en todas direcciones. Suponiendo que se desea determinar los niveles de X1, X2, …, Xk que optimizan la respuesta predicha. Este punto, en caso de existir, será el conjunto de las X1, X2, …, Xk para las que las derivadas parciales ∂Ŷ / ∂X1 = ∂Ŷ/ ∂X2 = … = ∂Ŷ / ∂Xk = 0. a este punto se le llama punto estacionario. El punto estacionario podría representar: Un punto de respuesta mínima Un punto de respuesta máxima O un punto silla (1). 5 Caracterización de la superficie de respuesta mediante el análisis canónico Una vez que se ha encontrado el punto estacionario generalmente es necesario caracterizar la superficie de respuesta en la vecindad de este punto, es decir, determinar si el punto estacionario es el punto de una respuesta máxima, mínima o un punto silla. Por lo general también se desea estudiar la sensibilidad relativa de la respuesta a las variables X1, X2, …, Xk. La forma más directa de hacer esto es examinando una gráfica de contorno del modelo ajustado. Si sólo hay dos o tres variables en el proceso (las X), la construcción e interpretación de esta gráfica de contorno es relativamente sencilla. Sin embargo, incluso cuando hay un número relativamente reducido de variables, un análisis más formal, llamado análisis canónico es utilizado. Es conveniente transformar primero el modelo en un nuevo sistema de coordenadas con el origen en el punto estacionario X, y después hacer la rotación de los ejes de este sistema hasta que sean paralelos a los ejes principales de la superficie de respuesta ajustada. Esta transformación se ilustra en la figura (5). 14 Figura 5 Forma canónica del modelo de segundo orden Puede demostrarse que se obtiene así el modelo ajustado. Ŷ = Ŷ0 + λ1W 2 ,1 + λ2 W 2 ,2 + … + λk W 2 ,k (6) donde las [W i] son las variables independientes transformadas y las [λi] son constantes. La naturaleza de la superficie de respuesta se puede determinar a partir del punto estacionario, del signo y de la magnitud de [λ i]. Suponiendo que el punto estacionario está dentro de la región de exploración para ajustar el modelo de segundo orden. Si todas las λ son positivas, entonces X0 es un punto de respuesta mínima, si todas las λ son negativas, entonces X0 es un punto de respuesta máxima y si las λ tienen distintos signos entonces X0 corresponde a un punto silla (1, 4). 6 Respuestas múltiples Existen problemas de superficie de respuesta que incluyen el análisis de varias respuestas. La evaluación simultánea de respuestas múltiples requiere construir primero un modelo de superficie de respuesta apropiado para cada respuesta y después intentar encontrar un conjunto de condiciones de operación que optimice en cierto sentido todas las respuesta o que al menos las mantenga en los rangos deseados. 80 75 70 W2 W1 X2,0 X1,0 X1 X2 15 Un enfoque relativamente directo para optimizar varias respuestas que funciona bien cuando sólo hay pocas variables en el proceso es la superposición de las gráficas de contorno de cada respuesta. El experimentador puede hacer el examen visual de la gráfica de contorno para determinar las condiciones de operación apropiadas. Cuando hay más de tres variable en el diseño, se hace muy complicada la superposición de las gráficas de contorno, ya que la gráfica de contorno es bidimensional y k-2 de las variables del diseño deben mantenerse constantes para construir la gráfica. Con frecuencia se necesita una gran cantidad de ensayo y error para determinar cuáles son los factores que deben mantenerse constantes y qué niveles seleccionar para obtener la mejor vista de la superficie. Por lo tanto, existe interés práctico en métodos de optimización más formales para las respuestas múltiples (1). 7 Análisis Ridge Durante el análisis del área de respuesta ajustada se podría descubrir que el punto estacionario no está dentro de la región experimental, pero si se sospecha que el valor óptimo de la respuesta se encuentra en los bordes de la región experimental, es posible utilizar el análisis Ridge para localizar este punto. En general el análisis Ridge se utiliza para encontrar un valor máximo absoluto (o un mínimo) de la respuesta estimada de Ŷ en esferas concéntricas de radio variante, RL (L = 1, 2, …, k) los cuales son centrados en ( X1, X2, …, Xk) = (0,0, …, 0) y contenidos dentro de la región experimental. Lo anterior se muestra en la figura (6) donde los tres círculos se trazan con diferente radio. X1 X2 16 Figura 6 Círculos concéntricos del análisis Ridge en los cuales se localizan valores máximos de la respuesta. Asumiendo que el modelo ajustado sobre la región de las k variables codificadas X1, X2, …, Xk es de segundo orden y suponiendo además que el punto estacionario está en los bordes de una esfera de radio R, se restringirá el examen a encontrar las coordenadas de las variables que maximicen y sujetas a la condición: k ∑ X 2 ,i = R 2 (7) i =1 Una vez encontradas esas coordenadas para un valor particular de R, se podría cambiar el valor de R y repetir el procedimiento para varios valores elegidos de R y hacer una gráfica con las apropiadas coordenadas en X1, X2, …, Xk contra Ŷ; esto generaría gráficas de valores de Ŷ para varias distancias del punto central (1, 6). E. DISEÑOS EXPERIMENTALES PARA AJUSTAR SUPERFICIES DE RESPUESTA El ajuste y análisis de superficies de respuesta se facilita en gran medida con la elección apropiada del diseño experimental, algunas de las características deseables en el diseño son las siguientes: 1. Proporcionar una distribución razonable de los puntos de los datos (y en consecuencia información) en toda la región de interés. 2. Permitir que se investigue la adecuación del modelo, incluyendo la falta de ajuste. 3. Permitir que los experimentos se realicen en bloques. 4. Permitir que los diseños de orden superior se construyan secuencialmente. 5. Proporcionar una estimación interna del error. 6. Proporcionar estimaciones precisas de los coeficientes del modelo. 7. Proporcionar un buen perfil de la varianza de predicción en toda la región experimental. 8. Proporcionar una robustez razonable contra los puntos atípicos o los valores faltantes. 9. No requerir de un gran número de corridas. 10. No requerir de demasiados niveles de las variables independientes. 11. Asegurar la simplicidad en el cálculo de los parámetros del modelo (1). 17 1 Diseños para ajustar el modelo de primer orden 1.1 Diseños Ortogonales Suponiendo que se quiere ajustar el modelo de primer orden en k variables k Y = β0 + ∑ βiXi + (8) i=1 Hay una clase única de diseños que minimizan la varianza de los coeficientes de regresión {βi}, se trata de los diseños de primer orden ortogonales. Un diseño es de primer orden ortogonal si todos los elementos que están fuera de la diagonal de la matriz (X’X) son cero. Esto implica que la suma de los productos cruzados de las columnas de la matriz X sea cero. La clase de los diseños de primer orden ortogonales incluye los factoriales 2k y las fracciones de la serie 2k en las que los efectos principales no son alias entre sí. Al usar estos diseños se supone que los niveles bajo y alto de los k factores están codificados en los niveles usuales ± 1. El diseño 2k no permite la estimación del error experimental a menos que se hagan réplicas de algunas corridas. Un método común de incluir las réplicas en el diseño 2k es aumentar el diseño con varias observaciones en el centro (el punto Xi = 0, i = 1, 2, …, k). La adición de puntos centrales al diseño 2k no influye en las {βi} para i ≥ 1, pero la estimación de β0 se convierte en el gran promedio de todas las observaciones. Además, la adición de puntos centrales no altera la propiedad de ortogonalidad del diseño. 1.2 Diseños Simplex El diseño Simplex es otra clase de diseño ortogonal, su principal característica es que requiere exactamente N= k +1 observaciones (una más que el número de factores ensayados). El diseño símplex se representa con una figura de lados regulares con k + 1 vértices en k dimensiones. Por lo tanto, el diseño símplex para k = 2 es un triángulo equilátero, y para k = 3 es un tetraedro regular. En la figura (7) se muestran diseños símplex de dos y tres dimensiones. 18 Figura 7 El diseño simplex para a) k = 2 variables y b) k = 3 variables. 1.2.1. Estudio de los sesgos en un diseño Simplex Con solamente N = k + 1 observaciones a disposición del experimentador, el modelo Simplex no tiene grados de libertad para falta de ajuste, en realidad su mayor utilidad está en que la estimación de los coeficientes de primer orden puede hacerse con la mínima cantidad de información. Como resultado de esto si la verdadera superficie de respuesta fuese de segundo orden no se podría detectar. Se pueden obtener varios diseños Simplex para un mismo valor de k, lo cual representa diferentes observaciones en la figura k-dimensional. Pero los sesgos de los coeficientes de regresión en presencia de términos cuadráticos, sí dependen de cual Simplex se utilice. Estas características entran en conflicto en ocasiones, por lo que con frecuencia debe aplicarse la discrecionalidad al seleccionar un diseño (1, 2, 4, 5 y 7). X2 X1 X1 X2 a) b) X3 19 2 Diseños para ajustar el modelo de segundo orden Una vez que se identifica la región de respuesta óptima. Debe diseñarse un nuevo experimento para caracterizar la superficie de respuesta. Por lo general se requiere un modelo que incorpore la curvatura para aproximar la respuesta. En la mayoría de los casos es adecuado el modelo de segundo orden. k k Y= β0 + ∑ βiXi + ∑ βiiX 2 ,i+∑ ∑ βijXiXj + i=1 i=1 i < j Algunas de las propiedades que debe tener un diseño experimental de segundo orden es: Poder estimar los coeficientes del modelo cuadrático. Tener un número pequeño de experimentos. Facilidad para detectar falta de ajuste. Uso de bloques. Rotabilidad. Es importante que el modelo de segundo orden proporcione buenas predicciones en toda la región de interés. Una manera de definir ―buenas‖ es requerir que el modelo tenga una varianza razonablemente consistente y estable de la respuesta predicha en los puntos de interés X. La varianza de la respuesta predicha en algún punto X es: V[Ŷ (X)] = σ2 X’ (X’X)-1 X (10) En la literatura se ha propuesto que un diseño de superficie de respuesta de segundo orden debe ser rotable. Esto significa que la V[Ŷ (X)] es la misma en todos los puntos X que están a la misma distancia del centro del diseño. La rotabilidad es una base razonable para la selección de un diseño de superficie de respuesta. Puesto que la finalidad de la MSR es la optimización, y la localización del óptimo se desconoce antes de correr el experimento, tiene sentido el uso de un diseño que proporcione una precisión de estimación igual en todas las direcciones (puede demostrarse que cualquier diseño de primer orden ortogonal es rotable). 2.1 Diseños Factoriales 3k Los factoriales 3k se pueden usar para estimar las ecuaciones polinomiales cuadráticas, ya que cumplen con los requisitos antes señalados (en especial el primero en donde cada variable debe tener al menos tres niveles), pero el número 20 de combinaciones de tratamientos que requieren produce un experimento poco práctico de grantamaño, esto se observa en la tabla 1. Tabla 1. Incremento del número de experimentos a medida que aumenta el número de factores. No. de factores k No. De Exp. En un diseño 3k, N No. De coeficientes en la ecuación cuadrática. 2 9 6 3 27 10 4 81 15 5 243 21 6 729 28 7 2187 36 2.2 Diseños Compuestos Centrales (DCC) Otra clase de diseños que tienen la ventaja de requerir menos experimentos que los 3k son los diseños compuestos centrales. Estos se construyen con base en factoriales 2k (lo cual permite la estimación de efectos principales e interacciones). Además incluyen un conjunto de puntos en los ejes (llamados puntos estrella) los cuales junto con el punto central (por lo general repetido), permiten estimar términos cuadráticos puros; la combinación de los puntos centrales y estrella requiere de tres niveles de cada variable independiente, denotados por –α, 0 y +α. El despliegue práctico de un DCC surge con frecuencia a través de la experimentación secuencial, es decir, cuando se ha usado un diseño 2k para ajustar un modelo de primer orden, este modelo ha presentado falta de ajuste, y después se agregaron las corridas axiales para permitir la incorporación de los términos cuadráticos en el modelo. El DCC es un diseño muy eficiente para ajustar el modelo de segundo orden. Hay dos parámetros en el diseño que deben especificarse: la distancia α de las corridas axiales al centro del diseño y el número de puntos centrales nc. En la figura (8) se muestra el DCC para k = 2 y k= 3 factores. La elección de α en el DCC está dictada principalmente por la región de interés. Cuando esta región es una esfera, el diseño debe incluir corridas centrales para proporcionar una varianza razonablemente estable de la respuesta predicha. En general, se recomiendan de tres a cinco corridas centrales. 21 Figura 8 Diseños centrales compuestos para a) k = 2 y b) k = 3 factores. Los DCC son más económicos en cuanto al uso de recursos experimentales y proporcionan la capacidad de estimar las ecuaciones de respuesta. Se pueden usar fracciones de los diseños 2k con interacciones de orden mayor con alias como base del diseño 2k cuando hay más factores en el estudio. Un diseño central compuesto se hace rotable mediante la elección de α. El valor de α para la rotabilidad depende del número de puntos en la porción factorial del diseño; de hecho, α = (nF) 1/4 produce un diseño central compuesto rotable, donde nF es el número de puntos usados en la porción factorial de diseño. 2.3 El DCC esférico La rotabilidad es una propiedad esférica; es decir, tiene mayor sentido como criterio de diseño cuando la región de interés es una esfera. Sin embargo, no es importante tener una rotabilidad exacta para tener un buen diseño. De hecho, para una región esférica de interés, la mejor elección de α desde el punto de vista de la varianza de predicción para el DCC es hacer α = √k. Este diseño, llamado DCC esférico, coloca todos los puntos factoriales y axiales del diseño sobre la superficie de una esfera de radio √k. 2.4 DCC con centros en las caras Existen muchas situaciones en las que la región de interés es cuboidal en lugar de esféricas. En estos casos una variante útil del diseño central compuesto es el diseño central compuesto con centros en las caras o el cubo con centros en las caras, en el que α = 1. En este diseño los puntos axiales o estrella se localizan en X2 X1 X1 X2 a) b) X3 22 los centros de las caras del cubo. Esta variante del diseño central compuesto se usa en ocasiones debido a que sólo requiere tres niveles de cada factor, y en la práctica con frecuencia es difícil cambiar los niveles de los factores. El cubo con centros en las caras no requiere tantos puntos centrales como el DCC esférico, en la práctica, nc = 2 o 3 es suficiente para proporcionar una buena varianza de predicción en toda la región experimental. Cabe señalar que en ocasiones se emplearán más corridas centrales para dar una estimación razonable del error experimental. 2.5 Otros diseños Existen muchos otros diseños de superficie que en ocasiones son útiles en la práctica. Para dos variables, podrían usarse diseños compuestos de puntos cuya separación en un círculo es igual y que forman polígonos irregulares. Puesto que los puntos del diseño son equidistantes del origen, a estos arreglos con frecuencia se les llama diseños equirradiales. Para k = 2, un diseño equirradial rotable se obtiene combinando n2 ≥ 5 puntos con una separación igual en un círculo con n1 ≥ 1 punto en el centro del círculo. Diseños de particular utilidad para k = 2 son el pentágono y el hexágono. Otros diseños útiles incluyen el diseño compuesto pequeño, el cual consiste en un factorial fraccionado (los efectos principales son alias de las interacciones de dos factores y ninguna de las interacciones de dos factores es alias entre sí) y las corridas axiales y centrales usuales, y la clase de los diseños híbridos. Estos diseños pueden ser de valor considerable cuando es importante reducir el número de corridas tanto como sea posible (1, 4, 7). 3 Diseños Box-Behnken Box y Behnken (1960) desarrollaron una familia de diseños de segundo orden de tres niveles mediante combinación de diseños factoriales de 2 niveles con diseños de bloques incompletos balanceados o parcialmente balanceados en una forma particular. El método es ilustrado con la construcción de un diseño pequeño de tres factores (por ejemplo k = 3). Un diseño de bloques incompleto balanceado con tres tratamientos y tres bloques se obtiene como se muestra en la tabla 2. Tabla 2 Diseño de bloques incompleto con tres tratamientos y tres bloques. Tratamiento Bloque X1 X2 X3 1 X x 2 X x 3 x x 23 Tomando los tres tratamientos como los tres factores X1, X2 y X3, en un estudio de superficie de respuesta reemplazando las marcas (x) en cada bloque por las dos columnas del diseño de dos niveles 22 e insertando una columna de ceros en el espacio en donde las marcas (x) no aparecen. Repitiendo este procedimiento para los siguientes 2 bloques y adicionando algunas corridas al punto central nos lleva a la construcción del diseño Box-Behnken para k = 3 como se observa en la tabla (3) y figura (9) Tabla 3. Diseño Box – Behnken para k = 3 No. Corrida X1 X2 X3 1 -1 -1 0 2 -1 1 0 3 1 -1 0 4 1 1 0 5 -1 0 -1 6 -1 0 1 7 1 0 -1 8 1 0 1 9 0 -1 -1 10 0 -1 1 11 0 1 -1 12 0 1 1 nc 0 0 0 El tamaño total de corridas es de 12 + nc, donde nc denota el número de corridas centrales. Figura 9 Cubo del Diseño Box-Behnken para k = 3 nc X3 X2 X1 6 2 3 4 5 7 8 9 10 11 1 12 24 En la figura 9 se observa que el diseño Box-Behnken es un diseño esférico, con todos los puntos localizados en una esfera de radio √2. Asimismo, el diseño no contiene ningún punto en los vértices de la región cúbica creada por los límites superior e inferior de cada variable. Esto podría ser una ventaja cuando los puntos de los vértices del cubo representan combinaciones de los niveles de los factores cuya prueba es prohibitivamente costosa o imposible debido a restricciones físicas del proceso. Construcciones similares conducen a los diseños que se obtienen en las tablas 4 y 5 para K = 4, 5 respectivamente. Los (± 1, y ± 1) en las matrices denotan las cuatro corridas del diseño 22 como se ha explicado anteriormente. Una ventaja de los diseños Box-Behnken es que estos sólo requieren tres niveles para cada factor. En contraste, los diseños de compuestos centrales requieren 5 niveles excepto cuando α es cambiada para ser 1. Todos los puntos del diseño (excepto el central) tienen 2 longitudes, por ejemplo., todos ellos yacen sobre alguna esfera. Estos diseños son particularmente adecuados para regiones esféricas. Debido a las propiedades esféricas debe haber por lo menos de tresa cinco corridas en el punto central. El diseño para k = 4 es conocido por ser rotable y los otros diseños son necesariamente rotables. Los diseños para k = 4, 5 tienen la propiedad que ellos pueden ser arreglados, en bloques ortogonales. Para k = 4, el diseño puede ser arreglado en tres bloques los cuales son separados por líneas corridas como se muestra en la tabla 4, cada bloque consiste de nueve puntos distintos incluyendo un punto central. Para este diseño, el modelo de segundo orden puede ser expandido para incluir los efectos del bloque sin afectar los parámetros estimados (por ejemplo, los efectos del parámetro y los efectos del bloque son ortogonales). Un diseño con esta propiedad es apto para formar bloques ortogonalmente. Similarmente los diseños para k = 5 en la tabla 5 pueden ser arreglados en 2 bloques ortogonales, cada uno de los cuales debe contener como mínimo un punto central. Formar bloques ortogonalmente, es una propiedad deseable y mas importante para los requerimientos de rotabilidad si el experimento tienen que ser arreglado en bloques y los efectos del bloque son probablemente grandes. Comparando el tamaño de las corridas de los diseños que se muestran en las tablas 4 y 5, el diseño Box-Behnken para k = 3 es bastante económico: el diseño para k = 4 tienen 27 puntos los cuales son 12 mas que el tamaño mínimo requerido de 15, el diseño para k = 5 también es mayor con 31 puntos mas que el tamaño mínimo requerido. Esta comparación podría ser aun mayor con los diseños Box-Behnken con K > 5. 25 Tabla 4 Diseño Box-Behnken para cuatro factores Primer bloque Segundo bloque Tercer bloque Experimento X1 X2 X3 X4 1 -1 -1 0 0 2 1 -1 0 0 3 -1 1 0 0 4 1 1 0 0 5 0 0 -1 -1 6 0 0 1 -1 7 0 0 -1 1 8 0 0 1 1 9 0 0 0 0 10 -1 0 0 -1 11 1 0 0 -1 12 -1 0 0 1 13 1 0 0 1 14 0 -1 -1 0 15 0 1 -1 0 16 0 -1 1 0 17 0 1 1 0 18 0 0 0 0 19 -1 0 -1 0 20 1 0 -1 0 21 -1 0 1 0 22 1 0 1 0 23 0 -1 0 -1 24 0 1 0 -1 25 0 -1 0 1 26 0 1 0 1 27 0 0 0 0 26 Tabla 5 Diseños Box Behnken para cinco factores Primer bloque Segundo bloque Exp. X1 X2 X3 X4 X5 Exp. X1 X2 X3 X4 X5 1 -1 -1 0 0 0 24 0 -1 -1 0 0 2 1 -1 0 0 0 25 0 1 -1 0 0 3 -1 1 0 0 0 26 0 -1 1 0 0 4 1 1 0 0 0 27 0 1 1 0 0 5 0 0 -1 -1 0 28 -1 0 0 -1 0 6 0 0 1 -1 0 29 1 0 0 -1 0 7 0 0 -1 1 0 30 -1 0 0 1 0 8 0 0 1 1 0 31 1 0 0 1 0 9 0 -1 0 0 -1 32 0 0 -1 0 -1 10 0 1 0 0 -1 33 0 0 1 0 -1 11 0 -1 0 0 1 34 0 0 -1 0 1 12 0 1 0 0 1 35 0 0 1 0 1 13 -1 0 -1 0 0 36 -1 0 0 0 -1 14 1 0 -1 0 0 37 1 0 0 0 -1 15 -1 0 1 0 0 38 -1 0 0 0 1 16 1 0 1 0 0 39 1 0 0 0 1 17 0 0 0 -1 -1 40 0 -1 0 -1 0 18 0 0 0 1 -1 41 0 1 0 -1 0 19 0 0 0 -1 1 42 0 -1 0 1 0 20 0 0 0 1 1 43 0 1 0 1 0 21 0 0 0 0 0 44 0 0 0 0 0 22 0 0 0 0 0 45 0 0 0 0 0 23 0 0 0 0 0 46 0 0 0 0 0 Una desventaja de los diseños Box-Behnken es que al utilizar experimentación secuencial no se basan en el factorial 2k. Esto significa que el diseño completo de superficie de repuesta se implementa, sin haber ejecutado el diseño en su forma restringida (esto es factorial + puntos centrales), para determinar la necesidad de experimentos adicionales con el fin de separar los factores cuadráticos. Debido a esto se debe escoger un diseño compuesto central, a menos que se tenga la seguridad que se requiere un diseño de superficie de respuesta completo o que es ventajoso tener tres niveles en cada factor (3, 4, 5, 6, 8, 9, 10, 11 y 12). A continuación se indicará cómo usar estos diseños que se basan en la Metodología de Superficie de Respuesta mediante ejemplos de aplicación dentro del desarrollo farmacéutico para encontrar el conjunto óptimo de condiciones de operación para las X, así como para caracterizar la naturaleza de la superficie de respuesta. 27 VII. EJEMPLOS DE APLICACIÓN En los ejemplos que se muestran a continuación se puntualiza el planteamiento del problema, el análisis de datos y los resultados (que incluyen tablas, graficas e interpretación), de acuerdo con las salidas del software estadístico Statgraphics Versión 5.0 Plus, además de hacer una pequeña discusión del problema en general. La forma de realizar el diseño y la introducción de los datos así como la obtención de resultados se muestran en el capitulo VIII Guía de usuario del Software estadístico Statgraphics Versión 5.0 Plus, para análisis de superficie de respuesta diseños Box-Behnken. Es importante mencionar que en estos ejemplos no se profundiza en la parte donde se requieren cálculos que a la vista del lector con poca o nula experiencia en el tema dichos cálculos se hacen complejos, esto es con el propósito de apegarse a los objetivos del trabajo. A. EVALUACIÓN Y OPTIMIZACIÓN DE UNA FORMULACIÓN DE MICROESFERAS QUE CONTIENEN β-ESTRADIOL BIODEGRADABLE. 1 Planteamiento del problema El objetivo es evaluar los efectos de los factores principales así como de las interacciones de los factores en una formulación de microesferas de b-Estradiol biodegradable, para cada una de las variables de respuesta por separado. Un segundo objetivo consiste en obtener una formulación optimizada a partir de combinar las tres variables de respuesta para realizar un análisis simultáneo. Un diseño Box-Behnken, con tres factores y tres niveles, fue utilizado teniendo como variables independientes a la proporción fármaco/polímero (X1), concentración de agente dispersante (X2) y concentración de agente desintegrante (X3). Las variables dependientes o de respuesta fueron porcentaje de eficiencia de encapsulación (Y1), porcentaje acumulado de fármaco liberado (Y2) y porcentaje de producción de microesferas (Y3) (13). Las variables y sus niveles se muestran en la tabla 6 y el diseño se muestra en la tabla 7. 28 Tabla 6 Variables en el diseño Box-Behnken para microesferas de b-estradiol biodegradable. Niveles Bajo Medio Alto Variable Independientes (Factores) X1= Proporción Fármaco/polímero 1:3 1:5 1:7 X2= Concentración de agente dispersante (% PVA) 0.5 1.0 1.5 X3= Concentración de agente desintegante. (%CaCl2) 1 2 3 Valores observados Objetivo Bajo Alto Variable de Respuesta Y1 = Eficiencia de encapsulación (%) 51.05 100.56 Maximizar Y2 = Fármaco liberado acumulado (%) 47.26 100.80 Maximizar Y3 = Producción de microesferas (%) 74.89 94.56 Maximizar Tabla 7 Respuestas observadas para el diseño Box-Behnken para microesferas de b-estradiol biodegradable. Corrida X1 X2 X3 Y1 Y2 Y3 1 3 1 3 68.05 79.9 74.89 2 3 0.5 2 62.73 74.28 75.9 3 7 1.5 2 89.33 92.71 87.5 4 3 1.5 2 75.44 72.39 80.65 5 5 1 2 90.97 58.37 84.56 6 5 1 2 90.08 57.11 79.56 7 3 1 1 65.12 74.09 78.65 8 5 1.5 1 98.31 79.14 91.85 9 5 0.5 3 100.56 66.65 94.56 10 7 1 1 86.37 71.18 83.56 11 5 1.5 3 76.16 77.47 82.87 12 5 1 2 91.18 54.12 82.87 13 5 0.5 1 51.05 100.8 76.26 14 7 1 3 68.05 79.9 74.89 15 7 0.5 2 89.42 47.26 85.6 Para X1 (proporción fármaco/polímero) sólo se anota la cantidad de polímero, que es la que varía, con relación a la cantidad de fármaco, que es invariable es decir siempre es 1. Para este ejemplo se utilizará este criterio. En este ejemplo se tienen tres variables de respuesta por lo que la optimización de la formulación se hace compleja. Es necesario analizar cada variable de respuesta por separado y la combinación de las tres variables utilizando el software estadístico Statgraphics Versión 5.0 Plus en el apartado diseño de superficie de respuesta (Diseños Box-Behnken) obteniendo los resultados que se muestran a continuación. 29 2 Resultados en Statgraphics. 2.1 Eficiencia de encapsulación (Y1) Tabla 8 Análisis de Varianza para eficiencia de encapsulación (Y1) -------------------------------------------------------------------------------- SourceSum of Squares Df Mean Square F-Ratio P-Value -------------------------------------------------------------------------------- A:X1 814.667 1 814.667 48.36 0.0009 B:X2 157.354 1 157.354 9.34 0.0282 C:X3 119.12 1 119.12 7.07 0.0449 AA 255.514 1 255.514 15.17 0.0115 AB 40.96 1 40.96 2.43 0.1797 AC 1.38063 1 1.38063 0.08 0.7862 BB 43.2183 1 43.2183 2.57 0.1701 BC 1283.79 1 1283.79 76.20 0.0003 CC 134.2 1 134.2 7.97 0.0370 Total error 84.2331 5 16.8466 -------------------------------------------------------------------------------- Total (corr.) 2886.32 14 R-squared = 97.0816 percent R-squared (adjusted for d.f.) = 91.8286 percent Standard Error of Est. = 4.10446 Mean absolute error = 1.93133 Durbin-Watson statistic = 2.6256 (P=0.0360) Lag 1 residual autocorrelation = -0.338904 En el análisis de varianza de la tabla 8 se muestra el nivel de significación estadística entre Y1 y cada uno de los efectos por separado así como de sus interacciones, en este caso seis efectos (los cuales se remarcan) tienen un p- value menor de 0.05, lo que indica que estos efectos son diferentes de cero, es decir, que afectan significativamente a Y1, con un nivel de significación menor que 0.05. La prueba de Durbin-Watson para los residuales, muestra un p-value menor que 0.05, lo cual indica que existe una posible correlación serial en los residuales, esta correlación se puede observar en el gráfico de residuales (figura 10) que forman un aparente cono de izquierda a derecha. Residual Plot for Y1 51 61 71 81 91 101 111 predicted -4.3 -2.3 -0.3 1.7 3.7 5.7 re si du al Figura 10 Gráfico de residuales para Y1 (eficiencia de encapsulación) 30 La ecuación para el modelo encontrado que explica el 97.0816% de la variabilidad en Y1 es la siguiente: A partir de este modelo se realiza la búsqueda de valores óptimos tal y como se menciona en la teoría. Esta ecuación representa el efecto cuantitativo de los factores X1, X2 y X3 y de sus interacciones sobre la respuesta Y1. Un signo positivo en el coeficiente indica un efecto sinérgico y un signo negativo en el coeficiente indica un efecto antagonista. La ecuación muestra que X1, X2 y X3 afectan positivamente a Y1 mientras que las interacciones de estos factores afectan negativamente a Y1. El antagonismo más alto lo presenta la interacción de X2 y X3, esto es posiblemente a causa de un incremento en la concentración de electrolitos que puede crear cargas similares sobre otros ingredientes, incrementado la repulsión entre el fármaco y el polímero afectando de manera adversa la eficiencia de encapsulación. Tabla 9 Estimación de resultados para eficiencia de encapsulación (Y1) a partir de la ecuación del modelo encontrado. -------------------------------------------------------------------------------------- Observed Fitted Lower 95.0% CL Upper 95.0% CL Row Value Value Residual for Mean for Mean -------------------------------------------------------------------------------------- 1 68.05 70.9775 -2.9275 61.8032 80.1518 2 62.73 61.5038 1.22625 52.3295 70.678 3 89.33 90.5563 -1.22625 81.382 99.7305 4 75.44 76.7738 -1.33375 67.5995 85.948 5 90.97 90.7433 0.226667 84.6272 96.8595 6 90.08 90.7433 -0.663333 84.6272 96.8595 7 65.12 62.085 3.035 52.9107 71.2593 8 98.31 100.011 -1.70125 90.837 109.186 9 100.56 98.8588 1.70125 89.6845 108.033 10 86.37 83.4425 2.9275 74.2682 92.6168 11 76.16 71.8988 4.26125 62.7245 81.073 12 91.18 90.7433 0.436667 84.6272 96.8595 13 51.05 55.3113 -4.26125 46.137 64.4855 14 86.95 89.985 -3.035 80.8107 99.1593 15 89.42 88.0863 1.33375 78.912 97.2605 -------------------------------------------------------------------------------------- La tabla 9 muestra información acerca de los valores de Y1 generados a partir del modelo encontrado. Esta tabla incluye el valor observado de Y1, el valor de predicción de Y1, limites de confianza al 95% para la respuesta promedio y los residuales los cuales se han graficado en la figura 10. Cada punto corresponde al valor de los factores experimentales en una fila específica del archivo de datos. Si se deseara analizar más corridas éstas se agregan al archivo de datos y automáticamente el programa proporciona los valores de los parámetros registrados en la tabla 9 para la corrida adicional. De esta manera se pueden incluir y analizar corridas adicionales en el diseño experimental. Tabla 10 Ruta del ascenso (o descenso) más pronunciado para eficiencia de encapsulación (Y1). 31 Predicted X1 X2 X3 Y1 (%) (%) (%) ---------- ---------- ---------- ------------ 5.0 1.0 2.0 90.97 6.0 1.07523 2.08346 94.3156 7.0 0.994582 1.86702 92.1613 8.0 0.805912 1.36898 78.3482 9.0 0.489207 0.568447 33.9176 10.0 0.00236462 -0.63082 -84.3546 En la tabla 10 se observa la trayectoria secuencial del ascenso (o descenso) más pronunciado a lo largo de la región experimental en la cual la respuesta estimada cambia más fácilmente por los cambios en los factores experimentales. En este caso 6 puntos son generados a partir de los cambios en X1, que son disminuciones en las cantidades de polímero con respecto a la cantidad de fármaco. Y de un aumento en las concentraciones de las variables X2 y X3 para alcanzar el punto máximo de respuesta Y1. X3=2.0 X1 X2 Y 1 Y1 61.0 65.0 69.0 73.0 77.0 81.0 85.0 89.0 93.0 97.0 3 4 5 6 7 0.5 0.7 0.9 1.1 1.3 1.5 61 71 81 91 101 Figura 11 Gráfico de superficie de respuesta para Y1 con X3 constante. En esta figura se muestra el efecto de los factores X1 (proporciones fármaco/polímero) y X2 (Concentración de agente dispersante) en la respuesta Y1 (eficiencia de encapsulación) manteniendo constante X3 (concentración de agente desintegrante). Se observa que el máximo que es de 94% aproximadamente se localiza hacia una esquina de la región experimental. 32 X3=2.0 X1 X 2 Y1 61.0 65.0 69.0 73.0 77.0 81.0 85.0 89.0 93.0 97.0 3 4 5 6 7 0.5 0.7 0.9 1.1 1.3 1.5 x:5.90258 y:1.20504 z:94.4481 Figura 12 Gráfico de contornos para Y1 con X3 constante. En esta figura se muestra el efecto de los factores X1 (proporciones fármaco/polímero) y X2 (Concentración de agente dispersante) en la respuesta Y1 (eficiencia de encapsulación) manteniendo constante X3 (concentración de agente desintegrante). Se puede apreciar de manera bidimensional la localización del óptimoen la respuesta Y1 que está representado por z y es de 94.44%, las variables X1 y X2 están representadas por x y y respectivamente. X2=1.0 X1 X3 Y 1 Y1 61.0 65.0 69.0 73.0 77.0 81.0 85.0 89.0 93.0 97.0 3 4 5 6 7 1 1.4 1.8 2.2 2.6 3 62 72 82 92 102 Figura 13 Gráfico de superficie de respuesta para Y1 con X2 constante. En esta figura se muestra el efecto de los factores X1 (proporciones fármaco/polímero) y X3 (Concentración de agente desintegrante) en la respuesta Y1 (eficiencia de encapsulación) manteniendo constante X2 (Concentración de agente dispersante). Se observa que el máximo que es de 94% aproximadamente se localiza en una esquina de la región experimental. 33 X2=1.0 X1 X 3 Y1 61.0 65.0 69.0 73.0 77.0 81.0 85.0 89.0 93.0 97.0 3 4 5 6 7 1 1.4 1.8 2.2 2.6 3 x:5.90258 y:2.30216 z:94.3417 Figura 14 Gráfico de contornos para Y1 con X2 constante En esta figura se muestra el efecto de los factores X1 (proporciones Fármaco/polímero) y X3 (Concentración de agente desintegrante) en la respuesta Y1 (eficiencia de encapsulación) manteniendo constante X2 (Concentración de agente dispersante) Se puede apreciar de manera bidimensional la localización del óptimo en la respuesta Y1 que está representado por z y es de 94.34%, las variables X1 y X3 están representadas por x y y respectivamente. X1=5.0 X2 X3 Y 1 Y1 61.0 65.0 69.0 73.0 77.0 81.0 85.0 89.0 93.0 97.0 101.0 0.5 0.7 0.9 1.1 1.3 1.5 1 1.4 1.8 2.2 2.6 3 55 65 75 85 95 105 Figura 15 Gráfico de superficie de respuesta para Y1 con X1 constante. Esta figura muestra el efecto de los factores X2 (Concentración de agente dispersante) y X3 (Concentración de agente desintegrante) en la respuesta Y1 (eficiencia de encapsulación) manteniendo constante X1 (las proporciones Fármaco/polímero). Se observa que el máximo que es de 100% aproximadamente se localiza en una esquina de la región experimental, a diferencia de los gráficos de superficie de respuesta de las figuras 11 y 13 éste muestra un cambio drástico en la estructura tridimensional debido a las variaciones propias de los factores. 34 X1=5.0 X2 X 3 Y1 61.0 65.0 69.0 73.0 77.0 81.0 85.0 89.0 93.0 97.0 101.00.5 0.7 0.9 1.1 1.3 1.5 1 1.4 1.8 2.2 2.6 3 x:1.5 y:1.0 z:100.011 Figura 16 Gráfico de contornos para Y1 con X1 constante. En esta figura se muestra el efecto de los factores X2 (Concentración de agente dispersante) y X3 (Concentración de agente desintegrante) en la respuesta Y1 (eficiencia de encapsulación) manteniendo constante X1 (las proporciones Fármaco/polímero). Se puede apreciar de manera bidimensional la localización del óptimo en la respuesta Y1 que esta representado por z y es de 100%, las variables X2 y X3 están representadas por x y y respectivamente. Tabla 11 Respuesta optimizada de eficiencia de encapsulación (Y1) Optimize Response ----------------- Goal: maximize Y1 Optimum value = 101.692 Factor Low High Optimum ----------------------------------------------------------------------- X1 3.0 7.0 5.89895 X2 0.5 1.5 1.5 X3 1.0 3.0 1.0 La tabla 11 ayuda a predecir la combinación de valores de los factores (X1, X2 y X3) que optimizan la respuesta Y1 (eficiencia de encapsulación) en este caso se maximiza Y1 ya que se está cubriendo toda la región experimental se observa que el óptimo está más cercano a los niveles altos para X1 (5.89) y X2 (1.5) y en el nivel bajo para X3 (1.0). 35 2.2 Porciento acumulado de fármaco liberado (Y2). Tabla 12. Análisis de Varianza para fármaco liberado acumulado (Y2) -------------------------------------------------------------------------------- Source Sum of Squares Df Mean Square F-Ratio P-Value -------------------------------------------------------------------------------- A:X1 39.1612 1 39.1612 0.33 0.5912 B:X2 133.825 1 133.825 1.12 0.3376 C:X3 107.898 1 107.898 0.91 0.3849 AA 39.2404 1 39.2404 0.33 0.5908 AB 560.269 1 560.269 4.70 0.0823 AC 6.7081 1 6.7081 0.06 0.8218 BB 371.449 1 371.449 3.12 0.1376 BC 263.738 1 263.738 2.21 0.1969 CC 587.587 1 587.587 4.93 0.0770 Total error 595.47 5 119.094 -------------------------------------------------------------------------------- Total (corr.) 2609.58 14 R-squared = 77.1814 percent R-squared (adjusted for d.f.) = 36.108 percent Standard Error of Est. = 10.913 Mean absolute error = 5.03533 Durbin-Watson statistic = 2.66963 (P=0.0277) El análisis de varianza de la tabla 12 muestra que ningún efecto tiene un p-value menor a 0.05 lo que indica que los efectos no influyen de manera estadísticamente significativa sobre Y2 con un nivel de significación del 5%. La prueba de Durbin-Watson para los residuales, muestra un p-value menor que 0.05, lo cual indica que existe una posible correlación serial en los residuales, esto se observa también en la figura 17. Residual Plot for Y2 47 57 67 77 87 97 107 predicted -13 -8 -3 2 7 12 17 re si du al Figura 17 Gráfico de residuales para Y2 (Fármaco liberado acumulado) 36 La ecuación para el modelo encontrado que explica el 77.1814% de la variabilidad en Y2 es la siguiente: Tabla 13 Estimación de resultados para fármaco liberado acumulado (Y2) a partir de la ecuación del modelo encontrado. -------------------------------------------------------------------------------------- Observed Fitted Lower 95.0% CL Upper 95.0% CL Row Value Value Residual for Mean for Mean -------------------------------------------------------------------------------------- 1 68.05 70.9775 -2.9275 61.8032 80.1518 2 62.73 61.5038 1.22625 52.3295 70.678 3 89.33 90.5563 -1.22625 81.382 99.7305 4 75.44 76.7738 -1.33375 67.5995 85.948 5 90.97 90.7433 0.226667 84.6272 96.8595 6 90.08 90.7433 -0.663333 84.6272 96.8595 7 65.12 62.085 3.035 52.9107 71.2593 8 98.31 100.011 -1.70125 90.837 109.186 9 100.56 98.8588 1.70125 89.6845 108.033 10 86.37 83.4425 2.9275 74.2682 92.6168 11 76.16 71.8988 4.26125 62.7245 81.073 12 91.18 90.7433 0.436667 84.6272 96.8595 13 51.05 55.3113 -4.26125 46.137 64.4855 14 86.95 89.985 -3.035 80.8107 99.1593 15 89.42 88.0863 1.33375 78.912 97.2605 -------------------------------------------------------------------------------------- La
Compartir