Fotocopiadora confiabilidad modelado Usando algoritmos evolutivos Michael Bulmer y John Eccleston 18.1 INTRODUCCION Las fotocopiadoras son una de las piezas de equipo de oficina más comunes e importantes en el lugar de trabajo moderno. El hecho de que las fotocopiadoras no funcionen correctamente causa grandes inconvenientes a través de la producción de documentos de apariencia y calidad deficientes, retrasos en la producción y mayores costos debido a la pérdida de tiempo y pérdidas. Hay una gran variedad de componentes en una fotocopiadora: mecánica, eléctrica y de computadora. Esto conduce a los numerosos modos de falla que se manifiestan de diversas maneras, incluyendo copias sucias o manchadas, atascos de papel, papel dañado, sobreexposición o subexposición, alimentación de papel incorrecta y alineación incorrecta. Los costos implican no solo el tiempo de inactividad y el desperdicio de copias, sino también los costos de servicio y reemplazo de partes (así como los costos de garantía). El usuario no siente los efectos de la falla de una fotocopia sola, ya que la fabricación también se ve afectada por las fallas. En el largo y mediano plazo, la confiabilidad y la insatisfacción de los clientes pueden afectar negativamente la rentabilidad y la participación de mercado. En el corto plazo, normalmente se espera que el fabricante cubra las piezas y el servicio en virtud de un acuerdo de garantía. Normalmente, se ofrece un plan de servicio o una garantía externa de contrato con la venta de una fotocopiadora. La naturaleza de tales planes se basa necesariamente en una comprensión de la confiabilidad de la máquina y, en consecuencia, en el análisis de los datos de fallas y el modelado de confiabilidad. En este estudio de caso aplicamos el algoritmo evolutivo [EA; ver Michalewicz (1996)] acercamiento a los datos de fallas de fotocopias para determinar modelos para los diferentes modos de fallas. Los resultados deben dar una idea de la confiabilidad y la calidad de la fotocopiadora y de la determinación de posibles planes de garantía y / o servicio. En la Sección 18.2 18. 2 se proporciona una descripción de la fotocopiadora y los datos relativos a su historial de servicio. Algunos análisis preliminares se presentan en la Sección 18.3. Un rango de 399 400 MODELADO DE FIABILIDAD DE FOTOCOPIADORES UTILIZANDO ALGORITMOS EVOLUTIVOS los modelos de falla potencial se especifican en la Sección 18.4, y la metodología de EA se desarrolla en la Sección 18.5. La Sección 18.6 da los resultados del ajuste del modelo e introduce métodos de remuestreo para dar una medida de precisión a las estimaciones del modelo. Los resúmenes y las recomendaciones con respecto a la fiabilidad y los requisitos de servicio de la fotocopiadora se encuentran en la Sección 18.7. Las observaciones finales con respecto al uso de los modelos se dan en la Sección 18.8. 18.2 CARACTERIZACIÓN DEL SISTEMA La fotocopiadora bajo investigación utiliza dos procesos principales para producir copias; transfiriendo la imagen al papel y luego arreglando esa imagen. En el primero de estos, un
tambor giratorio se carga eléctricamente a lo largo de una línea mediante un cable de carga. A medida que la sección cargada gira, se expone a la imagen reflejada que se está copiando. La luz más brillante disipa la carga, mientras que las secciones más oscuras, la imagen, no afectan la carga. La superficie del tambor luego pasa a un revelador donde la carga restante atrae el tóner. Finalmente, la superficie del tambor se encuentra con el papel donde se usa una carga opuesta para tirar el tóner a la página. pá gina. Las garras del tambor luego levantan el papel del tambor, mientras que una cuchilla de limpieza elimina el tóner residual de la superficie, dejándolo listo para que se cargue nuevamente para la próxima copia. El segundo proceso implica que el papel pase a través de un par de rodillos (uno de los cuales se calienta) que fusiona el tóner en la página. El rodillo superior acumula tóner de este proceso. Una lámina de limpieza se asienta en el rodillo para eliminar esto. A medida que la propia red acumula el tóner residual, se extiende para exponer una sección nueva de la limpieza de la tela. Una vez que la web está completamente terminada, debe ser reemplazada. Modelaremos el reemplazo de la web de limpieza en la Sección 18.6. Tenga en cuenta que el enfoque en este modelado es, en gran medida, en los consumibles. Los componentes que deben considerarse se reemplazan simplemente cuando están agotados o desgastados. Usaremos esto para suponer que los tiempos de vida de los componentes pueden considerarse como tiempos independientes de falla. Esperamos que estos reemplazos reemp lazos estén fuertemente asociados con el uso. Sin embargo, es posible que la independencia no se mantenga estrictamente, ya que estos componentes funcionan dentro del entorno de una máquina que también está envejeciendo. Consideraremos las fallas del sistema y las fallas de los componentes por separado. En este estudio de caso, proponemos modelar la confiabilidad de una fotocopiadora ampliamente utilizada. Los tiempos de falla para varios componentes se modelarán utilizando un rango de distribuciones de falla con un énfasis particular en la distribución de Weibull y sus extensiones. Estos incluyen la distribución estándar, con y sin el parámetro de retardo, y combinaciones de distribuciones de Weibull, como modelos mixtos, modelos de riesgo en competencia, modelos multiplicativos y modelos seccionales. Estos modelos más complejos son necesarios para estudiar la confiabilidad de un sistema complejo como una fotocopiadora, en el cual los diferentes componentes pueden fallar de diferentes maneras y tener efectos complicados en general. Los parámetros de los modelos se estiman a través de una metodología basada en algoritmos evolutivos (Michalewicz, 1996). En comparación con los métodos tradicionales, como la probabilidad máxima y la estimación bayesiana, este enfoque es muy general y no requiere estimaciones iniciales. En lugar de iterar una única solución, una EA trata con una población de soluciones, utilizando analogías de biodiversidad y mutación para superar los óptimos locales. Una ventaja clave del sistema EA es la facilidad con la que se pueden incorporar nuevos modelos. El algoritmo requiere solo una especificación de los parámetros y una expresión para la confiabilidad. Esto permite al usuario explorar y comparar fácilmente modelos candidatos y también variar el criterio de optimalidad utilizado en el proceso de adaptación. Los datos analizados aquí se obtuvieron de un agente de servicio y son para una sola máquina. La fotocopiadora en cuestión es una máquina popular de un fabricante multinacional importante y está diseñada para un uso medio en un entorno de oficina, aunque a partir de estos datos parece que, en ocasiones, algunos usos tienden a ser de gran volumen. El historial de servicio de la máquina es
incompleto, ya que solo se incluyen los componentes que se reemplazaron dos veces durante la vida útil de la máquina debido a una falla. No se incluyó el reemplazo de consumibles, como el tóner y el revelador. El procedimiento de la oficina para la identificación y rectificación de problemas con la fotocopiadora fue: 1. Modo de falla. Un operador notaría el funcionamiento incorrecto de la máquina y se comunicará con el proveedor de servicio e informará el problema. 2. Causa de falla. El proveedor del servicio determinaría la razón (debido al diseño, la fabricación o el uso de la máquina) que dio lugar a una falla y luego reemplazaría los componentes según se considere necesario. Los tipos de operaciones y copias dañadas que se consideraron fallas incluyeron: copias sucias o manchadas, daños en el papel durante la copia, sobreexposición o subexposición, alimentación de papel deficiente, atascos de papel repetidos, desalineación del papel y marcas no deseadas en las copias . La solución más común para estos problemas fue el reemplazo de uno o más componentes. Las fechas en que se hicieron estos reemplazos y la lectura del contador correspondiente en el momento del reemplazo se dan en el Apéndice. Los datos cubren fallas durante los primeros 4.5 años de la fotocopiadora. 18.3 ANALISIS PRELIMINAR Pocos elementos fallaron con la frecuencia suficiente para permitir un análisis y modelado a nivel de componente. La banda de limpieza falló 15 veces y los rodillos de alimentación 11 veces; Todos los demás componentes fallaron menos de 10 veces, la mayoría mucho menos. En consecuencia, hemos analizado los datos a nivel del sistema, que es considerando una falla del sistema como cuando la máquina no está funcionando correctamente y recibe servicio, e ignoramos los componentes particulares que han fallado. Además, se realizó un análisis a nivel de componente del historial de limpieza web. El modelado a nivel del sistema es necesario para determinar las llamadas de servicio para corregir fallas, y el modelado a nivel de componente es necesario para la planificación de piezas de repuesto. El tiempo (en días) y el número de copias entre fallas se obtienen fácilmente a partir de los datos de los datos del sistema (todas las fallas) y la web de limpieza. Algunas des A continuación se muestran las estadísticas y gráficos de scripts con respecto al número de fallas (tiempos y copias entre fallas) para el sistema y la web de limpieza. Hubo 39 fallas en el sistema (ocasiones de servicio) que comprenden 98 fallas de componentes. 18.3.1 Fallos del sistema Como era de esperar, la cantidad de días (tiempo) y la cantidad de copias entre fallas del sistema, denotadas n_t y n_c, respectivamente, se correlacionaron positivamente (r = 0.753). El promedio de días entre fallas fue de 41.56 y el promedio de días de copias entre fallos fue de 26.647. Debido a la correlación, solo se proporciona un gráfico de tiempo para las copias. En los histogramas y gráficos que siguen, el tiempo entre fallas y el número de copias entre fallas (el cambio en la lectura del contador en el contador de la máquina denotada) se denota respectivamente como día y contador.
De la gráfica de tiempo de la Figura 18.1 se desprende que el número de copias entre fallas disminuye con el tiempo. Esto refleja el efecto del envejecimiento, por lo que se producen fallos.
más frecuentemente a medida que el artículo envejece. El histograma del número de copias entre fallas está muy inclinado hacia la derecha. La cola corresponde a la vida temprana de la copiadora, sugiriendo además que un modelo de mezcla puede ser apropiado. La figura 18.2 muestra que el histograma por día es algo diferente. Esto puede indicar que se necesitan diferentes modelos de falla para modelar los datos de día y contador, como se demostrará más adelante. Otra variable que puede ser de interés es el uso, definido como la cantidad de copias entre fallas dividida por la cantidad de días entre fallas. El uso promedio entre fallas fue de 670.2 copias por día con una desviación estándar de 409.8 copias por día. El último punto de datos es un posible valor atípico, como se puede ver en la Figura 18.3, quizás debido a una grabación incorrecta.
18.3.2 Limpieza de fallas web El componente con las fallas más observadas fue la web de limpieza, por lo que se utilizará como un ejemplo de falla de componentes de modelado. El número de días y el número de copias entre fallas de la red de limpieza, denotadas por ntw y ncw respectivamente, se correlacionaron fuertemente (r = 0.916). El número promedio de días entre fallas fue de 115.1, y el número promedio de copias entre fallas fue de 72,670. Estos son necesariamente más altos que los medios del sistema porque las fallas de limpieza de la web son un subconjunto de las fallas del sistema. La figura 18.4 muestra que los histogramas del contador y los datos diarios de la limpieza de la web son similares a los de todos los datos. Están inclinados hacia la derecha, y el número de copias y la cantidad de días entre fallos de la banda de limpieza disminuye con el tiempo. La figura 18.5 muestra un histograma del uso, en copias por día, entre fallas de la web de limpieza. La media del uso para la limpieza de la tela fue de 598.8 copias por día entre fallas con una desviación estándar de 235.8 copias por día.
Las estadísticas y gráficas descriptivas anteriores demuestran claramente que a medida que la fotocopia envejece, su confiabilidad se vuelve cuestionable y, en última instancia, será motivo de preocupación para el propietario / usuario y el proveedor de servicios. La distribución de copias y el tiempo entre fallas implica que una familia de distribuciones sesgadas, como las distribuciones de Weibull, son potencialmente útiles para modelar los datos de fallas. La medida de uso, aunque de cierto uso descriptivo, se encontró que no era valiosa en el modelado adicional y no juega ninguna parte más en este estudio. El objetivo entonces es determinar los modelos adecuados para el fallo de la fotocopiadora que podrían ser útiles para diseñar contratos de garantía y servicio. 18.4 MODELOS WEIBULL La familia de modelos de Weibull es una de las distribuciones estadísticas más utilizadas para el modelado de fallas y confiabilidad, y es un ingrediente vital de nuestro enfoque. A continuación se describen brevemente los modelos que se han explorado en este estudio de caso. Se puede encontrar más información sobre los modelos en Blischke y Murthy (2000). No es difícil incluir otros modelos en el algoritmo. Weibull de dos parámetros Este es el modelo más simple considerado. Tiene un parámetro de forma, betha, y un parámetro de escala, etha, con función de confiabilidad.
En este y los siguientes modelos, la función de confiabilidad dada se define para t> 0. De manera similar, los parámetros de forma y escala se llevan a lo positivo; es decir, bheta> 0y etha> 0. Weibull de tres parámetros Este modelo es el mismo que el Weibull de dos parámetros, pero incluye un retraso o un cambio parámetro, Ghamma, con función de fiabilidad.
Modelos de mezcla Una mezcla aditiva de dos distribuciones de Weibull de dos parámetros da lugar a un modelo de cinco parámetros con una mezcla, dos parámetros de forma y dos parámetros de escala denotados como p, Bheta 1, Betha 2, etha 1 y etha 2, respectivamente, con función de confiabilidad.
donde 0 <= p <= 1. Si los dos procesos de falla son similares en naturaleza, entonces un método más simple el modelo se obtiene al asumir un parámetro de forma común, Betha = Betha 1 = Betha =2, dando un Modelo de cuatro parámetros.
Multiplicativa Un modelo multiplicativo tiene una función de falla que es el producto de las funciones de falla de dos distribuciones de Weibull y, como resultado, un modelo de confiabilidad de cuatro parámetros con los parámetros Betha 1, Betha 2, etha 1 y etha 2. Modela un sistema que falla cuando fallan los dos subsistemas, dando una función de confiabilidad
Riesgo de competencia Un modelo de riesgo competitivo tiene una función de confiabilidad que es el producto de las funciones de confiabilidad de dos distribuciones Weibull con los parámetros Betha 1,
Betha 2, Etha 1 y Etha 2. Modela un sistema que falla cuando falla cualquiera de los dos subsistemas, dando una función de confiabilidad.
Modelo seccional Un modelo seccional se compone de diferentes distribuciones de Weibull para diferentes períodos de tiempo. El modelo seccional más simple es uno con dos distribuciones de Weibull. Este modelo incluye seis parámetros, cuatro de los cuales son independientes después de considerar las condiciones de continuidad. La función de confiabilidad con los parámetros Betha 1, Betha 2, Etha 1 y Etha 2 es
18.5 ALGORITMO EVOLUTIVO (GENETICO) La aplicación de estos modelos a una serie de conjuntos de datos, equipados con el EA descrito en la siguiente sección, se da en Bulmer y Eccleston (1998b). El objetivo principal del estudio es estimar la fiabilidad y las demandas de servicio de una fotocopiadora en particular. Esto requiere la estimación precisa de las distribuciones de fallas del sistema y componentes específicos. Los métodos más utilizados para esta tarea incluyen métodos gráficos [por ejemplo, consulte Jiang y Murthy (1995)], y métodos de estimación estadística como Máxima probabilidad, Bayesiano y Mínimos cuadrados. Las técnicas numéricas requeridas para estos métodos estadísticos generalmente se basan en valores iniciales razonables y, por consiguiente, la automatización de estos métodos es problemática. En consecuencia, es atractivo un método de estimación y modelado que pueda automatizarse y que no sea altamente dependiente o dependiente de la elección de los valores de los parámetros iniciales. Esto es particularmente importante para los métodos que consideraremos, que se basan en el remuestreo. Deseamos modelar los datos y estimar los parámetros relevantes de una manera óptima con respecto a un criterio apropiado. Algoritmos evolutivos (Michalewicz,1996) tienen las propiedades de (a) facilidad de automatización e independencia de los valores iniciales y (b) flexibilidad que permite una amplia clase de posibles funciones objetivas. Estos conceptos e ideas se describen y explican más detalladamente a continuación. El algoritmo evolutivo descrito aquí a menudo se conoce como un algoritmo genético por razones que se harán evidentes a continuación. La idea básica de un algoritmo genético
(Holland, 1975) es iterar una población de estimaciones de parámetros, en lugar de trabajar con un solo punto, como se hace usando métodos clásicos. Estas soluciones se "evolucionan" utilizando la selección natural, donde la aptitud física se mide según la proximidad del modelo resultante a los datos. La idea de biodiversidad ayuda al algoritmo a evitar los óptimos locales, que pueden surgir en los modelos complejos considerados aquí. A continuación se presenta un resumen del método y la descripción de los términos que utilizamos. Los genes de cada individuo en la población son simplemente sus estimaciones en valores reales para cada parámetro en el modelo. La población inicial tiene genes que se generan aleatoriamente desde un espacio de parámetros, con la aptitud de cada individuo calculada a partir del valor objetivo del modelo correspondiente. Una función objetiva es típicamente una medida de la bondad del ajuste de una solución a los datos. Se crea una nueva población eligiendo primero a los padres de la población actual al azar, con probabilidad proporcional a su condición física, y luego apareando para producir descendencia. La solución capturada por cada descendiente es una combinación afín aleatoria de las soluciones de sus padres. Es decir, los hijos de dos padres (x1, x2, ..., x n) y (y1, y2, ..., y n) son
donde c es un número aleatorio uniforme de [0,1]. Este proceso de cruce genético es el principal agente evolutivo. Sin embargo, la mutación también juega un papel importante al permitir la reintroducción de la información genética perdida. Este trabajo ha utilizado la "mutación dinámica" de Michalewicz y Janikow (1996), según la cual cada gen tiene una probabilidad constante de mutación, pero la escala de la mutación se reduce a medida que avanza la evolución. Dado un rango de valores para el parámetro que se está mutando, una desviación se elige uniformemente por encima o por debajo del valor actual. Esta desviación es entonces escalada por el factor
donde es uniforme sobre [0,1], t es el número de generación actual de T generations, y es un parámetro del sistema que rige la rapidez con la que se reduce la escala de mutación. Este operador recuerda la función de Boltzmann en el corazón del recocido simulado (Van Laarhoven y Aarts, 1987), inicialmente permitiendo el acceso al espacio de búsqueda completo y luego restringiendo el sistema a movimientos locales a medida que la población se "enfría". Los métodos de punto flotante no son de ninguna manera el único enfoque para la optimización genética de valor real. Los primeros experimentos de De Jong (De Jong, 1975)
utilizaron la optimización de funciones y la codificación binaria para explorar el comportamiento de los sistemas adaptativos. También se ha utilizado una codificación binaria en el modelado de confiabilidad (Bulmer y Eccleston, 1998a). Una ventaja del enfoque del algoritmo genético es que la selección natural no hace suposiciones sobre la función objetivo, como la diferenciabilidad o incluso la continuidad. Esto significa que se pueden incorporar fácilmente nuevos modelos y funciones objetivas. El motor del algoritmo genético requiere solo una especificación de los parámetros y una expresión para la función de confiabilidad (y la probabilidad correspondiente, si es necesario). Criterios de ajuste Además de seleccionar un modelo para ajustarse a los datos, junto con un método de "ajuste", se requiere un criterio de optimalidad para medir el ajuste de un modelo y luego determinar cuál es el de "mejor ajuste". Esta función objetivo debe ser una medida que se pueda utilizar para discriminar entre modelos y valores de parámetros. En este enfoque, la función objetivo se puede modificar fácilmente como se describe a continuación. Esta discusión se centrará en minimizar una suma de desviaciones cuadradas y maximizar la probabilidad. El método anterior, “mínimos cuadrados”, compara las estimaciones y los
valores de confiabilidad de la función de confiabilidad en el papel de trazado Weibull. El algoritmo también puede usar la suma mínima de desviaciones absolutas o el mínimo de la desviación máxima como una función objetivo. Los resultados son similares para todas las funciones objetivas y, en consecuencia, los resultados para las dos últimas no se incluyen aquí. El algoritmo se aplicó utilizando una población de tamaño 20, evolucionó en 1000 generaciones. Este proceso tomó poco menos de 3 segundos en una computadora portátil PowerBook de 400 MHz. 18.6 AJUSTE Y ANALISIS DE MODELOS El algoritmo genético descrito anteriormente se utilizó para ajustar los datos a los modelos descritos en la sección anterior. Weibull (2) denota los dos parámetros de Weibull distribución, y las otras distribuciones se denotan de una manera clara y obvia. El valor de la función objetivo, la suma de las desviaciones cuadradas definidas en la Sección 18.2, es la falta de ajuste entre los datos y el modelo ajustado y se denota como lo fin Tablas 18.1 a 18.4.
Los resultados se presentan a continuación en tablas junto con los gráficos adjuntos. En cada caso, estos incluyen los gráficos para el modelo de mejor ajuste y, para comparación, el del modelo estándar de Weibull (sin parámetro de retardo). Las estimaciones de los parámetros de cada modelo para el contador y el tiempo (días) en caso de fallo de todos los datos (fallo del sistema) y para la red de limpieza (fallo del componente) acompañados por el respectivo lofare dado. El modelo de mejor ajuste se resalta en letra cursiva en cada tabla. 18.6.1 Copias entre fallos del sistema La Tabla 18.1 muestra las estimaciones de parámetros obtenidas al encontrar ajustes de mínimos cuadrados de los modelos enumerados en la Sección 18.3. Se encontró una mezcla de dos distribuciones de Weibull para dar el lof más pequeño, indicado con cursiva. La mezcla indica que hay dos mecanismos de falla en juego o que hay uno que sufre un cambio brusco en algún momento. La última es la explicación probable porque más componentes se desgastan y fallan a medida que la máquina envejece. Esto fue visto anteriormente en la Figura 18.1. La figura 18.6 compara el modelo simple de Weibull (sin demora) con la mezcla obtenida. Como lo sugiere la Figura 18.1, la función principal de la mezcla ha sido adaptarse mejor a las fallas que fueron separadas por un gran número de copias.
18.6.2 Días entre fallos del sistema El modelo multiplicativo demostró ser el mejor para los datos de tiempo (días hasta fallas) para todos los datos; ver tabla 18.2. Este modelo se compara con un solo Weibull en las Figuras 18.7 y 18.9. Sin embargo, es interesante observar que el modelo de Weibull de tres parámetros no se ajusta a los datos y es un modelo más simple que el multiplicativo, como se muestra en la Figura 18.8. Un ajuste de modelo seccional, también se muestra en la Figura 18.8, es muy similar al modelo de tres parámetros. 18.6.3 Copias entre fallas en la limpieza de la web. Los datos del contador para la banda de limpieza se ajustaron bien mediante un modelo de mezcla (Tabla 18.3). Tenga en cuenta que la estimación de uno de los parámetros de forma (1) está cerca de 1 (0.851). Por lo tanto, un modelo exponencial simple podría ser un modelo de falla más apropiado en la vida temprana de la fotocopiadora, mientras que un modelo Weibull de dos parámetros podría ser más adecuado más adelante. El histograma para los datos confirma esto (ver Sección 18.3). 18.6.4 Días Entre Limpieza de Fallas Web Al igual que con los días entre fallas del sistema, la Tabla 18.4 muestra que la falla de la red de limpieza en términos de días parece ser mejor ajustada por un modelo multiplicativo, y
en la Figura 18.10 se muestra una comparación con un solo Weibull. Dado que el componente de limpieza es el componente que falla con más frecuencia, el acuerdo con el modelo por días hasta el fallo de todos los datos es tranquilizador. Nuevamente, los modelos de tres
parámetros y seccionales proporcionan ajustes comparablemente buenos, como se muestra en la Figura 18.11. 18.6.5 Métodos de remuestreo Los resultados anteriores proporcionan estimaciones de parámetros que se utilizan para resumir las observaciones con un modelo dado. La elección del modelo se puede hacer seleccionando y aplicando algún criterio, como minimizar las desviaciones al cuadrado en el papel de trazado de Weibull. Hay cuestiones importantes aquí, en particular la posibilidad de adaptar excesivamente los datos mediante la adición de modelos que son innecesariamente complicados. Sin embargo, incluso si la elección del modelo es clara, sigue existiendo la pregunta estadística fundamental sobre la precisión con que las estimaciones de los parámetros reflejan los valores reales del proceso de falla bajo investigación. El enfoque estándar para abordar esta pregunta es cuantificar la variabilidad del muestreo con un error estándar. Los errores estándar se pueden calcular analíticamente para modelos simples, pero esto no es práctico para muchos de los Weibull más complicados.
Modelos considerados aquí. En cambio, las estimaciones del error estándar se pueden obtener a través de técnicas de remuestreo como bootstrap y jackknife (Efron, 2000). La motivación inicial para el enfoque de EA fue automatizar el enfoque gráfico para el modelado de confiabilidad, mediante el cual los profesionales ajustarían las asíntotas a los gráficos de Weibull para estimar los parámetros del modelo. Esto requeriría mucho tiempo para aplicar con métodos de remuestreo, por lo que ajustamos los modelos de mínimos cuadrados en los diagramas de Weibull usando el EA en su lugar. El método bootstrap funciona tratando a la muestra como una población y tomando nuevas muestras, con reemplazo, de esta población. Los parámetros del modelo se estiman para cada nueva muestra, y la variabilidad observada en sus valores de muestra a muestra se puede usar para estimar el error estándar.
Desafortunadamente, para muestras pequeñas, particularmente aquellas tan pequeñas como la muestra de observaciones de limpieza de la web, las muestras bootstrap pueden no ser representativas de los datos originales. En particular, si hay dos modos de falla, entonces una nueva muestra puede, por casualidad, solo incluir observaciones de un tipo de falla. Los resultados pueden ser muy variables y difíciles de usar. Un problema adicional con las mezclas es que si la muestra se aleja demasiado del original, puede ser difícil determinar qué componente es cuál de los estimados de los parámetros. Por ejemplo, los datos del contador para la web de limpieza se modelaron mejor con una mezcla de Weibull donde p = 0.674. La aplicación de la EA a un conjunto resamplificado puede producir un valor de p = 0,45. No está claro si esto realmente es 0.45 o si debe ser 1 - 0.45 = 0.55, y las estimaciones de los dos componentes deben intercambiarse. Esto es particularmente difícil aquí ya que los parámetros de escala de los dos componentes también son similares. Se puede obtener cierta evidencia a partir de los parámetros de forma, pero
también se ha encontrado que son similares en muchas de las muestras, lo que hace que el proceso de arranque no sea confiable. Una alternativa es utilizar la técnica de navaja en su lugar. En lugar de generar una muestra completamente nueva cada vez, el jackknife genera nuevas muestras de tamaño n –
1 al omitir una observación a la vez de la muestra original de tamaño n. El proceso de estimación de parámetros se aplica a cada una de las nuevas muestras, y la variabilidad en los resultados se utiliza para estimar el error estándar. Este es un enfoque inherentemente más estable cuando se aplica a muestras pequeñas. La tabla 18.5 muestra los resultados del jackknife para el ajuste multiplicativo de los días entre fallas del sistema. Se puede ver, por ejemplo, que la estimación para 2 parece ser más precisa que la estimación para 1. Esto no es sorprendente cuando se compa ra con el gráfico de Weibull en la Figura 18.8. El primer componente (con 1 = 115) captura el pequeño número de observaciones con un número bajo de días entre fallas. Como solo hay unas pocas observaciones de este tipo, las estimaciones para este componente son naturalmente menos certeras que para el modo de falla mayor. El jackknife puede usarse para identificar este tipo de situación, si se pasa por alto. 18.7 FALLAS EN EL MODELADO A LO LARGO DEL TIEMPO El supuesto subyacente en todos los modelos hasta ahora es que los tiempos entre las llamadas de servicio para la fotocopiadora son independientes. Este es el supuesto de un proceso de renovación, en el que el sistema es como nuevo después de una falla. Esto es
plausible para los componentes individuales, como la banda de limpieza, que se reemplazan en lugar de reparar. Sin embargo, a nivel del sistema es probable que las fallas se vuelvan más frecuentes a medida que la fotocopiadora envejece, como lo sugiere la gráfica de tiempo en la Figura 18.1. El seguimiento
las secciones muestran cómo se puede estimar el número esperado de fallas en estas dos configuraciones. 18.7.1 Funciones de renovación de la web de limpieza Dado que es razonable modelar los reemplazos de limpieza de la web como un proceso de renovación, una caracterización útil del proceso es la función de renovación, M (t). La función proporciona el número esperado de fallas en [0, t) y se describe mediante una ecuación integral que involucra la función de falla [consulte Blischke y Murthy (1994)]. Desafortunadamente, para todas las funciones de falla menos las más simples, como la exponencial, esta ecuación integral no tiene solución de forma cerrada. La Figura 18.12 muestra los resultados de la resolución numérica de esta ecuación, primero para el modelo de mezcla de Weibull utilizado con las copias entre los datos de reemplazo (ver Sección 18.6.3) y luego para el modelo de Weibull multiplicativo usado con los días entre los datos de reemplazo (Sección 18.6). .4). Al principio de la vida de la copiadora, el componente de la mezcla con  pequeño domina. Esto resulta en una caída en la función de renovación ya que este componente tenía  = 5.23. Además, ambos componentes tienden a una función de renovación lineal. El mismo patrón se mantiene para el modelo basado en días entre fallas. La función de renovación se puede utilizar para estimar la cantidad de componentes necesarios durante ciertos períodos de tiempo. Por ejemplo, usando el modelo basado en días, en el primer año se estima que M (365) - M (0) = 2.83 telas de limpieza serán necesarias para esta copiadora, mientras que en el segundo año M (2 · 365) - M (365) = 5.87 - 2.83 = 3.04 se requerirán redes de limpieza. Del mismo modo, la función de renovación estima que en la primera se reemplazarán 100,000 copias de 1.29 redes de limpieza, mientras que en las segundas 100,000 copias se necesitarán 1.32 redes de limpieza. La tabla 18.6 muestra otros valores derivados de la función de renovación.
18.7.2 Fallo del sistema como un proceso de punto no estacionario La figura 18.13 resume las fallas del sistema al trazar la cantidad de fallas en función del tiempo. La trama será una función escalonada, que se incrementará en uno en cada momento de falla.
Si los tiempos entre fallas vinieron independientemente de una distribución exponencial, entonces esta gráfica debería seguir aproximadamente una línea recta. En cambio, parece curvado, con la sección más empinada correspondiente a tiempos más cortos entre fallas, lo que sugiere en general que las fallas son cada vez más frecuentes con la edad. La curva de esta función de paso se puede modelar usando una función de potencia de la forma
Los dos parámetros se pueden determinar utilizando el ajuste de mínimos cuadrados o mediante la estimación de máxima verosimilitud. La figura 18.13 muestra las funciones de potencia ajustadas obtenidas por mínimos cuadrados. Para el tiempo en el número de copias, los valores de los parámetros son alfa = 1.64 y Betha = 118.400. Por el tiempo en días, Alpha = 1.55 y Betha = 157.5. Las funciones ajustadas se pueden usar directamente para estimar el número esperado de fallas en intervalos de tiempo especificados. Por ejemplo, en el próximo año esperaríamos A (365) - A (0) = 3.7 fallas, mientras que en el año siguiente esperaríamos A (2 · 365) - A (365) = 10.8 - 3.7 = 7.1 fallas. La tabla 18.7 da un rango de predicciones similares. Dado que la cantidad estimada de llamadas de servicio aumenta cada año, llegará un momento en el que será más barato reemplazar la copiadora en lugar de pagar los costos de servicio. En consecuencia, la edad de la máquina será un factor importante al momento de
celebrar un contrato de servicio. Los detalles precisos dependerán de los costos particulares del servicio. La derivada de la función de potencia es la función de intensidad estimada. Lamda (t) = A` (t). Esta función proporciona el número esperado de fallas por unidad de tiempo. Figura 18.14 muestra las funciones de intensidad frente al tiempo en número de copias y en días.
Ambos sugieren un aumento constante en la tasa de fallas del sistema durante la vida útil de la fotocopiadora, aunque con un aumento relativamente lento. 18.7.3 Predicciones de Weibull Fits. Además de las predicciones dadas en las Tablas 18.6 y 18.7, los modelos de Weibull para el tiempo entre fallas se pueden usar para describir el proceso de falla en una variedad de formas. Por ejemplo, considere el modelo multiplicativo para los días entre la falla de la limpieza de la web. Este modelo predice un tiempo medio entre fallas de 120.1 días con una desviación estándar de 90.2 días. La función de falla también se puede usar para hacer predicciones adicionales relevantes para los inventarios. Por ejemplo, supongamos que un proveedor de servicios está buscando una sola copiadora y desea mantener el inventario al mínimo sin dejar que los tiempos de servicio sufran. Un criterio que podría usarse es especificar que una red de limpieza de reemplazo debe estar disponible el 95% del tiempo. La función de falla para el modelo ajustado muestra que la probabilidad de un tiempo de falla de menos de 26 días es alrededor 5%. Por lo tanto, si un proveedor de mantenimiento que presta servicio a esta copiadora única puede reabastecer las redes de limpieza dentro de los 26 días posteriores a la sustitución de una, el cliente solo tendrá que esperar una parte del 5% del tiempo. Este tipo de análisis es
uno de los principales objetivos de modelar los datos de tiempo de falla; El modelo ajustado puede utilizarse para responder a una amplia gama de preguntas sobre los posibles resultados futuros. 18.8 CONCLUSIONES El enfoque de EA ha demostrado ser un método útil para ajustar un rango de posibles distribuciones a fallas observadas. Esto
se
puede
utilizar,
en
combinación
con
dominio
específico
juicio, para decidir sobre un "mejor" modelo para usar. Naturalmente, es más lento que los métodos de optimización tradicionales, como los que se basan en la búsqueda de gradientes, pero su solidez es deseable para un sistema general de ajuste de modelos. El enfoque de remuestreo descrito es un medio simple de aumentar las estimaciones de parámetros con medidas de confianza. Tal remuestreo puede ser problemático para muestras pequeñas o para mezclas en las que un componente es muy raro, como lo discuten Bulmer y Eccleston (1998a). Sin embargo, tales problemas son fácilmente visibles y, en general, la capacidad de dar estimaciones de confianza enriquece enormemente el proceso de modelado. REFERENCES
Blischke, W. R., and Murthy, D. N. P. (1994). Warranty Cost Analysis, Marcel Dekker, New York. Blischke, W. R., and Murthy, D. N. P. (2000). Reliability: Modeling, Prediction and Optimization, Wiley, New York. Bulmer, M., and Eccleston, J. A. (1998a). Reliability, Genetic Algorithms, and Resampling, Centre for Statistics Research Report #88, The University of Queensland, Brisbane. Bulmer, M. and Eccleston, J. A. (1998b). Automated reliability modelling with a genetic algorithm, Proceedings, 6th International Applied Statistics in Industry Conference, Mel bourne, pp. 1 – 8. De Jong, K. A. (1975). An Analysis of the Behavior of a Class of Genetic Adaptive Systems, Ph.D. thesis, University of Michigan, Ann Arbor.
Efron, B. (2000). The bootstrap and modern statistics, Journal of theAmerican Statistical Association 95:1293 – 1296. Holland, J. H. (1975). Adaptation in Natural and Artificial Systems, University of Michigan Press, Ann Arbor. Jiang, R., and Murthy, D. N. P. (1995), Modeling failure data by mixture of two Weibull distributions: A graphical approach, IEEE Transactions on Reliability 44:477 – 488. Michalewicz, Z. (1996). Genetic Algorithms + Data Structures = Evolution Programs, 3rd edition, Springer-Verlag, New York. Michalewicz, Z., and Janikow, C. Z. (1996). GENECOP: A genetic algorithm for numerical optimisation problems with linear constraints, Communications of the ACM 39(electron- ic supplement). Van Laarhoven, P. J. M., and Aarts, E. H. L. (1987). Simulated Annealing: Theory and Ap plications, Reidel, Holland. CEREMONIAS 18.1.Weibull Plotting Paper.Weibull plotting paper (WPP) traza ln ( – ln (Ri)) contra ln (ti), donde Ri es la confiabilidad estimada de cada vez que falla. Muestre que los datos que siguen un modelo de Weibull de dos parámetros aparecerán como una línea recta en WPP. ¿Cómo se relacionan la intersección y la pendiente de esta línea con los parámetros de Weibull? Los siguientes ejercicios usan Excel para el ajuste de modelo y bootstrapping. También puede utilizar su paquete estadístico favorito para estos ejercicios. 18.2. Regression.Based on Ejercicio 18.1, ajustando un modelo de Weibull de dos parámetros Los datos de tiempo de falla se pueden lograr con la mayoría de los paquetes estadísticos, así como con Microsoft Excel, usando regresión lineal. La siguiente tabla muestra los resultados de Excel para ajustar los días al fallo de la cuchilla de limpieza.
Reproduzca estos resultados en Excel ingresando los números de observación y los tiempos entre fallas (ordenados) (en días). Suponiendo que "Observación" se encuentra en la celda A1, la columna "log (t)" se ingresa rellenando = LN (B2), mientras que la columna "Mediana Rango" usa = 1- (A2-0.3) / (7 + 0.4), con "log ( – log (R))" dado por = LN (-LN (D2)). Use el asistente de gráficos para hacer un diagrama x-yscatter de "log ( – log (R))" contra "log (t)".
Hay una opción para agregar una línea de regresión lineal a la gráfica. Alternativamente, use las funciones INTERCEPT y PENDIENTE para obtener las estimaciones de los parámetros en la hoja de trabajo. 18.3. Bootstrap. El procedimiento en el Ejercicio 18.2 puede extenderse para dar estimaciones de bootstrap del error estándar de las estimaciones de parámetros. Siguiendo las celdas anteriores, haga una columna "Muestra" (G) con celdas dadas por = CEIL-ING (7 * RAND (), 1). Es decir, la columna proporciona una muestra de rutina de carga que indica cuáles de los tiempos de fallas originales deben incluirse. La siguiente columna (H) muestra los tiempos reales de falla usando = VLOOKUP (G2, A $ 2: B $ 8,2) + RAND () / 1000. Se agrega la pequeña cantidad de aleatoriedad para que podamos clasificarlos en orden usando la función RANK de Excel. Columna I, "Ordenado", utiliza = RANGO (H2, H $ 2: H $ 8,1). Las columnas restantes son como en el Ejercicio 18.2, con el rango mediano calculado usando los rangos en la columna I. La intersección y la pendiente se calculan usando INTERCEPT y PENDIENTE.
Cada vez que Excel recalcula la hoja de trabajo, obtiene una muestra aleatoria (correa de arranque) diferente y los valores correspondientes de intercepción y pendiente, pero estos desaparecen cada vez. Para hacer un registro de las estimaciones de arranque, podemos usar una tabla de datos en Excel. Por ejemplo, llene una serie de 1, 2,. . . , 30 en celdas G11 a G40. En la celda H10, coloque una referencia a la estimación de pendiente (= M5 en el ejemplo anterior). Seleccione las celdas G10 a H40 y elija Tabla del Datamenú. Ingrese la dirección de cualquier celda en blanco para la entrada de la columna (ya que en realidad no estamos cambiando un parámetro). Al hacer clic en Aceptar se producirá una tabla de 30 estimaciones de bootstrap para la pendiente. Calcule la media y la desviación estándar de estos. Repita la configuración con un número mayor de muestras (al menos 200). Interpreta los resultados. 18.4. Copias entre fallas. Repita el análisis en los Ejercicios 18.2 y 18.3 utilizando las copias entre fallas para la cuchilla de limpieza, en lugar de los días entre fallas. 18.5.Modelos. ¿El modelo de dos parámetros parece apropiado para los datos de la lámina de limpieza, con fallos medidos en copias o en días? Discuta cualquier característica importante no capturada por la línea recta en WPP.
18.6.Otros componentes. El apéndice proporciona los tiempos de falla para un rango de otros componentes reemplazados durante el mantenimiento de la fotocopiadora. Repita el estudio en los Ejercicios 18.2 a 18.5 para otros componentes. 18.7. Suposición de renovación. El análisis que aquí se presenta hace una serie de suposiciones sobre los tiempos de falla. Por ejemplo, se supone que un componente se reemplaza porque ha fallado y que un nuevo componente tendrá la misma distribución de fallas que un componente antes en la vida de la copiadora. Discuta la validez de estos y cualquier suposición relacionada en términos de la diferencia entre la falla del sistema y la falla de los componentes para una fotocopiadora. APÉNDICE Los datos registrados del historial de servicio de la fotocopiadora se indican a continuación. Cada fila describe una parte que se reemplazó, con el número de copias realizadas en el momento del reemplazo, la antigüedad de la máquina en días y el componente reemplazado. La mayoría de los servicios implicaban el reemplazo de múltiples componentes.