Logotipo de Zephyrnet

Predecir tipos de fallas de máquinas con aprendizaje automático sin código usando Amazon SageMaker Canvas

Fecha:

Predecir los tipos comunes de fallas de las máquinas es fundamental en las industrias manufactureras. Dado un conjunto de características de un producto que está vinculado a un tipo de falla determinado, puede desarrollar un modelo que pueda predecir el tipo de falla cuando alimenta esos atributos a un modelo de aprendizaje automático (ML). ML puede ayudar con los conocimientos, pero hasta ahora necesitaba expertos en ML para crear modelos para predecir los tipos de fallas de las máquinas, cuya falta podría retrasar las acciones correctivas que las empresas necesitan para lograr eficiencias o mejoras.

En esta publicación, le mostramos cómo los analistas de negocios pueden construir un modelo ML de predicción de tipo de falla de máquina con Lienzo de Amazon SageMaker. Canvas le proporciona una interfaz visual de apuntar y hacer clic que le permite crear modelos y generar predicciones precisas de ML por su cuenta, sin necesidad de experiencia en ML ni tener que escribir una sola línea de código.

Resumen de la solución

Supongamos que es un analista comercial asignado a un equipo de mantenimiento de una gran organización de fabricación. Su equipo de mantenimiento le ha pedido que ayude a predecir fallas comunes. Le han proporcionado un conjunto de datos históricos que contiene características vinculadas a un tipo de falla determinado y les gustaría que predijera qué falla ocurrirá en el futuro. Los tipos de falla incluyen Sin falla, Sobreesfuerzo y Fallas de energía. El esquema de datos se muestra en la siguiente tabla.

Nombre de columna Tipo de datos Descripción
UID INT Identificador único que va de 1 a 10,000 XNUMX
ID del Producto CADENA Consta de una letra (L, M o H para baja, media o alta) como variantes de calidad del producto y un número de serie específico de la variante
tipo CADENA Letra inicial asociada con productID que consta de L, M o H únicamente
temperatura del aire [K] DECIMAL Temperatura del aire especificada en kelvin
temperatura de proceso [K] DECIMAL Temperaturas controladas con precisión para garantizar la calidad de un determinado tipo de producto especificado en kelvin
velocidad de rotación [rpm] DECIMAL La velocidad de rotación de un objeto que gira alrededor de un eje es el número de vueltas del objeto dividido por el tiempo, especificado como revoluciones por minuto.
par [Nm] DECIMAL Fuerza de giro de la máquina a través de un radio, expresada en newton metros
desgaste de herramienta [min] INT Desgaste de herramienta expresado en minutos
tipo de falla (objetivo) CADENA Sin falla, falla de energía o falla de sobreesfuerzo

Una vez que se identifica el tipo de falla, las empresas pueden tomar cualquier acción correctiva. Para ello, utiliza los datos que tiene en un archivo CSV, que contiene ciertas características de un producto como se indica en la tabla. Usa Canvas para realizar los siguientes pasos:

  1. Importe el conjunto de datos de mantenimiento.
  2. Entrene y construya el modelo de mantenimiento predictivo de máquinas.
  3. Analizar los resultados del modelo.
  4. Probar predicciones contra el modelo.

Requisitos previos

Un administrador de la nube con un Cuenta de AWS con los permisos apropiados es necesario completar los siguientes requisitos previos:

  1. Implementar un Amazon SageMaker dominio Para obtener instrucciones, consulte Incorporación al dominio de Amazon SageMaker.
  2. Lanzar lienzo. Para obtener instrucciones, consulte Configuración y administración de Amazon SageMaker Canvas (para administradores de TI).
  3. Configure las políticas de uso compartido de recursos de origen cruzado (CORS) para Canvas. Para obtener instrucciones, consulte Ofrezca a sus usuarios la posibilidad de cargar archivos locales.

Importar el conjunto de datos

Primero, descargue el conjunto de datos de mantenimiento y revise el archivo para asegurarse de que todos los datos estén allí.

Canvas proporciona varios conjuntos de datos de muestra en su aplicación para ayudarlo a comenzar. Para obtener más información sobre los conjuntos de datos de muestra proporcionados por SageMaker con los que puede experimentar, consulte Usar conjuntos de datos de muestra. Si usa el conjunto de datos de muestra (canvas-sample-maintenance.csv) disponible en Canvas, no tiene que importar el conjunto de datos de mantenimiento.

Puede importar datos de diferentes fuentes de datos a Canvas. Si planea usar su propio conjunto de datos, siga los pasos en Importación de datos en Amazon SageMaker Canvas.

Para esta publicación, usamos el conjunto de datos de mantenimiento completo que descargamos.

  1. Inicia sesión en el Consola de administración de AWS, usando una cuenta con los permisos apropiados para acceder a Canvas.
  2. Inicie sesión en la consola de Canvas.
  3. Elige Importa.
  4. Elige Subir y seleccione el maintenance_dataset.csv archivo.
  5. Elige Importar fechas para subirlo a Canvas.

Importar el conjunto de datos

El proceso de importación tarda aproximadamente 10 segundos (esto puede variar según el tamaño del conjunto de datos). Cuando esté completo, puede ver que el conjunto de datos está en Ready de estado.

Después de confirmar que el conjunto de datos importado es ready, puede crear su modelo.

Construir y entrenar el modelo.

Para crear y entrenar su modelo, complete los siguientes pasos:

  1. Elige Nuevo modeloy proporcione un nombre para su modelo.
  2. Elige Crear.
  3. Seleccione maintenance_dataset.csv conjunto de datos y elija Seleccionar conjunto de datos.
    En la vista del modelo, puede ver cuatro pestañas, que corresponden a los cuatro pasos para crear un modelo y usarlo para generar predicciones: Seleccione, Construcción, Analizary Predicción.
  4. En Seleccione , seleccione maintenance_dataset.csv conjunto de datos que cargó anteriormente y elija Seleccionar conjunto de datos.
    Este conjunto de datos incluye 9 columnas y 10,000 filas. Canvas pasa automáticamente a la fase de construcción.
  5. En esta pestaña, elija la columna de destino, en nuestro caso Tipo de fallaEl equipo de mantenimiento le ha informado que esta columna indica el tipo de fallas que normalmente se observan en función de los datos históricos de sus máquinas existentes. Esto es lo que quiere entrenar a su modelo para predecir. Canvas detecta automáticamente que se trata de un Categoría 3 problema (también conocido como clasificación multiclase). Si se detecta el tipo de modelo incorrecto, puede cambiarlo manualmente con el Cambiar tipo .
    Cabe señalar que este conjunto de datos está muy desequilibrado hacia la clase Sin fallas, lo que se puede ver al ver la columna denominada Tipo de falla. Aunque Canvas y las capacidades subyacentes de AutoML pueden manejar parcialmente el desequilibrio del conjunto de datos, esto puede resultar en algunos rendimientos sesgados. Como siguiente paso adicional, consulte Equilibre sus datos para el aprendizaje automático con Amazon SageMaker Data Wrangler. Siguiendo los pasos del enlace compartido, puede iniciar una Estudio Amazon SageMaker app desde la consola de SageMaker e importe este conjunto de datos dentro Wrangler de datos de Amazon SageMaker y use la transformación de datos Balance, luego lleve el conjunto de datos balanceado de regreso a Canvas y continúe con los siguientes pasos. Estamos procediendo con el conjunto de datos desequilibrados en esta publicación para mostrar que Canvas también puede manejar conjuntos de datos desequilibrados.
    En la mitad inferior de la página, puede ver algunas de las estadísticas del conjunto de datos, incluidos los valores faltantes y no coincidentes, los valores únicos y los valores medios y medianos. También puede eliminar algunas de las columnas si no desea usarlas para la predicción simplemente deseleccionándolas.
    Después de haber explorado esta sección, ¡es hora de entrenar el modelo! Antes de construir un modelo completo, es una buena práctica tener una idea general sobre el rendimiento del modelo entrenando un modelo rápido. Un modelo rápido entrena menos combinaciones de modelos e hiperparámetros para priorizar la velocidad sobre la precisión, especialmente en los casos en los que desea demostrar el valor de entrenar un modelo ML para su caso de uso. Tenga en cuenta que la opción de compilación rápida no está disponible para modelos de más de 50,000 XNUMX filas.
  6. Elige Construcción rápida.

construcción de maquetas en curso

Ahora espera entre 2 y 15 minutos. Una vez hecho esto, Canvas se mueve automáticamente a la Analizar pestaña para mostrarle los resultados del entrenamiento rápido. El análisis realizado con compilación rápida estima que su modelo es capaz de predecir el tipo de falla correcto (resultado) el 99.2 % de las veces. Puede experimentar valores ligeramente diferentes. Esto se espera.

Centrémonos en la primera pestaña, General. Esta es la pestaña que te muestra la Impacto de columna, o la importancia estimada de cada columna en la predicción de la columna de destino. En este ejemplo, las columnas Torque [Nm] y Rotational speed [rpm] tienen el impacto más significativo en la predicción del tipo de falla que ocurrirá.

Analizar - Descripción general

Evaluar el rendimiento del modelo

Cuando te mudes al Scoring parte de su análisis, puede ver un gráfico que representa la distribución de nuestros valores pronosticados con respecto a los valores reales. Tenga en cuenta que la mayoría de las fallas estarán dentro de la categoría Sin fallas. Para obtener más información sobre cómo Canvas usa las líneas base de SHAP para llevar la explicabilidad a ML, consulte Evaluación del rendimiento de su modelo en Amazon SageMaker Canvas, así como Líneas base de SHAP para la explicabilidad.
evaluar las métricas del modelo

Canvas divide el conjunto de datos original en conjuntos de entrenamiento y validación antes del entrenamiento. La puntuación es el resultado de que Canvas ejecute el conjunto de validación contra el modelo. Esta es una interfaz interactiva donde puede seleccionar el tipo de falla. Si tu escoges Falla de sobreesfuerzo en el gráfico, puede ver que el modelo los identifica el 84% de las veces. Esto es lo suficientemente bueno como para tomar medidas, tal vez haga que un operador o ingeniero verifique más. Tu puedes elegir Power Failure en el gráfico para ver la puntuación respectiva para su posterior interpretación y acciones.

Es posible que le interesen los tipos de fallas y qué tan bien el modelo predice los tipos de fallas en función de una serie de entradas. Para echar un vistazo más de cerca a los resultados, elija Métricas avanzadas. Esto muestra una matriz que le permite examinar más de cerca los resultados. En ML, esto se conoce como matriz de confusión.

métricas avanzadas

Esta matriz tiene como valor predeterminado la clase dominante, Sin fallos. Sobre el Clase En el menú, puede optar por ver métricas avanzadas de los otros dos tipos de fallas: Falla por sobreesfuerzo y Falla de energía.

En ML, la precisión del modelo se define como el número de predicciones correctas dividido entre el número total de predicciones. Los recuadros azules representan las predicciones correctas que el modelo realizó frente a un subconjunto de datos de prueba donde había un resultado conocido. Aquí estamos interesados ​​en qué porcentaje de tiempo el modelo predijo un tipo de falla de máquina en particular (digamos Sin fallos) cuando en realidad es ese tipo de falla (Sin fallos). En ML, una relación utilizada para medir esto es TP / (TP + FN). Esto se conoce como recordar. En el caso predeterminado, Sin fallas, hubo 1,923 predicciones correctas de 1,926 registros generales, lo que resultó en un 99 % recordar. Alternativamente, en la clase de falla por sobreesfuerzo, hubo 32 de 38, lo que da como resultado un 84 % recordar. Por último, en la clase de Falla de Energía hubo 16 de 19, lo que da como resultado un 84% recordar.

Ahora, tú tienes dos opciones:

  1. Puede usar este modelo para ejecutar algunas predicciones eligiendo Predicción.
  2. Puedes crear una nueva versión de este modelo para entrenar con el Construcción estándar opción. Esto llevará mucho más tiempo (alrededor de 1 a 2 horas), pero proporciona un modelo más sólido porque pasa por una revisión completa de AutoML de datos, algoritmos e iteraciones de ajuste.

Debido a que está tratando de predecir fallas y el modelo predice fallas correctamente el 84 % de las veces, puede usar el modelo con confianza para identificar posibles fallas. Por lo tanto, puede continuar con la opción 1. Si no está seguro, puede hacer que un científico de datos revise el modelado que hizo Canvas y ofrezca posibles mejoras a través de la opción 2.

Generar predicciones

Ahora que el modelo está entrenado, puede comenzar a generar predicciones.

  1. Elige Predicción en la parte inferior de la Analizar página, o elija la Predicción .
  2. Elige Seleccionar conjunto de datosy elija el maintenance_dataset.csv archivo.
  3. Elige Generar predicciones.

Canvas utiliza este conjunto de datos para generar nuestras predicciones. Aunque generalmente es una buena idea no usar el mismo conjunto de datos para el entrenamiento y la prueba, puede usar el mismo conjunto de datos por simplicidad en este caso. Alternativamente, puede eliminar algunos registros de su conjunto de datos original que usa para el entrenamiento y usar esos registros en un archivo CSV y alimentarlo a la predicción por lotes aquí para que no use el mismo conjunto de datos para probar después del entrenamiento.

predicción por lotes
Después de unos segundos, la predicción está completa. Canvas devuelve una predicción para cada fila de datos y la probabilidad de que la predicción sea correcta. Tu puedes elegir Vista previa para ver las predicciones, o elegir Descargar para descargar un archivo CSV que contiene el resultado completo.

descargar predicción
También puede elegir predecir valores uno por uno eligiendo Predicción única en lugar de Predicción por lotes. Canvas le muestra una vista donde puede proporcionar los valores para cada característica manualmente y generar una predicción. Esto es ideal para situaciones como escenarios hipotéticos, por ejemplo: ¿Cómo afecta el desgaste de la herramienta al tipo de falla? ¿Qué pasa si la temperatura del proceso aumenta o disminuye? ¿Qué pasa si cambia la velocidad de rotación?

predicción única

Construcción estándar

La Construcción estándar opción elige la precisión sobre la velocidad. Si desea compartir los artefactos del modelo con su científico de datos e ingenieros de ML, puede crear una compilación estándar a continuación.

  1. Elige Agregar versión
    Construcción estándar: agregar versión
  2. Elija una nueva versión y elija Construcción estándar.elegir construcción estándar
  3. Después de crear una compilación estándar, puede compartir el modelo con científicos de datos e ingenieros de ML para una mayor evaluación e iteración.

Compartir modelo

Limpiar

Para evitar incurrir en el futuro cargos de sesión, cierre la sesión de Canvas.
Cerrar sesión de Canvas

Conclusión

En esta publicación, mostramos cómo un analista de negocios puede crear un modelo de predicción del tipo de falla de la máquina con Canvas usando datos de mantenimiento. Canvas permite a los analistas de negocios, como los ingenieros de confiabilidad, crear modelos de aprendizaje automático precisos y generar predicciones mediante una interfaz de apuntar y hacer clic, visual y sin código. Los analistas pueden llevar esto al siguiente nivel al compartir sus modelos con colegas científicos de datos. Los científicos de datos pueden ver el modelo de Canvas en Studio, donde pueden explorar las elecciones que hizo Canvas, validar los resultados del modelo e incluso llevar el modelo a producción con unos pocos clics. Esto puede acelerar la creación de valor basada en ML y ayudar a escalar mejores resultados más rápido.

Para obtener más información sobre el uso de Canvas, consulte Cree, comparta, implemente: cómo los analistas de negocios y los científicos de datos logran un tiempo de comercialización más rápido utilizando ML sin código y Amazon SageMaker Canvas. Para obtener más información sobre la creación de modelos ML con una solución sin código, consulte Anuncio de Amazon SageMaker Canvas: una capacidad de aprendizaje automático visual y sin código para analistas de negocios.


Acerca de los autores

Rajakumar Sampathkumar es Gerente Técnico Principal de Cuentas en AWS, brinda orientación a los clientes sobre la alineación de la tecnología comercial y apoya la reinvención de sus modelos y procesos de operación en la nube. Le apasiona la nube y el aprendizaje automático. Raj también es especialista en aprendizaje automático y trabaja con clientes de AWS para diseñar, implementar y administrar sus cargas de trabajo y arquitecturas de AWS.

twann atkins es Arquitecto de Soluciones Sénior para Amazon Web Services. Es responsable de trabajar con clientes de agricultura, comercio minorista y manufactura para identificar problemas comerciales y trabajar hacia atrás para identificar soluciones técnicas viables y escalables. Twann ha estado ayudando a los clientes a planificar y migrar cargas de trabajo críticas durante más de 10 años con un enfoque reciente en la democratización del análisis, la inteligencia artificial y el aprendizaje automático para clientes y constructores del mañana.

Omkar Mukadam es una arquitectura de soluciones de Edge Specialist en Amazon Web Services. Actualmente se enfoca en soluciones que permiten a los clientes comerciales diseñar, construir y escalar de manera efectiva con las ofertas de servicios de AWS Edge que incluyen, entre otros, AWS Snow Family.

punto_img

Información más reciente

punto_img

Habla con nosotros!

¡Hola! ¿Le puedo ayudar en algo?