Mondragon Innovation | Humanity at work – Predicción de módulos de Creep de polímeros mediante Machine Learning
Mondragon Innovation | Humanity at work
Sector: Industria
Business Case
Los polímeros sometidos a una carga constante pierden rigidez con el tiempo debido al Creep. Los ensayos para medir este fenómeno son muy largos y costosos, por lo que la industria requiere técnicas alternativas. Una vez obtenida una base de datos, hemos explorado la utilidad del Machine Learning para la predicción de Creep.
Objetivos
Predecir los valores de módulo de Creep a tiempos largos con la mayor precisión posible, reduciendo el tiempo de los ensayos. Además, obtener modelos interpretables y generalizables, y comprender cuáles son los parámetros que más influyen en el fenómeno.
Use case
Primero, descargar, limpiar y construir la base de datos, que comprende más de 450 polímeros y más de 5000 curvas de Creep. Después, fittear y validar modelos de regresión de complejidad ascendente, obteniendo las mejores predicciones con modelos de Gradient Boosting (LightGBM).
Infraestructura
On Premise
Tecnologías utilizadas
Aprendizaje Automático o Profundo
Datos utilizados
Dataset en formato de tabla, obtenido de la base de datos libre y gratuita campusplastics.com
Recursos utilizados
El proyecto parte de una línea de investigación con más de 5 investigadores. La descarga de la base de datos fue subcontratada, mientras que para el resto se contó con el trabajo de un investigador a tiempo completo durante 2-3 meses y la ayuda de un experto de Mondragon Unibertsitatea (40 horas).
Dificultades y aprendizaje
Por un lado la dificultad de obtener una base de datos completa, sin fallos y variada (representativa). Por otro, la dificultad para poder confiar en las predicciones, es decir, de estimar la capacidad de predicción de los modelos de manera realista. Además, la organización en el trabajo y el registro de los experimentos ha sido fundamental.
KPIs (impacto en el negocio y métricas del modelo)
Para cuantificar y comparar la precisión de los modelos, utilizamos el score de coeficiente de determinación (R²). Para medir la capacidad de generalización de la manera más realista posible utilizamos la validación cruzada anidada (Nested/Double CV), siguiendo las buenas prácticas en informática de materiales para hacer el splitting.
Financiación
Financiación Mondragon para la financiación de la colaboración con la Universidad de Mondragon.