Tal como lo indicamos recientemente; desde que Minitab liberó hace un par de años su versión 19, ya tenía incorporada la herramienta CART (Classification and Regression Trees). CART, es el fundamento para el desarrollo de muchos de los algoritmos que se usan hoy en día en Machine Learning, para postular modelos predictivos, cuya semejanza con el modelo verdadero son bastante interesantes. ¿Lo anterior, de qué va a depender? sin duda de las bondades del algoritmo y fundamentalmente de la forma en que éste se configure, para que entregue un modelo, acompañado de una serie de indicadores de eficacia como el Coeficiente de Determinación o “R-cuadrado” y de gráficos, que le permitirán a usted como analista, concluir si el modelo es suficientemente apropiado al propósito buscado en el modelamiento. Respecto a la forma en que se está abordando el modelamiento predictivo, tenemos un punto de vista discrepante con algunas organizaciones que han formado áreas o departamentos de Ciencias de Datos; que por la vía de lenguajes como Python, abordan la codificación de programas que utilizan algoritmos complejos, para resolver modelos predictivos. Sin embargo, a menos que sea algo muy específico; las herramientas que incorpora en esta última versión Minitab 21 con su Módulo de Analítica Predictiva; le van a permitir a los profesionales de procesos, utilizar algunos de los algoritmos tan elaborados como TreeNet o Random Forest -que ya están disponibles en la versión 21– para ser utilizados de manera relativamente simple.
De esta forma y con algunas orientaciones o capacitaciones acotadas, le permitirán a esos profesionales que operen los procesos, usar los datos disponibles en los sistemas de su empresa, para incursionar en modelos predictivos de Machine Learning, evitando la codificación de programas; ya que tan sólo en minutos tendrá un Modelo Predictivo de su proceso. Hecho esto, podrá ensayar algunos otros datos de su interés y lo más atractivo, es que por su simplicidad, día a día puede estar actualizando automáticamente su modelo mediante la “Consulta de Datos a ODBC” con macros que se pueden programar desde Minitab.
Le invitamos a acceder a nuestro video https://youtu.be/yEU9OLdAgWg que en 32 minutos lo va a guiar conceptualmente desde la Regresión Simple pasando por las regresiones múltiples no lineales, hasta finalizar con la Regresión CART®; que crea árboles de decisión para una respuesta continua con muchas variables predictoras categóricas y continuas, mostrando con ejemplos, como la regresión CART® ilustra los patrones y relaciones importantes entre una respuesta continua y los predictores por nivel de importancia o impacto en el comportamiento de la variable objetivo que se pretende analizar con la regresión CART.
En artículos siguientes y tomando como base el desarrollo conceptual del video ya indicado, vamos a ir directo al uso de los 2 algoritmos que hoy se incorporan al Módulo de Analítica Predictiva; la utilización del algoritmo Treenet y a continuación el de Random Forest que los restringiremos por ahora tan sólo a Regresiones, más adelante podremos incluir las opciones de Clasificación; que son las apropiadas para el caso en que el objetivo del modelamiento sea el comportamiento de una variable discreta, como categorías de aceptación, que son muy comunes en procesos transaccionales.
Esperemos que nuestro video le ayude a visualizar -que usted como analista de su proceso, si necesita obtener modelos predictivos de procesos multivariables no lineales, que incluso pueden incluir predictores categorizados- no requiere codificar programas para usar algoritmos de machine learning, ni tampoco del apoyo de un profesional en Ciencias de Datos, sólo se requiere un abordaje profesional de análisis de datos con buenas herramientas y con el conocimiento apropiado. Quality le puede proponer agendas de cursos adecuados a sus necesidades o apoyarlo en el análisis de datos; si su necesidad fuera más inmediata http://www.quality.cl
Leave A Comment