Transformación digital en la empresa: Análisis Predictivo

Visitas: 373

Coincidiendo con nuestros eventos anuales que tienen lugar por varias ciudades a lo largo y ancho de toda España, vamos a lanzar una serie de monográficos dedicados a ayudar a las organizaciones a adoptar su transformación digital.

Este primer artículo lo vamos a dedicar a una de las principales tendencias de la analítica de negocio: el análisis predictivo. Y es que hablar de análisis predictivo en el mundo empresarial es como hablar del santo grial para un directivo o decisor de cualquier compañía. Decidir es con mucho la más compleja y difícil acción a la que se tiene que enfrentar una persona en su vida laboral. Todos tenemos miedo a equivocarnos y sobretodo a las consecuencias de un error, y más hoy día, donde nuestras circunstancias cambian de forma muy rápida y hay más factores externos que escapan a nuestro control e influyen en nuestras decisiones. Disponer de una herramienta que nos permita conocer a priori qué es lo más probable que ocurra, constituiría un activo capital y un factor competitivo considerable para cualquier empresa.

Tal y como expone Gartner en el gráfico anterior, el análisis predictivo es dar un paso más en la analítica de negocio que estamos llevando acabo actualmente. Partiendo de los datos de los que disponemos, definimos métricas que nos permiten controlar cómo van los  diferentes procesos de negocio: el siguiente paso es intentar anticiparnos a lo que es probable que ocurra, para reaccionar a tiempo.

Seamos honestos, ¿realmente existe la posibilidad de predecir?

El objetivo del análisis predictivo es implementar una serie de procesos, técnicas y sistemas que permitan extraer patrones o leyes a partir de un conjunto de sucesos o hechos, mediante el análisis automático de datos, para así poder conocer lo que puede suceder en el futuro y por tanto, tomar la decisión más óptima con respecto a ese posible suceso.

Brandon Stark | Game of Thrones by CAraracap

En realidad, no nos estamos convirtiendo en Brandon Stark y el cuervo de tres ojos, sino que realmente estamos realizando un proceso de inferencia de lo que es probable que ocurra basándonos en el procesado de un conjunto de datos.  Curiosamente, técnicamente hablando, las Tecnologías de la Información llevan años facilitándonos la implementación del análisis predictivo: los algoritmos, la estadística y los modelos matemáticos existían; teníamos capacidad de construir la infraestructura: procesadores, almacenamiento, memoria; teníamos software para almacenar, para procesar y para distribuir. ¿Qué es lo que ha cambiado entonces?

Gracias a las tecnologías aparecidas en los últimos años (sistemas de computación distribuida, sistemas en la nube, bases de datos no relacionales, etc.) estamos viviendo una profunda transformación digital de nuestra sociedad que nos permite disponer de muchísima más información (tanto interna a nuestra organización como externa a ella) y de la capacidad de procesarla  a un coste relativamente asequible. El hecho de disponer de más información es lo que va a facilitarnos tanto la implementación de nuestro sistema de predicción como mejorar su efectividad.

Entendiendo este contexto, vemos qué es factible hoy día plantearnos el despliegue de sistemas de predicción en nuestras compañías. Vamos a ver cómo.

Vale. Compro. ¿Cómo lo hacemos?

En primer lugar, debemos contar con una metodología que nos permita lograr el objetivo que nos hemos marcado, minimizando los riegos. Afortunadamente existe una metodología estándar para la implantación de Sistemas de Análisis Predictivo (independiente del método que escojamos): es la conocida como CRISP-DM (Cross Industry Standard Process for Data Mining).

Fuente: Wikipedia

Sin entrar en muchos detalles formales, podemos afirmar que el análisis predictivo pertenece al conjunto de técnicas conocidas como minería de datos (Data Mining), que actualmente viene a denominarse ciencia de datos (Data Science). En definitiva, estas disciplinas lo que vienen a constituir es una serie de principios, procesos y técnicas que permiten entender sucesos o hechos mediante el análisis (automático) de datos.

La mayor parte de estos modelos se basan en una rama de la inteligencia artificial (Artificial Intelligence, AI) denominada aprendizaje automático (Machine  Learning , ML). Esta disciplina consiste en la creación de programas que a partir de una información o conjunto de datos mediante la aplicación de un algoritmo obtenga una conclusión; o en otras palabras, que una máquina pueda aprender o extraer conocimiento a partir de una información.

Podemos clasificar las diferentes técnicas de análisis predictivo en:

  • Modelos predictivos: Son los basados en Algoritmos de Aprendizaje Supervisado y permiten estimar el valor de una variable o atributo.  A su vez,  podemos clasificarlos en:

    • Modelos de clasificación: Son aquellos que se emplean cuando la variable a estimar es un valor discreto (o cualitativo); es decir, una variable del tipo Sí o No o que puede tomar un conjunto finito de valores.  Como ejemplo de caso de uso, podríamos citar la predicción de morosidad de un cliente.
    • Modelos de regresión: Son aquellos que se emplean cuando la variable a estimar es un valor contínuo (o cuantitativo). Como ejemplo de caso de uso, intentar predecir el importe de las ventas.
  • Modelos descriptivos: Son los basados en Algoritmos de Aprendizaje No Supervisado y permiten detectar patrones, reglas o relaciones entre los diferentes atributos.  A su vez estos modelos lo podemos clasificar en:

    • Modelos de asociación: Son aquellos modelos que permiten descubrir reglas o proposiciones lógicas entre los atributos del conjunto de datos. Estas reglas son del tipo: Si At1=a y At2=b y... Entonces Atn=c. El caso de uso típico de las reglas de asociación es el análisis de la cesta de la compra: clientes que compraron el producto X compraron también el producto Y. La bondad del método viene determinada por dos características fundamentales:

      • Precisión (confidence): Nº veces que la regla es correcta.
      • Cobertura (support): Frecuencia de ocurrencia de la regla en los datos
    • Modelos de agrupamiento (Clustering): Son aquellos modelos que nos permiten agrupar sucesos que presentan valores de sus atributos similares entre sí.  Sin entrar en muchos detalles matemáticos, estos modelos se utilizan cuando todos las variables pueden ser traducidas a valores numéricos y lo que hacen estos algoritmos matemáticos es agrupar (discretizar) los distintos elementos en rangos de valores. Ejemplo: agrupar a clientes por su rango salarial y conocer su comportamiento para predecir bajas en el servicio.   
    • Modelos de secuenciación: Son aquellos que nos permiten detectar secuencias o episodios frecuentes en los datos; es decir, detectar reglas de asociación (o  incluso clusters) que se repiten a menudo en nuestro conjuntos de datos.

Esto no parece sencillo. ¿Hay alguna herramienta que nos lo haga más fácil?

Tradicionalmente las herramientas disponibles para la elaboración de estos modelos han estado orientadas a matemáticos, ingenieros y científicos. Herramientas como R o Python son muy potentes a nivel numérico pero bastante áridas respecto a visualización.  Aunque existen otros entornos más gráficos como KNIME o RapidMiner, siguen siendo poco intuitivas para un usuario final.

En el mundo de la analítica de negocio contamos con herramientas que nos permiten analizar la información de una forma visual e intuitiva.  Una de las herramientas que mejor facilita esta tarea es Qlik Sense.

En la actual versión 3.1 disponemos de dos características completamente diferenciales :

  • Preparación visual de los datos. Qlik Sense calcula de forma automática las posibles relaciones  existentes entre los datos,  diciéndonos cuánto “se parecen” entre sí diferentes tablas. Como una imagen vale más que mil palabras, se puede ver en el vídeo a continuación:
  • Integración con R y Python. Dado que R y Python son las herramientas más utilizadas para implementar los algoritmos de análisis predictivo, contamos con muchos scripts, librerías ya preparados  y disponibles de forma libre en Internet. Qlik Sense permite almacenar y llamar a estas librerías mediante funciones. Más información en Qlik.

Para ampliar más información, tiene disponible para su descarga «El libro blanco del análisis predictivo».

Autor

Imagen de Mario De Felipe Pérez

Director Área Business Analytics