El arte de segmentar clientes - Aml

Una de las partes fundamentales en cada negocio consiste en comprender a los clientes. Lo cual, se puede hacer con diferentes objetivos, desde crear campañas de ventas más acertadas hasta evitar delitos como el lavado de activos, por eso aquí te enseñaremos como el segmentar clientes puede convertirse en una herramienta poderosa para combatir los riesgos de LA/FT.

Una de las maneras en las que esto se puede realizar es agrupando aquellos clientes con características comunes, procedimiento conocido con el nombre de segmentación.

Los procesos de segmentación se pueden ejecutar de diferentes maneras, desde realizar la agrupación de manera manual con los conocimientos del negocio, hasta utilizar herramientas automatizadas como lo son los algoritmos de Machine Learning.

Esta última, en particular, ha sido ampliamente utilizada en los últimos años, debido a su versatilidad, rapidez y resultados acertados.

Ahora bien, para explicar el proceso de segmentación, primero debemos hablar sobre Machine Learning. Probablemente, en algún momento de nuestras vidas hemos escuchado esas dos palabras, que en español traducen aprendizaje automático.

Este concepto se refiere a una rama de la inteligencia artificial, en donde, una máquina aprende sin haber sido programada específicamente para ello.

A partir de esto, pueden surgir dos preguntas: ¿Qué significa aprender para una máquina? ¿Cómo aprende una máquina?

Para nosotros, los seres humanos, aprender consiste en adquirir nuevos conocimientos o destrezas [1]. Sin embargo, para una computadora este proceso consiste en utilizar datos para adaptar ciertas funciones matemáticas, las cuales permitirán encontrar patrones.

Por lo que, cuando utilizamos Machine Learning pareciera que la máquina aprendiera cuando en realidad solo está acomodando parámetros [2].

En este mismo orden de ideas, existen tres tipos de aprendizaje en Machine Learning que se pueden incluso asemejar a nuestra manera de aprender.

Tipos de aprendizaje

Aprendizaje supervisado: Este consiste en entregarle al algoritmo unos datos especificando su categoría de manera explícita. Por ejemplo, le ingresamos imágenes de gatos y perros poniendo de manera explícita la categoría a la que pertenece cada imagen. La idea es que el algoritmo vea tantas imágenes de gatos y perros que al final logré encontrar los patrones que identifican a cada animal [3].

Aprendizaje no-supervisado: Este consiste en usar un algoritmo que encuentre similitudes y diferencias entre diferentes elementos de un conjunto de datos sin haber especificado la categoría. Esto es bastante similar a pedirle a un niño que, por ejemplo, entre a una piscina de pelotas y organice grupos con estas. Probablemente, lo que el niño hará será hacer grupos entre aquellas que posean el mismo color [3].

Aprendizaje reforzado: En este, como su nombre lo dice, el algoritmo aprende por prueba, error y/o premio. Este se utiliza para los carros automatizados, en donde, se penaliza el algoritmo cuando, por ejemplo, el carro se choca o se sale de su curso y se premia cuando este sigue su curso de manera correcta [3].

Con lo anterior, podemos observar, que existe una gama muy amplia de algoritmos en Machine Learning y cada tipo de aprendizaje dependerá del problema particular al cual se enfrenta el modelador.

En el caso de la segmentación, la mayoría de algoritmos utilizan el aprendizaje no supervisado. Con el cual, se busca agrupar los clientes que tienen características comunes.

Matemáticamente, un algoritmo de segmentación consiste en encontrar los datos que estén más cercanos en distancia entre sí y con estos se forman un segmento, luego se toma otro grupo de datos que estén cercanos entre sí formando un nuevo segmento.

Por esta razón, uno de los principales problemas es encontrar el número de segmentos óptimo para un conjunto de datos, pues esto cambia de problema en problema.

De aquí surge la pregunta: ¿Qué define un número de segmentos óptimo?

La respuesta consiste en buscar segmentos que sean muy homogéneos entre sí, pero muy heterogéneos con el resto. Matemáticamente, esto se puede expresar como segmentos con puntos muy cercanos entre sí, pero la distancia entre segmentos debe ser grande.

Lo anterior nos lleva a definir una métrica que mide la distancia de un punto perteneciente a un segmento dado con todos los puntos pertenecientes a este y la distancia al resto de segmentos.

La idea es comparar estas distancias, si por ejemplo, un dato se encuentra muy cercano al resto de puntos de su grupo y muy lejano del resto de segmentos, esto se puede denominar como un punto bien segmentado.

Ahora bien, debe tenerse en cuenta que este proceso se realiza para todos los puntos, obteniendo como resultado final un solo coeficiente que es el promedio del coeficiente obtenido por cada punto. Por tanto, el número de segmentos óptimo será obtenido por aquel modelo con mejor coeficiente de la métrica usada.

Ahora bien, este proceso de segmentación permite a STRADATA encontrar grupos que comparten características entre sí, al igual que ayuda a identificar datos que están muy lejanos a cada segmento.

Proceso que, posteriormente, con el uso de nuevos datos, permite identificar cambios en las distribuciones de los subgrupos. Con lo que, finalmente se realiza un proceso de alertamiento a nuestros clientes de aquellas anomalías encontradas.

Autor: M. Carvajal

Referencias

[1] Concepto (2021). Editorial Etecé. Disponible en: https://concepto.de/aprender/
[2] Russell and Norvig (2021). Artificial Intelligence: A Modern Approach
[3] Ian Goodfellow and Yoshua Bengio and Aaron Courville. (2016). MIT Press. Disponible en: http://www.deeplearningbook.org

Tipos de aprendizaje

De aquí surge la pregunta: ¿Qué define un número de segmentos óptimo?

También podría Interesarte