La Segmentación de factores de riesgo, a partir de un ejemplo original y creativo. - Stradata
analyticsLAFT

La Segmentación de factores de riesgo, a partir de un ejemplo original y creativo.

By 13 marzo, 2019 octubre 8th, 2019 No Comments

Índice de Contenido

  1. Introducción
  2. Entendiendo la Segmentación a través de Pokémon
  3. Variables para el modelo de Segmentación
  4. Proceso de Segmentación
  5. Comparativo de los resultados de la Segmentación
  6. ¿Cómo podemos relacionar todo lo anterior con los factores de riesgo?

Desde que comencé a trabajar en Stradata una de mis principales funciones ha sido la de realizar el proceso de segmentación de los factores de riesgo. Un trabajo que muchas personas no conocen o no saben en qué consiste.

Curiosamente, hace algún tiempo comencé a salir con una chica que llamaba ostensiblemente mi atención. Dentro de las primeras conversaciones que tuvimos era de suponerse las preguntas cliché habituales en una plática, entre ellas era bastante obvio que me iba a preguntar: “Andrés, ¿en qué trabajas?”. Como quería generar la mejor impresión intenté hacer alarde de mi poco carisma y explicarle a ella que trabajaba en una empresa de analítica que lucha contra el lavado de activos y la financiación del terrorismo, y entre otras cosas uno de los procesos que yo realizaba era el de segmentación.

Evidentemente la pregunta siguiente fue: “¿qué es una segmentación?”.
Ese día traté de ser lo más explícito posible para hacerle entender a una persona ajena al medio lo que yo realizaba, y creí que ella había entendido en qué consistía, pero en una cita posterior cuando la llevaba de vuelta a su casa ella me volvió a hacer exactamente la misma pregunta sobre la segmentación.

Que me hiciera de nuevo esa pregunta me hizo percatar que no me había hecho entender, ni había tenido la capacidad suficiente de explicarle de forma clara y sencilla lo que yo hacía, y que tenía que buscar una forma para que no solo ella sino cualquier persona de cualquier edad o grado académico entendiera en qué consiste el proceso de segmentación de cualquier conjunto de datos.

Por estos días estuve leyendo un artículo de una segmentación con base a un juego de cartas (Sánchez, 2017). Eso motivó aún más mi idea de explicar el proceso de segmentación de la forma más llamativa y divertida posible.

Entendiendo la Segmentación a través de Pokémon

 

Si naciste en los años 90’s como yo, seguramente viste alguna vez las aventuras del entrenador Ash Ketchup de Pueblo Paleta y a Pikachu en su camino de convertirse en el mejor entrenador Pokémon. De forma breve para aquellos que nunca han visto la serie animada, Pokémon trata sobre unas criaturas o bestias místicas con habilidades especiales llamadas del mismo nombre (Pokémon = Pocket Monsters: Monstruos de bolsillo), que son capturados y entrenados para mejorar su capacidad de pelea y sus estadísticas, que en muchos casos pueden evolucionar en versiones mejoradas.

Luego de dar una breve introducción sobre la razón que me motivó a hacer este artículo, y una explicación del contexto de Pokémon, extraigamos la definición de segmentación según la Superintendencia Financiera de Colombia:

Segmentación:


“Es el proceso por medio del cual se lleva a cabo la separación de elementos en grupos homogéneos al interior de ellos y heterogéneos entre ellos. La separación se fundamenta en el reconocimiento de diferencias significativas en sus características (variables de segmentación)”

En otras palabras, la segmentación es la forma en que se particiona un conjunto de objetos en grupos más pequeños, donde estos grupos comparten características muy similares mientras que son generalmente disímiles a los demás grupos. Estos grupos son generalmente denominados clusters o segmentos.

Variables para el modelo de segmentación

 

Afortunadamente en internet hay datos abiertos de todo, y para el propósito de este artículo las estadísticas base de todos los Pokémon a la fecha (909), están disponibles para usarlas y procesarlas gracias a que la serie está basada en una saga de videojuegos del mismo nombre y a la fecha sigue lanzando a la venta nuevas versiones de este.

Es pertinente explicar escuetamente las variables para el modelo de segmentación que son precisamente las estadísticas generales de los Pokémon:

Puntos de salud (PS): Los puntos de salud, generalmente abreviado como PS (Health Points o HP en inglés), es la salud del Pokémon, representada con un valor numérico en los combates. Una vez que los PS del Pokémon lleguen a cero, el Pokémon será debilitado y quedará fuera de combate.

Ataque: El ataque, en las estadísticas de un Pokémon, representa la fuerza natural del Pokémon al realizar un movimiento físico (se consideran físicos aquellos movimientos donde el Pokémon cause un daño al hacer contacto con otro Pokémon o en el que requiera usar fuerza física).

Defensa: La defensa, en las estadísticas de un Pokémon, representa la resistencia natural de un Pokémon ante los movimientos físicos.

Ataque especial: El ataque especial, en las estadísticas de un Pokémon, representa la fuerza con la que un Pokémon realiza un movimiento especial. Se considera movimiento especial, aquellos movimientos en los que se realiza un ataque a distancia, o un ataque en el que se libera energía del Pokémon.

Defensa especial: La defensa especial, en las estadísticas de un Pokémon, representa la resistencia a los movimientos especiales.

Velocidad: La velocidad es la propiedad del Pokémon de atacar, antes o después, que el oponente. A la hora de atacar el Pokémon con un mayor valor de velocidad, por lo general, siempre atacará primero.

Es importante mencionar que cada Pokémon puede ser de un tipo o máximo dos; según su tipo puede tener ventajas sobre otro tipo o viceversa. Por ejemplo, el tipo agua es efectivo sobre el tipo fuego, de la misma forma el tipo fuego es fuerte sobre el tipo planta por mencionar algunos. Hay alrededor de 18 tipos que son fuertes, débiles o neutrales entre sí, y aunque no es nuestro objetivo centrarnos en explicar ello sí se considera apropiado mencionarlo.

Proceso de segmentación

 

Ahora nuestro trabajo es segmentar todos los Pokémon según sus estadísticas en grupos y ver qué los distingue entre sí. Para ello recurriremos al algoritmo de k-means, el más famoso en ciencia de los datos para hacer clustering.

K-means es un algoritmo de clasificación no supervisada (clusterización) que agrupa objetos en k grupos basándose en sus características. El agrupamiento se realiza minimizando la suma de distancias entre cada objeto y el centroide de su grupo o clúster. Se suele usar la distancia cuadrática.

Para este proceso de segmentación usamos el software de licencia abierta de análisis de datos KNIME y según las pruebas que realizamos escogimos ocho segmentos para dividir la población de todos los Pokémon y obtuvimos la siguiente distribución de los grupos:

Bautizamos los grupos según sus características promedio principales de la siguiente forma:

  • Débiles – Físico: En este grupo se encuentran los pokémon con poco poder, que en su mayoría no han evolucionado, destacan principalmente por sus habilidades físicas. Como por ejemplo: Bulbasaur, Totodile, Krabby y Chikorita.
Pokemones Bulbasaur, Totodile, Krabby y Chikorita
Fuente de la imagen: Pokemon
  • Débiles – Especial: En este grupo se encuentran los pokémon con poco poder, que en su mayoría no han evolucionado, destacan principalmente por sus habilidades especiales. Como por ejemplo: Charmander, Psyduck, Horsea y Woobat.
Pokemones Charmander, Psyduck, Horsea y Woobat
Fuente de la imagen: Pokemon
  • Intermedio – Defensivo: Son los Pokémon con poder promedio que destacan por tener buenas estadísticas defensivas. Algunos de este grupo son: Lapras, Ludicolo, Lunatone y Omastar.
Pokemones Lapras, Ludicolo, Lunatone y Omastar
Fuente de la imagen: Pokemon
  • Intermedio – Veloz: Son los Pokémon con poder promedio que destacan por tener buenas estadísticas de velocidad y también de ataque. Algunos de este grupo son: Beedrill, Rapidash, Aerodactyl y Staraptor.
Pokemones Beedrill, Rapidash, Aerodactyl y Staraptor
Fuente de la imagen: Pokemon
  • Fuertes – Físico: Son el grupo con alto poder de estadísticas físicas. En este se encuentran: Gyarados, Mega-Heracross, Metagross y Mega-Gallade
Pokemones Gyarados, Mega-Heracross, Metagross y Mega-Gallade
Fuente de la imagen: Pokemon
  • Fuertes – Defensivo: Son el grupo con alto poder de estadísticas defensivas. En este se encuentran: Mega-Steelix, Probopass, Mega-Slowbro y Cloyster
Mega-Steelix, Probopass, Mega-Slowbro y Cloyster
Fuente de la imagen: Pokemon
  • Muy Fuertes – Veloz y especial: Son Pokémon con muy buenas estadísticas tanto en velocidad como en habilidades especiales. En este grupo encontramos a: Charizard, Mega-Pidgeot, Mega-Alakazam y Mega-Gengar.
Charizard, Mega-Pidgeot, Mega-Alakazam y Mega-Gengar
Fuente de la imagen: Pokemon
  • Legendarios y mega fuertes: En este grupo se encuentran los mejores Pokémon de la serie con excepcionales estadísticas principalmente en ataque físico como especial. Aquí encontramos a: Mega-Mewtwo X, Mega-Tyranitar, Mega-Blaziken y Ho-Oh.
Mega-Mewtwo X, Mega-Tyranitar, Mega-Blaziken y Ho-Oh
Fuente de la imagen: Pokemon

Comparativo de los resultados de la segmentación

 

Es realmente interesante cómo la segmentación nos permite agrupar los Pokémon en grupos de estadísticas similares. A continuación, veamos un gráfico radial donde visualicemos la comparación de poder de los 4 grupos (segmentos) más fuertes de Pokémon:

No soy un experto en estrategias Pokémon, pero si tomáramos Pokémon de diferentes tipos y de los cuatro segmentos más fuertes, podríamos conformar un equipo de ensueño: balanceado tanto en estadísticas físicas como especiales, además de tener Pokémon defensivos que puedan responder a los ataques rivales; ofensivos que hagan el daño y/o veloces para culminar a los oponentes, que sería lo ideal si jugamos o competimos en alguno de los juegos de la aclamada franquicia de videojuegos.

Como mencionamos anteriormente, algunos Pokémon tienen la capacidad de evolucionar en versiones más fuertes de sí mismos, y eso los fuerza a cambiar de segmento. Miremos cómo por ejemplo Charmander empieza en el segmento de Débiles-Especial, al evolucionar a Charmeleon ingresa al segmento Intermedio-Veloz; posteriormente evoluciona a Charizard y entra en el segmento Muy fuertes – Veloz; finalmente culmina en el segmento más fuerte cuando mega evoluciona en Mega Charizard X. Al final del ejercicio las estadísticas de Mega Charizard X se duplicaron con respecto a su forma inicial.

Caption (Evolución de Charmander)
Fuente de la imagen: Pokemon

¿Cómo podemos relacionar todo lo anterior con los factores de riesgo?

 

Cuando estamos haciendo el monitoreo de un Sistema de Administración del Riesgo de Lavado de Activos y de la Financiación del Terrorismo, nuestro objetivo es el de detectar operaciones inusuales que puedan desencadenar en ingreso de dineros ilícitos a cualquier organización o sistema.

Cuando se realiza una segmentación como la anterior, a pesar de que hablamos de datos de una serie animada, de esa misma forma funciona con datos reales. Cuando una persona u organización X se encuentra categorizada en un segmento o clúster en un periodo determinado y al siguiente periodo cambia de segmento o aumenta de forma inusitada sus patrones transaccionales, nuestros sistemas de alertas se encuentran preparados para identificar y reportar la operación inusual sospechosa.

Es un secreto a voces que la magnitud tan descomunal del dinero (Grisales, 2018) de lavado de activos está permeando múltiples sistemas; es ahí cuando la analítica entra en acción. Con la evolución de los sistemas de información actuales y la capacidad computacional, nos encontramos más preparados que nunca para enfrentar la lucha que por décadas ha contaminado nuestro sistema financiero.

A. Grisales

Referencias

Grisales, A. (13 de Febrero de 2018). Stradata. Obtenido de https://aml.stradata.co/la-magnitud-descomunal-del-lavado-de-activos-en-colombia/?utm_source=blog_andres_in&utm_campaign=blog_andres_in

Sánchez, A. (11 de Enero de 2017).Blogthinkbig.com.Obtenido de https://aunclicdelastic.blogthinkbig.com/algoritmo-k-means-clientes-pokemons/

*Las ilustraciones usadas en este contenido y que hacen referencia a los personajes de Pokemón, han sido tomadas de https://www.pokemon.com/es/ y no hacen parte de nuestra creación o autoría. Son usadas meramente como material de apoyo en el contenido expuesto anteriormente*

 

Leave a Reply