Procesamiento de imágenes en la gestión de cumplimiento

Una de las principales áreas de aplicación de los modelos de Machine Learning es el campo del procesamiento de imágenes y, más puntualmente, en imágenes con un alto contenido de texto. Dependiendo de la aplicación y el tipo de imagen a procesar, la tarea puede tener algunos retos y problemáticas. En el caso puntual de la aplicaciones que se desarrollan, comúnmente, para la gestión de cumplimiento, es lograr la detección y rastreo de personas.

Mucha de la información necesaria para este proceso, se logra obtener mediante documentos de identificación como las cédulas, pasaporte y visas, y aunque esta información es de fácil acceso para compañías bancarias y múltiples empresas, en muchos casos estos documentos son enviados por correo electrónico mediante fotografías tomadas por el celular, lo cual permitiría la extracción, sin problema, de todos los datos. 

Sin embargo, una mala calidad de la fotografía podría dificultar la extracción de información, por parte de los modelos de Optical Character Recognition (OCR), a lo cuales se les dificultan aquellas fotografías con niveles excesivos de brillo y transparencia, el contenido de una imagen de fondo en el documento, la baja resolución, la alta cantidad de ruido, sal y pimienta, y la posición del documento dentro de la foto. 

¿Es posible mejorar la calidad de una fotografía para un óptimo procesamiento de imágenes?

Previamente a la discusión del mejoramiento de imágenes, debemos mencionar que los ojos humanos tienen un esquema de percepción del entorno diferente al de los lentes de las cámaras fotográficas o las mismas cámaras del celular. Esto se debe principalmente a que, en comparación con las cámaras fotográficas, lo ojos humanos son mucho más sensibles a cambios respecto a tonalidades oscuras o tonos brillantes. Lo anterior es de interés debido a que el mejoramiento debe ser basado en la configuración de lectura que tienen las cámaras sobre el lenguaje de una computadora.

Hoy en día, existen dos formas para el mejoramiento de la calidad las imágenes: El primero de ellos, corresponde a técnicas convencionales de limpieza de ruido, mediante un esquema de filtros mayormente usados en representaciones más detallados de la imagen, como los espacios RGB, HSV, los histogramas de frecuencia, entre otros. Las anteriores técnicas son algunas de las más usadas.

Por ejemplo, las aplicaciones que desarrolla STRADATA están encaminadas al procesamiento de imágenes con alto grado de texto. En la figura 1, se puede ver cómo se realiza el pre-procesamiento de la imagen previamente al uso de un esquema por Optical Character Recognition OCR, donde inicialmente se tiene una fotografía y, aplicando un filtro, se logran mejorar las condiciones topográficas de la imagen.  

 

preprocesamiento-de-una-imagenFigura 1: Pre-procesamiento de una imagen

 

Si bien las técnicas convencionales son una vía válida para mejorar la calidad de la imagen, en algunos casos no son lo suficientemente adecuadas para hacerlo completamente. Por esta razón, la industria ha ido buscando otras alternativas.

De esta manera, hoy las técnicas de Machine Learning son otra forma posible que, sin lugar a duda, resulta ser más efectiva, al lograr mejorar tareas de detección de objetos dentro de una imagen o simplemente una tarea de clasificación del tipo de documento como entre una cédula y un pasaporte.  

 

procesamiento-de-imagenesFigura 2:  Esquema de extracción de texto

 

La figura 2, esquematiza un documento de identificación donde la extracción del texto presenta dificultades asociadas a la imagen del fondo. Para ello, un algoritmo de Machine Learning podría permitir el recorte del documento y, de este modo, una mejora en la adquisición de parámetros como nombres, apellidos y el número de identificación, que son esencialmente el insumo principal para el rastreo de las personas. La extracción de este tipo de información puede ser usada mediante un enlace con otra herramientas de OCR. 

Reconocimiento de texto en documentos de identidad para tecnología relacionada con áreas de cumplimiento

Actualmente, STRADATA AML está desarrollando alternativas tecnológicas para optimizar procesos de cumplimiento, que integran también el reconocimiento de texto dentro de documentos de interés. Tal es el caso de nuestra solución EXDOM que permite el cargue de documentos, la extracción de la información y el rastreo de ellos, para la gestión de riesgos de extinción de dominio. 

Con STRADATA EXDOM, se puede gestionan fácil y efectivamente el riesgo de extinción de dominio.  La solución permite cargar el Certificado de Tradición y Libertad, y extraer automáticamente los tradentes, para posteriormente ser  analizados en el motor de validación de contrapartes, STRADATA SEARCH

Asimismo, el equipo de TI de STRADATA, se encuentra desarrollando herramientas sofisticadas, que permitan la interacción de múltiples documentos de interés, en donde, por medio del procesamiento de imágenes y texto, sea posible extraer información relevante para la gestión de riesgos de LAFT. Todo esto, mediante el uso de inteligencia artificial.

Autor: E. A. León-Gómez

Conoce más en Stradata.co

Referencias

[1] https://opencv-python-tutroals.readthedocs.io/en/latest/

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *