Estamos en la era del Big Data, por lo que no han sido pocas las industrias que le han dado un segundo y detenido vistazo a las tecnologías de la información con propósito de sacarle provecho al gran volumen de información que generan diariamente.
En esta entrada de blog, te contaremos cómo las grandes industrias del sector minorista (retail industry), usan el Big Data para tomar decisiones.
La información es el mayor valor de los negocios
Algunos negocios del sector minorista como Wal-mart, Carrefour y particularmente BigX, han logrado aprovechar el Big Data en la toma de decisiones, al transformar la complejidad de su información estructurada y no estructurada en oportunidades para innovar con datos, logrando no solo generar valor para el negocio, sino también proveer ventajas competitivas de importancia en el sector.
Para BigX, por ejemplo, analizar sus 12 TB de información quincenal por los métodos tradicionales no era una opción pues tardaban 12 horas trasladando la información cada vez que necesitaban hacer una consulta. Claramente este modelo no se adecuaba a las necesidades del negocio.
Requerían entonces una solución escalable, y fue entonces cuando BigX decidió investigar e implementar las herramientas analíticas adecuadas, para resolver el primer problema: mover la información. Para ello consideraron utilizar Sqoop, Flume y Chukwam, e igualmente realizar consultas Hive se mostraba muy claramente como la opción más acertada. En este caso debemos destacar que todas estas herramientas de Big Data tienen integración con hadoop, el marco de trabajo más utilizado para el análisis de grandes volúmenes de información e inspirado en las necesidades de Google.
Finalmente para resolver su problema, optaron por utilizar Flume + Hive.
¿Por qué Flume?
Por ser una herramienta de propósito específico en mover log files de los clientes. Con esto, la arquitectura de la solución lucía así:
En el primer módulo vemos que se llevó a cabo la ingestión de toda la data en el HDFS (sistema de almacenamiento distribuido de hadoop) con Flume y en el segundo, los componentes necesarios para realizar el análisis con Hive.
¿Cuáles fueron los resultados?
Los resultados fueron sorprendentes, pero también esperados:
- La transferencia pasó de 12 horas a 3 horas.
- Las consultas mejoraron mucho en mantenibilidad, encontrando hallazgos interesantes.
- Se construyó una esquema snowFlake con las transacciones como tabla de hechos. considerando además dimensiones geográficas y temporales.
¿Qué información fue relevante para el análisis de datos?
Las siguientes fueron algunas de las consultas básicas para el análisis de datos:
- Contar el número de usuarios diferentes por género.
- Listar las categorías a las que pertenece cada producto.
- Contar el número de transacciones para cada espacio geográfico de interés.
¿En qué los ayudó hacer este análisis de datos?
Con el uso de las herramientas de Big Data mencionadas anteriormente, BigX logró extraer información valiosa para su negocio.
Gracias a la consulta realizada, las ventas se incrementan cada año en todas las categorías de productos, destacando Health & Beauty con un crecimiento del 65%, Food Products con 55% y Entertainment con 54.6%.
Además, pudieron detectar que los hombres compran más que las mujeres. Aunque, debemos considerar que cuando una pareja compra, el hombre es quien paga.
Ejemplos como el de BigX hay muchos ya que es un hecho que el Big Data es un generador de valor para negocios de todas las industrias, no solo de las del sector minorista.
Por los resultados y hallazgos en el caso expuesto en esta entrada, podemos decir que utilizar hadoop (integrado a sus múltiples plugins de analitica), es la apuesta para generar ventaja competitiva a través del Big Data en industrias retail.
Si deseas tomar mejores decisiones y sacarle provecho a tus datos, recuerda que en Stradata somos expertos en análitica. ¡Contáctanos y generemos valor a tu negocio!
Fuente principal: Hive for retail analysis