Mitos sobre el data mining / Por: Patricio Llaona Gerente de Marketing de Teradata para el Caribe y Latinoamérica

 

     Patricio Llaona Gerente de Marketing de Teradata para el Caribe y Latinoamérica    

Muchas empresas exitosas han descubierto que varias de las historias que se tejen en torno al data mining, o la minería de datos, son sólo mitos. Más que caer como víctimas de éstos, los visionarios han logrado enormes ventaja competitivas mediante el uso del data mining  para resolver complejos problemas de negocios y conseguir  rentabilidad.

De hecho, fue la sofisticada tecnología del data mining la que ha convencido a grandes compañías de retail como Wal-Mart de abastecerse de una versión especial de carne enlatada, para la temporada de caza, por ejemplo. Adelante, Ríase. Mucho más que una propuesta, la idea ayudó a Wal-Mart a generar ingresos adicionales en la temporada que más se consumía de este producto, según los análisis, y es un caso emblemático sobre lo bien que entiende a sus clientes esta cadena de supermercados.

¿Y qué es el data mining?

El data mining es una poderosa herramienta de análisis que permite a los ejecutivos de negocios anticiparse en la descripción del comportamiento histórico de sus clientes, hasta predecir su conducta futura. Esta tecnología encuentra patrones que revelan los misterios del proceder de los consumidores. Sus descubrimientos pueden usarse parar aumentar los ingresos, reducir gastos e identificar oportunidades de negocios, ofreciendo nuevas ventajas competitivas.

Una de las razones acerca de la creación de mitos en torno al data mining  es que las personas están confundidas sobre lo que realmente es. En su esencia, la minería de datos se define como un conjunto de complejas técnicas matemáticas para descubrir e interpretar los patrones previamente desconocidos en datos detallados. Desde mediados de la década de 1980, se amplió el uso del data mining, desde la investigación académica, médica y científica, hasta su aplicación de manera eficaz en el comercio minorista, la banca, las telecomunicaciones, los seguros, la industria de turismo y hotelería.

Debido a que el data mining es considerado un instrumento de análisis, con frecuencia se le confunde con el procesamiento analítico en línea (OLAP - On-Line Analytic Processing). OLAP resulta una valiosa técnica analítica cuando se usa para examinar operaciones de negocios, con el objeto de adquirir una perspectiva histórica de algo que sucedió. Por ejemplo, un gerente de mercadeo quiere entender por qué cayeron las ventas en una región en particular. Las herramientas OLAP le permiten formular preguntas a través de múltiples dimensiones, tales como ventas por tienda, ventas por productos y ventas en el tiempo. Al visualizar los datos históricos desde perspectivas diferentes, podrá analizar los factores (tienda, producto o tiempo) que tuvieron algún impacto sobre las ventas.

El data mining trata de resolver otras problemáticas. Puede ser utilizado para predecir eventos futuros, como las ventas del próximo mes sobre la base de la publicidad o que tipo de cliente responderá posiblemente a una publicidad determinada.

El creciente uso de esta tecnología disipa los cinco principales mitos sobre el data mining. En primer lugar, la minería de datos no ofrece resultados inmediatos, como una bola de cristal. No obstante, se realiza de forma eficaz y eficiente el proceso al contar con los antecedentes que reflejen el negocio con exactitud. En este sentido, todo es acerca de los datos.

En segundo lugar, esta minería no requiere de una base de datos específica e independiente. Generalmente, los proveedores aducen que se requiere de esta base para generar un procesamiento eficiente.

En la actualidad, los avances en la tecnología de bases de datos exigen que el data mining ya no se realice en data marts separados. De hecho, un data mining efectivo requiere un data warehouse para toda la empresa, el cual tiene un costo total de inversión considerablemente menor que emplear data marts independientes.

Por último, algunas personas consideran que el data mining es tan complejo que hay que tener al menos tres doctorados para lograr que funcione: uno en estadística o métodos cuantitativos, uno en negocios con comprensión de los clientes y uno en ciencias de la computación.

La verdad es que los proyectos exitosos se completaron sin la necesidad de ningún doctorado. La minería de datos representa un esfuerzo de colaboración entre personal capacitado en estas tres áreas. La plantilla de negocios debe guiar el proyecto creando un conjunto de preguntas específicas de su área y luego deben interpretar los patrones emergentes. Los modeladores analíticos, que conocen de técnicas, estadísticas y herramientas de data mining, deben construir un modelo confiable. Los de servicio de sistemas aportan su conocimiento del tratamiento e interpretación de los datos, además de suministrar el respaldo técnico clave.

El resultado final: La minería de datos ya no es un proceso lento, costoso o muy complicado para ejecutar. La tecnología y el know-how de negocios existen para poner en marcha procesos eficientes y factibles en costos. Compañías de todos los tamaños están poniendo a prueba los viejos mitos y demostrando que el data mining es esencial para prosperar en el mundo de negocios actual, tan competitivo y centrado en el cliente.