¿Qué resulta esencial para el Análisis Predictivo?

Con Big Data y la Minería de Datos, se abre el camino hacia la generación de múltiples recursos especializados en el análisis de datos, que no eran suficientes hasta ahora. Sin embargo, la imposibilidad de acceder fácilmente e integrar los datos es la razón principal de la insatisfacción con el análisis predictivo

Foto: cibbva.com

Según datos de la firma especialista en análisis predictivo, Ventana Research, el 62% de las organizaciones se sienten insatisfechas con la preparación de los datos. Además, esta área consume la mayor parte del tiempo en el proceso de análisis predictivo. 

La investigación encuentra que los datos que se preparan para el análisis (40%) y los datos de acceso (22%) son las partes del proceso de análisis predictivo que crean la mayoría de los retos para las organizaciones. Para disponer de más tiempo para el análisis real, las organizaciones deben trabajar para mejorar sus procesos relacionados con los datos. 

Las organizaciones aplican análisis predictivo para muchas categorías de información. La investigación muestra que las categorías más comunes son los clientes (utilizado por el 50%), marketing (44%), producto (43%), finanzas (40%) y ventas (38%). Dicha información a menudo tiene que ser combinada de varios sistemas y enriquecida con información de nuevas fuentes. Para que los usuarios pueden aplicar el análisis predictivo a estos conjuntos de datos combinados, la información debe ser puesta en un formato común y presentados como un conjunto de datos normalizados. A diferencia de los sistemas de almacenamiento de datos, que proporcionan una única fuente de datos con un formato común, los datos de hoy en día a menudo se encuentra en una variedad de sistemas que tienen diferentes formatos y modelos de datos. Gran parte del desafío actual en el acceso y la integración de los datos, proviene de la necesidad de incluir no sólo una variedad de fuentes de datos relacionales, sino también formas menos estructuradas de datos o Big Data

Para hacer frente al reto de almacenamiento y computación de grandes datos, las organizaciones que planean utilizar el análisis predictivo recurren cada vez más a la tecnología de Big Data. Mientras que los archivos planos y las bases de datos relacionales en hardware estándar fueron citados por casi dos tercios (63%) de los participantes y son todavía las herramientas más utilizadas para el análisis predictivo, más de la mitad (52%) de las organizaciones ahora utilizan dispositivos de almacenamiento de datos para análisis predictivo y 31 por ciento usa bases de datos en memoria, cuyo segundo más alto porcentaje (24%) tienen previsto adoptar en los próximos 12 a 24 meses.

Preparar los datos es esencial para el análisis predictivo 

Tecnologías Hadoop y NoSQL han retrasado la adopción, actualmente utilizadas por uno de cada cuatro organizaciones, pero en los próximos 12 a 24 meses, un 29 por ciento adicional mostraron su intención de utilizar Hadoop y el 20 por ciento más usarán otros enfoques NoSQL. Por otra parte, más de una cuarta parte (26%) de las organizaciones están evaluando Hadoop para su uso en análisis predictivo, que es la mayor parte de cualquier tecnología. 

Algunas organizaciones están considerando pasar desde sus centros de datos físicos al almacenamiento basado en la nube (cloud computing) para el análisis predictivo de datos; las razones más comunes para hacerlo son para mejorar el acceso a los datos (49%) y la preparación de los datos para el análisis (43%). Esta tendencia se dirige a la creciente importancia de las fuentes de datos basados en la nube, así como herramientas basadas en la nube que proporcionan acceso a muchas fuentes de información y proporcionan análisis predictivo. Como las organizaciones acumulan más datos y necesitan aplicar el análisis predictivo de una manera escalable, sus expectativas en la necesidad de acceder y utilizar grandes datos y sistemas basados en la nube, aumentan. 

Mientras que los sistemas de grandes datos pueden ayudar a manejar el tamaño y la variedad de los datos, no lo hacen en sí mismos resolver los retos de acceso a los datos y la normalización. Esto es especialmente cierto para las organizaciones que necesitan mezclar nuevos datos almacenados en sistemas aislados. Cómo hacer esto es fundamental para la consideración por parte de las organizaciones, especialmente a la luz de las personas que utilizan el sistema de análisis predictivo y sus habilidades. En relación a este punto, hay tres consideraciones claves: 
  1. La interfaz de usuario y las más comunes son las utilizadas por las hojas de cálculo (48%), herramientas gráficas de modelado de flujo de trabajo (44%), entornos de desarrollo integrados (37%) y las herramientas de modelado basadas en menús (35%). 
  2. El número de fuentes de datos para hacer frente y que son apoyadas por el sistema; la investigación muestra que cuatro de cada cinco de las organizaciones necesitan para acceder e integrar cinco o más fuentes de datos.
  3. Los lenguajes de programación y bibliotecas de análisis a utilizar y que son compatibles con el sistema; la investigación encuentra que Microsoft Excel, SQL, R, Java y Python son los más ampliamente utilizados para el análisis predictivo. 
Teniendo en cuenta estas tres prioridades, tanto en términos de las habilidades, los procesos, la tecnología actual, y las fuentes de información que necesitan ser visitadas, todas son cruciales para la entrega de valor a la organización con el análisis predictivo. 

Si bien ha habido un aumento exponencial de los datos disponibles para su uso en análisis predictivo, así como los avances en la tecnología de integración, la investigación muestra que el acceso a los datos y su preparación son aún las tareas más difíciles y rezagadas en el proceso de análisis predictivo. Aunque la tecnología para estas tareas ha mejorado, la complejidad de los datos se ha incrementado a través de la aparición de diferentes tipos de datos, los datos a gran escala y las fuentes de datos basados en la nube. Las organizaciones deben prestar especial atención a cómo eligen las herramientas de análisis predictivo que pueden dar fácil acceso a múltiples y diversas fuentes de datos, incluyendo grandes almacenes de datos y proporcionar capacidades de fusión de datos y aprovisionamiento de los conjuntos de datos analíticos. Sin estas capacidades, las herramientas de análisis predictivo quedaran debajo de las expectativas.
Compartir Compartir

Sobre el autor Nubia Márquez

Economista y Tecnóloga con Especialización en Aplicaciones E-Business, Tutor Virtual y Bloguera. Apasionada por la Tecnología, las Finanzas y la Educación con énfasis en la Web 2.0. En mis ratos libres me encanta cocinar, viajar, leer y navegar en la Internet.

 
    Comentarios Blogger
    Comentarios Facebook

0 comentarios:

Publicar un comentario