Ciencia de los Datos (Data Science)

La ciencia de los datos o Data Science representa la extracción de conocimiento a partir de grandes volúmenes de datos (Big Data) estructurados o no estructurados y es una continuación del campo de la Minería de Datos y el Análisis Predictivo, también conocido como el Descubrimiento de Conocimiento y Minería de Datos (KDD). En principio, todo lo que se refiere a datos limpios, preparación y análisis se encuentra dentro del alcance de la ciencia de los datos.

Los datos que tienen bien definidos su longitud y su formato, como las fechas, los números o las cadenas de caracteres y se almacenan en tablas son estructurados. Un ejemplo son las bases de datos relacionales y las hojas de cálculo. Por su parte, los datos no estructurados pueden incluir correos electrónicos, videos, fotos, redes sociales y otros contenidos generados por los usuarios. La ciencia de los datos a menudo requiere clasificación a través de una gran cantidad de algoritmos de información y la escritura para extraer ideas de estos datos.

Entre los términos relacionados con la Ciencia de los Datos, tenemos:

Fuente: onthe.io


Comenzando con la disciplina de los Datos Masivos (Big Data) implica grandes volúmenes de datos que no se pueden procesar de manera efectiva con las aplicaciones tradicionales. El procesamiento de grandes datos comienza con datos en bruto que no se agregan y son a menudo imposibles de almacenar en la memoria de un solo equipo.

El Aprendizaje Automático (Machine Learning – ML) es una técnica de inteligencia artificial que se utiliza ampliamente en la Minería de Datos. Machine Learning utiliza un conjunto de datos de entrenamiento para construir un modelo que puede predecir los valores de las variables objetivo, por ejemplo, las ventas futuras. La Minería de Datos utiliza la fuerza predictiva del Aprendizaje Automático mediante la aplicación de diferentes algoritmos de aprendizaje automático para grandes volúmenes de datos.

El Análisis de Datos (Data Analysis) significa actividades humanas dirigidas a la obtención de una idea en un conjunto de datos. Un analista puede utilizar algunas herramientas de datos de Google Analytics para obtener los resultados deseados, pero, en principio, el Análisis de Datos se puede realizar sin un procesamiento de datos especial. Por ejemplo, un trader de divisas puede confiar en su experiencia para abrir o cerrar una posición de trading.

La Analítica de Datos (Data Analytics) es todo acerca de la automatización de vista en un conjunto de datos y supone el uso de consultas y procedimientos de agregación de datos. Puede representar diferentes dependencias entre las variables de entrada, pero también puede utilizar las técnicas y herramientas de Minería de Datos para descubrir patrones ocultos en el conjunto de datos que se analiza. Por ejemplo, las asociaciones no obvias entre las compras de los usuarios se pueden descubrir automáticamente. 

Finalmente, la Minería de Datos o Data Mining, también conocida como la disciplina de Exploración de Datos, se refiere al proceso que intenta descubrir patrones en grandes volúmenes de datos (Big Data). Utiliza los métodos de la inteligencia artificial, el aprendizaje automático, la estadística y los sistemas de bases de datos y su objetivo es la extracción de información de un conjunto de datos y transformarla en una estructura comprensible para su uso posterior. Estos patrones pueden entonces ser vistos como una especie de resumen de los datos de entrada, y pueden ser utilizados en el análisis adicional o, por ejemplo, en el aprendizaje automático y el análisis predictivo. Estos métodos pueden, sin embargo, ser utilizados en la creación de nuevas hipótesis que se prueban contra poblaciones de datos más grandes.
Compartir Compartir

Sobre el autor José Andrés López

Lic. en Computación, Cisco CCNA - CCNA Security - CCNP Route - CCNP Switch, Instructor en la Academia Regional de Cisco Caracas - Venezuela. En mis ratos libre me gusta viajar, comer y jugar ajedrez.
    Comentarios Blogger
    Comentarios Facebook

0 comentarios:

Publicar un comentario