Big data ventajas y desventajas 1200x720

Big Data

  • Primeras Bases de Datos y Sistemas de Gestión

    Inicios del Almacenamiento y Análisis de Datos
    • Aparecen los primeros sistemas de gestión de archivos (como ISAM e IMS) para organizar y recuperar datos secuenciales.
    • Análisis manual y rudimentario, enfocado en consultas simples mediante sistemas tabulares.
  • Creación del Modelo Relacional y SQL

    • Edgar F. Codd introduce el modelo relacional (RDBMS) y el lenguaje SQL (Structured Query Language).
    • Se facilita el acceso a grandes conjuntos de datos mediante consultas estructuradas y relaciones entre tablas.
    • Técnicas utilizadas: Consultas SQL, operaciones CRUD (Create, Read, Update, Delete).
    • Aparece el concepto de Data Mining (minería de datos) para buscar patrones simples.
  • Data Warehousing y OLAP (Análisis Multidimensional)

    • Nace el concepto de Data Warehouse (DW): grandes repositorios centralizados para análisis histórico.
    • Aparecen las primeras herramientas OLAP (On-Line Analytical Processing) para realizar análisis multidimensional (cubos de datos).
    • Enfoque: Análisis descriptivo y reportes de tendencias.
  • Auge del Data Mining y Business Intelligence (BI)

    • Business Intelligence (BI): Conjunto de estrategias y herramientas para transformar datos en conocimiento.
    • Avance en Data Mining: uso de algoritmos para identificar patrones ocultos.
    • Se amplían los análisis con técnicas estadísticas y herramientas gráficas interactivas.
    • Técnicas utilizadas: Árboles de decisión, regresión, clustering (agrupamiento).
  • Big Data y Análisis Distribuido (MapReduce, Hadoop)

    • Google desarrolla MapReduce, un modelo para analizar grandes volúmenes de datos en paralelo.
    • Surge Hadoop, una plataforma de código abierto basada en MapReduce para procesar grandes conjuntos de datos distribuidos.
    • Enfoque en análisis a gran escala y en tiempo casi real.
    • Técnicas utilizadas: MapReduce, análisis distribuido, bases NoSQL (MongoDB, Cassandra).
  • Machine Learning, Deep Learning y Análisis Predictivo

    • Machine Learning (ML): Algoritmos que aprenden automáticamente a partir de los datos.
    • Deep Learning (DL): Redes neuronales profundas para análisis de datos complejos (voz, imágenes, texto).
    • El análisis se convierte en predictivo y prescriptivo (proponer acciones basadas en resultados).
    • Impacto: Análisis avanzado en campos como la salud, la banca y la seguridad.
  • Análisis en Tiempo Real e IoT (Internet de las Cosas)

    • Uso de Stream Processing para procesar datos en tiempo real desde dispositivos conectados (IoT).
    • Análisis basado en Inteligencia Artificial (IA) para detectar patrones en tiempo real.
    • Analítica aumentada: Combinación de ML con BI para generar insights automáticos.
    • Impacto: Implementación de análisis en tiempo real en ciudades inteligentes, automóviles autónomos y salud digital.