sql >> Base de Datos >  >> RDS >> Database

Analice Big Data con las herramientas de Microsoft Azure

Grandes datos

Grandes datos describe el gran volumen de datos, estructurados o no estructurados, que inundan una empresa a diario. Big Data trata formas de analizar, extraer información o manejar conjuntos de datos que son demasiado grandes o complejos para ser tratados por un software de procesamiento de datos normal.

Big data tiene las siguientes características:

  • Volumen: La cantidad de datos generados y almacenados
  • Variedad: El tipo y naturaleza de los datos
  • Velocidad: La velocidad a la que se generan y procesan los datos
  • Veracidad: Calidad de los datos y el valor de los datos

La influencia de Azure en Big Data

Microsoft Azure transforma los datos en información procesable mediante el uso de herramientas de aprendizaje automático. Le permite combinar cualquier dato a cualquier escala y crear e implementar modelos de aprendizaje automático a escala.

Con los siguientes productos de Azure, se pueden realizar análisis avanzados en Big Data:

  • Almacén de datos SQL
  • Fábrica de datos
  • Almacenamiento Azure BLOB
  • Ladrillos de datos de Azure
  • Azure Cosmos DB
  • Power BI

Echemos un vistazo a cada uno de ellos individualmente.

Almacén de datos SQL

SQL Data Warehouse es un EDW (Enterprise Data Warehouse) basado en la nube que utiliza procesamiento paralelo masivo (una gran cantidad de procesadores que realizan un conjunto de cálculos en paralelo) para ejecutar consultas complejas en petabytes de datos.

Simplemente importa big data en SQL Data Warehouse con consultas PolyBase T-SQL (consultas que leen datos de Hadoop), luego, con el poder de MPP, ejecuta análisis de alto rendimiento. El almacén de datos se convertirá entonces en la versión única de la verdad con la que puede contar para obtener información.

Fábrica de datos

Data Factory es un servicio de integración de datos en la nube que integra los servicios de almacenamiento, movimiento y procesamiento de datos en canalizaciones de datos automatizadas. Azure Data Factory es un servicio de integración de datos híbrido que le permite crear, programar y orquestar flujos de trabajo ETL/ELT (Extraer, Transformar, Cargar).

Almacenamiento Azure BLOB

Azure BLOB Storage es un almacenamiento de objetos masivamente escalable para documentos, imágenes, videos y audio no estructurados. Azure BLOB Storage está optimizado para almacenar cantidades masivas de datos no estructurados (datos que no se adhieren a un modelo o definición de datos en particular), como texto o datos binarios, por ejemplo.

Azure BLOB Storage tiene las siguientes funciones:

  • Servir documentos o imágenes directamente a un navegador
  • Almacenamiento de archivos para acceso distribuido
  • Transmisión de audio y video
  • Escribir en archivos de registro
  • Almacenamiento de datos para recuperación ante desastres, copia de seguridad y restauración, y archivado

Ladrillos de datos de Azure

Azure Databricks es una plataforma de análisis fácil, rápida y colaborativa basada en Apache Spark (marco de computación en clúster de propósito general distribuido de código abierto, que proporciona una interfaz para programar clústeres con paralelismo de datos implícito).

Azure Cosmos DB

Azure Cosmos DB es un servicio de base de datos distribuido globalmente. Está diseñado para proporcionar baja latencia, escalabilidad elástica del rendimiento, semántica bien definida para la consistencia de los datos y alta disponibilidad.

Power BI

Power BI es un conjunto de herramientas de análisis empresarial que brinda información. Power BI le permite conectarse a decenas de fuentes de datos, simplificar la preparación de datos, impulsar análisis ad hoc y producir informes para ser consumidos en la Web y en dispositivos móviles.

Conclusión

Big Data ha evolucionado y sigue evolucionando. Con la ayuda de las herramientas de Azure, Big Data se vuelve cada vez más manejable.