sql >> Base de Datos >  >> RDS >> Oracle

Implemente el centro de datos CDP de Cloudera en Oracle Cloud Infrastructure (OCI)

Cloudera Data Platform (CDP) Data Center es una plataforma completamente de datos que unifica los últimos análisis de código abierto (Spark, Impala, Hive, HBase, Kafka, Hadoop y más) en un sistema de gestión de datos y análisis multifunción que incluye:

  • Análisis de SQL de mayor rendimiento
  • Procesamiento y gestión de transmisiones en tiempo real
  • Control de acceso granular basado en atributos
  • Filtrado dinámico de columnas y enmascaramiento de filas
  • Un aumento de 10 veces en la escalabilidad de archivos y objetos

Utilicé un módulo Terraform (v0.12) que implementa CDP Data Center en Oracle Cloud Infrastructure (OCI).

Esta plantilla tiene soporte para apuntar a VCN/Subredes existentes para la implementación de clústeres. Para activar esta funcionalidad, simplemente use el sistema de menús del esquema para seleccionar un destino de VCN existente y luego seleccione las subredes adecuadas para cada tipo de host de clúster.

1. Descargue el archivo zip para la implementación de Cloudera Terraform con Resource Manager .

2. Inicie sesión en Oracle Cloud Infrastructure (OCI)

3. Seleccione Administrador de recursos. y haz clic en Pilas

4. Haga clic en Crear pila .

5. En la Información de la pila página cargue el archivo zip que descargó en el paso 1 y luego haga clic en Siguiente .

6. En Configurar variables página, ingrese el contenido de una "clave proporcionada por SSH" (opcional). Nota:si implementa Cloudera Manager en una subred privada, necesitará una VPN o un túnel SSH a través de un nodo perimetral. para acceder a la gestión de clústeres. Cuando crea una VPC, debe especificar un rango de direcciones IPv4 para la VPC en forma de un bloque de enrutamiento entre dominios sin clase (CIDR), por ejemplo, 10.0.0.0/16. Haga clic en Siguiente .

7. Verifique su configuración y haga clic en Crear.

9. Desde las Acciones de Terraform menú seleccione Plan

10. Haga clic en Planificar

11. Espere unos momentos hasta que se complete este trabajo.

12. Terraform se ha inicializado con éxito.

13. Trabajo completado con éxito

14. Diagrama que muestra lo que normalmente se implementa con esta plantilla. Que los recursos se distribuyan automáticamente entre "Dominios de fallas" en un "Dominio de disponibilidad" para garantizar la tolerancia a fallas.

Referencias

Obtenga información sobre la implementación de Hadoop en Oracle Cloud Infrastructure. Disponible en https://docs.oracle.com/en/solutions/learn-deploy-hadoop-oci/index.html#GUID-6BC025FF-829B-4BBD-9C80-69044F61F35B

Implemente Hadoop fácilmente en Oracle Cloud Infrastructure mediante Resource Manager. Disponible en https://blogs.oracle.com/cloud-infrastructure/deploy-hadoop-easily-on-oracle-cloud-infrastructure-using-resource-manager

Cloudera en Oracle Cloud Infrastructure (plantilla de implementación de Terraform). Disponible en https://github.com/oracle-quickstart/oci-cloudera

Descripción general del Administrador de recursos. Disponible en https://docs.cloud.oracle.com/en-us/iaas/Content/ResourceManager/Concepts/resourcemanager.htm

Centro de datos CDP. Disponible en https://docs.cloudera.com/cdp/latest/overview/topics/cdpdc-overview.html