sql >> Base de Datos >  >> RDS >> PostgreSQL

¿Evitar inserciones duplicadas sin restricción única en la tabla de destino?

Los componentes de CDC en la versión de pago de Talend Studio para la integración de datos sin duda solucionan este problema.

En Open Studio, podrá realizar su propia captura de datos de cambios en función de la clave única y compuesta (nombre, apellido, fecha de nacimiento, sexo).

  • Utilice tUniqueRow en datos provenientes de stage_geno_patients, únicos en las siguientes columnas:nombre, apellido, fecha de nacimiento, género
  • Alimente eso en un tMap
  • Agregue otra consulta como entrada al tMap, para realizar búsquedas en la tabla detrás de "patients_test", para encontrar una coincidencia en el nombre, apellido, fecha de nacimiento, género. Esa búsqueda debería "Recargar para cada fila" usando la búsqueda de valores de la fila provisional
  • En el caso de que no coincidan, detecte y luego inserte la fila de datos de la etapa en la tabla detrás de "patients_test"

P:¿También van a actualizar la información? ¿O el objetivo es solo realizar inserciones únicas donde los datos aún no están presentes?