Eliminar funcionalidad con marco de datos spark sql

Si desea modificar (eliminar registros) la fuente real de datos, es decir, tablas en postgres, Spark no sería una excelente manera. Puede usar el cliente jdbc directamente para lograr lo mismo.

Si desea hacer esto de todos modos (de manera distribuida en función de algunas pistas que está calculando como parte de los marcos de datos); puede tener el mismo código de cliente jdbc escrito en correspondencia con el marco de datos que tiene información de activación/lógica para eliminar registros y que podemos ejecutar en varios trabajadores en paralelo.

Cómo cambiar el comportamiento de clasificación nulo predeterminado de PostgreSQL en Django ORM

Pl/pgSQL no hay parámetro $1 en la instrucción EXECUTE

Cómo calcular el percentil en PostgreSQL
Consejos de gestión de esquemas para MySQL y MariaDB
Configuraciones de ámbito de la base de datos de SQL Server y corrección automática del plan
Una descripción general de los métodos JOIN en PostgreSQL