sql >> Base de Datos >  >> RDS >> PostgreSQL

PostgreSQL para recorrer filas y encontrar la coincidencia más cercana usando la función de distancia personalizada

En términos generales, puede resolver este tipo de problemas utilizando una función almacenada, escrita en Java o Scala (algunos pueden preferir PL/SQL, C o C++).

PostgreSql admite funciones almacenadas (basadas en Java), así que deje que la consulta SQL obtenga los datos y páselos a una función almacenada. La función almacenada devuelve la distancia, por lo que puede filtrar/ordenar, etc. en ella.

Basado en una tabla como esta

create table point(vector float8[]);
insert into point values('{0.0, 0.0, 0.0}');
insert into point values('{0.5, 0.5, 0.5}');

con una función Java como esta:

public class PlJava {
    public final static double distance2(double[] v1, double[] v2) {
        return Math.sqrt(Math.pow(v2[0] - v1[0], 2)
          + Math.pow(v2[1] - v1[1], 2) + Math.pow(v2[2] - v1[2], 2));
    }
}

y la declaración de la función en SQL:

CREATE FUNCTION pljava.distance2(float8[], float8[])
  RETURNS float8
  AS 'PlJava.distance2'
  IMMUTABLE
  LANGUAGE java;

su consulta podría verse así:

select
    point.*, 
    pljava.distance2(vector, '{1.0, 1.0, 1.0}') as dist
  from
    point 
  order by
    dist;    

lo que resulta en

    vector     |       dist  
---------------+-------------------  
 {0.5,0.5,0.5} | 0.866025403784439  
 {0,0,0}       |  1.73205080756888  

Actualizar

Las funciones almacenadas también se pueden escribir en C y C++. C++ requiere más esfuerzo, porque la interfaz de PostgreSql usa la convención de llamadas de C. Consulte Uso de C++ para la extensibilidad