sql >> Base de Datos >  >> RDS >> Mysql

Cuente el número de filas que no están dentro de los 10 segundos entre sí

Permítanme comenzar con esta tabla. Usaré marcas de tiempo ordinarias para que podamos ver fácilmente lo que está pasando.

180.2.79.3   2011-01-01 08:00:00
180.2.79.3   2011-01-01 08:00:09
180.2.79.3   2011-01-01 08:00:20
180.2.79.3   2011-01-01 08:00:23
180.2.79.3   2011-01-01 08:00:25
180.2.79.3   2011-01-01 08:00:40
180.2.79.4   2011-01-01 08:00:00
180.2.79.4   2011-01-01 08:00:13
180.2.79.4   2011-01-01 08:00:23
180.2.79.4   2011-01-01 08:00:25
180.2.79.4   2011-01-01 08:00:27
180.2.79.4   2011-01-01 08:00:29
180.2.79.4   2011-01-01 08:00:50

Si te entiendo correctamente, quieres contarlos así.

180.2.79.3   3
180.2.79.4   3

Puede hacerlo para cada dirección IP seleccionando la marca de tiempo máxima que es ambas

  • mayor que la marca de tiempo de la fila actual, y
  • menor o igual a 10 segundos más que la marca de tiempo de la fila actual.

Al tomar estos dos criterios juntos, se introducirán algunos valores nulos, que resultan ser realmente útiles.

select ip_address, 
       t_s.time_stamp, 
       (select max(t.time_stamp) 
        from t_s t 
        where t.ip_address = t_s.ip_address 
          and t.time_stamp > t_s.time_stamp
          and t.time_stamp - t_s.time_stamp <= interval '10' second) next_page
from t_s 
group by ip_address, t_s.time_stamp
order by ip_address, t_s.time_stamp;

ip_address   time_stamp            next_page
180.2.79.3   2011-01-01 08:00:00   2011-01-01 08:00:09
180.2.79.3   2011-01-01 08:00:09   <null>
180.2.79.3   2011-01-01 08:00:20   2011-01-01 08:00:25
180.2.79.3   2011-01-01 08:00:23   2011-01-01 08:00:25
180.2.79.3   2011-01-01 08:00:25   <null>
180.2.79.3   2011-01-01 08:00:40   <null>
180.2.79.4   2011-01-01 08:00:00   <null>
180.2.79.4   2011-01-01 08:00:13   2011-01-01 08:00:23
180.2.79.4   2011-01-01 08:00:23   2011-01-01 08:00:29
180.2.79.4   2011-01-01 08:00:25   2011-01-01 08:00:29
180.2.79.4   2011-01-01 08:00:27   2011-01-01 08:00:29
180.2.79.4   2011-01-01 08:00:29   <null>
180.2.79.4   2011-01-01 08:00:50   <null>

La marca de tiempo que marca el final de una visita tiene un valor nulo para su propia página siguiente. Esto se debe a que ninguna marca de tiempo es menor o igual que la marca de tiempo + 10 segundos para esa fila.

Para obtener un recuento, probablemente crearía una vista y contaría los valores nulos.

select ip_address, count(*)
from t_s_visits 
where next_page is null
group by ip_address

180.2.79.3   3
180.2.79.4   3