sql >> Base de Datos >  >> RDS >> Oracle

crear una columna de identificación basada en datos de actividad

Creo que esto hará el truco:

WITH EVENTS AS (SELECT 'abc' usr, to_date('2016-01-01 08:00:00', 'yyyy-mm-dd hh24:mi:ss') event_ts, 'login' event_type FROM dual UNION ALL
                SELECT 'abc' usr, to_date('2016-01-01 08:25:00', 'yyyy-mm-dd hh24:mi:ss') event_ts, 'Stuff' event_type FROM dual UNION ALL
                SELECT 'abc' usr, to_date('2016-01-01 10:00:00', 'yyyy-mm-dd hh24:mi:ss') event_ts, 'Stuff' event_type FROM dual UNION ALL
                SELECT 'abc' usr, to_date('2016-01-01 14:00:00', 'yyyy-mm-dd hh24:mi:ss') event_ts, 'login' event_type FROM dual UNION ALL
                SELECT 'xyz' usr, to_date('2015-12-31 18:00:00', 'yyyy-mm-dd hh24:mi:ss') event_ts, 'login' event_type FROM dual UNION ALL
                SELECT 'xyz' usr, to_date('2016-01-01 08:00:00', 'yyyy-mm-dd hh24:mi:ss') event_ts, 'Logout' event_type FROM dual UNION ALL
                SELECT 'def' usr, to_date('2016-01-01 08:00:00', 'yyyy-mm-dd hh24:mi:ss') event_ts, 'Logout' event_type FROM dual UNION ALL
                SELECT 'def' usr, to_date('2016-01-01 08:15:00', 'yyyy-mm-dd hh24:mi:ss') event_ts, 'Logout' event_type FROM dual)
SELECT usr,
       event_ts,
       event_type,
       SUM(counter) OVER (PARTITION BY usr ORDER BY event_ts) session_id
FROM   (SELECT usr,
               event_ts,
               event_type,
               CASE WHEN LAG(event_type, 1, 'Logout') OVER (PARTITION BY usr ORDER BY event_ts) = 'Logout' THEN 1
                    WHEN event_type = 'Logout' THEN 0
                    WHEN event_ts - LAG(event_ts) OVER (PARTITION BY usr ORDER BY event_ts) > 1/24 THEN 1
                    WHEN event_type = 'login' THEN 1
                    ELSE 0
               END counter
        FROM   EVENTS);

USR EVENT_TS            EVENT_TYPE SESSION_ID
--- ------------------- ---------- ----------
abc 2016-01-01 08:00:00 login               1
abc 2016-01-01 08:25:00 Stuff               1
abc 2016-01-01 10:00:00 Stuff               2
abc 2016-01-01 14:00:00 login               3
def 2016-01-01 08:00:00 Logout              1
def 2016-01-01 08:15:00 Logout              2
xyz 2015-12-31 18:00:00 login               1
xyz 2016-01-01 08:00:00 Logout              1

Esta solución se basa en el cortocircuito lógico que tiene lugar en la expresión CASE y en el hecho de que event_type no es nulo. También asume que múltiples cierres de sesión seguidos se cuentan como sesiones separadas:

  1. Si la fila anterior era una fila de cierre de sesión (y si no hay una fila anterior, es decir, para la primera fila del conjunto, trátela como si hubiera una fila de cierre de sesión), queremos aumentar el contador en uno. (Los cierres de sesión finalizan la sesión, por lo que siempre tenemos una nueva sesión después de un cierre de sesión).
  2. Si la fila actual es un cierre de sesión, esto finaliza la sesión existente. Por lo tanto, el contador no debe aumentarse.
  3. Si el tiempo de la fila actual es superior a una hora de la fila anterior, aumente el contador en uno.
  4. Si la fila actual es una fila de inicio de sesión, entonces es una nueva sesión, así que aumente el contador en uno.
  5. Para cualquier otro caso, no aumentamos el contador.

Una vez que hayamos hecho eso, solo es cuestión de hacer un total acumulado en el contador.