sql >> Base de Datos >  >> RDS >> Database

Descubrimiento y clasificación de datos SQL

Con las recientes leyes de protección de datos y la implementación de GDPR el año pasado, es imperativo que sepamos el tipo de datos que almacenan nuestras bases de datos. Esto nos ayudará a clasificar los datos según las regulaciones y nos ayudará a cumplir con los estándares de privacidad de datos. Es bastante difícil para los DBA conocer el tipo de datos dentro de una base de datos. Sin embargo, hay una nueva herramienta integrada dentro de SQL Server Management Studio (SSMS) que puede ayudarnos a descubrir fácilmente los datos dentro de la base de datos. Con esta herramienta, podremos clasificar los datos y trabajar en la notificación de cualquier dato confidencial.

Reglamento global de protección de datos, también conocido como RGPD

GDPR se adoptó por primera vez en 2016 y entró en vigor en 2018. Básicamente, es un nuevo marco para la protección de datos en Europa. Sin embargo, no solo afecta a las organizaciones ubicadas dentro de la UE, sino a cualquier cosa remotamente relacionada con ella. Es importante que las organizaciones conozcan las implicaciones de no adherirse a estas regulaciones, ya que las consecuencias pueden ser perjudiciales. Para tener una idea de las consecuencias, consulte el párrafo 5 aquí:https://gdpr-info.eu/art-83-gdpr/, “Las infracciones de las siguientes disposiciones, de conformidad con el párrafo 2, estarán sujetas a multas administrativas de hasta 20 000 000 EUR , o en el caso de una empresa, hasta 4 % de la facturación anual mundial total del ejercicio fiscal anterior, lo que sea mayor . Por una de estas razones, notará que varias empresas se esforzaron por cumplir con los requisitos reglamentarios el año pasado. Incluso las principales empresas del mundo, incluida Microsoft, han implementado GDPR en todos sus clientes en todo el mundo, independientemente de si se encuentran dentro o fuera de la UE. Como DBA o profesionales de datos, debemos ser conscientes de las consecuencias de nuestras acciones y comprender la importancia de los datos que se almacenan en nuestras bases de datos.

Descargue la versión más reciente de SQL Server Management Studio (SSMS)

Antes de comenzar la demostración para el descubrimiento y la clasificación de datos, es importante que descarguemos la última versión de SQL Server Management Studio (SSMS). Como sabe, SSMS ya no forma parte de la instalación de SQL Server, hay nuevas versiones del producto que se lanzan con frecuencia con características más nuevas y actualizadas. Dado que el descubrimiento y la clasificación de datos es una herramienta integrada en SSMS, se recomienda tener siempre la última versión de SSMS. Al momento de escribir este artículo, la última versión de SSMS es 17.9.1 y se puede descargar aquí. Asegúrese de cerrar todas las versiones de SSMS en su servidor antes de la instalación, ya que la instalación se detiene cuando se está ejecutando SSMS. Una vez instalado, reinicie su servidor y continúe con los siguientes pasos.

Restaurar una base de datos de muestra

Para demostrar la nueva característica de clasificación de datos integrada en SSMS, puede usar la base de datos de ejemplo de SQL Server que está disponible para descargar. Usé la base de datos de muestra "WideWorldImporters" en esta demostración. Puede descargar un archivo de copia de seguridad de muestra y restaurarlo en su servidor. Consulte este enlace para el archivo de copia de seguridad. Puede descargar el archivo seleccionado como se muestra a continuación.

Una vez descargado el archivo de respaldo, restaure la base de datos usándolo. Puede usar este script de muestra para realizar la restauración. Es posible que deba actualizar las rutas de las carpetas según la ubicación en su servidor.

restore database WideWorldImporters
from disk='C:\WideWorldImporters-Full.bak'
with move 'WWI_Primary' to 'C:\SQLData\WideWorldImporters.mdf',
     move 'WWI_UserData' to 'C:\SQLData\WideWorldImporters_UserData.ndf',
	 move 'WWI_Log' to 'C:\SQLData\WideWorldImporters.ldf',
	 move 'WWI_InMemory_Data_1' to 'C:\SQLData\WideWorldImporters_InMemory_Data_1',
	 stats

Clasificar datos

Una vez restaurada la base de datos, haga clic derecho en la base de datos en SSMS, vaya a Tareas y haga clic en Clasificar datos , como se muestra a continuación.

Una vez que haga clic en Clasificar datos , se abrirá un cuadro de diálogo donde podrá ver las recomendaciones de clasificación.

Una vez que haga clic en Haga clic para ver , podrá ver la lista detallada de columnas que se recomiendan para la clasificación de datos. En la captura de pantalla a continuación, puede ver una lista de 92 columnas con recomendaciones de clasificación. La herramienta pudo realizar el análisis por usted y proporcionar recomendaciones sin intervención del usuario.

Seleccione varias columnas en la lista recomendada

De las 92 columnas que se recomendaron, primero podemos seleccionar varias columnas en la lista y ver los cambios que ocurren. En nuestra demostración, seleccionaremos la Dirección de correo electrónico columna en Personas mesa. En la captura de pantalla a continuación, puede ver que la EmailAddress la columna está seleccionada en el lado izquierdo. Una vez hecho esto, verá el mensaje Aceptar recomendaciones seleccionadas opción. De lo contrario, esta opción aparece atenuada.

En la columna de la etiqueta de confidencialidad, también puede ver si la columna debe cumplir con el RGPD o no. Una vez seleccionada la columna, verá que la recomendación debe guardarse.

Haz clic en Guardar y verás la confirmación de que los cambios se han actualizado correctamente.

Ahora, puede hacer clic en Ver informe para generar un informe para la clasificación de datos SQL para la base de datos de WideWorldImporters. El informe se muestra a continuación.

En el informe, puede ver el recuento total de tablas, columnas y distribución de datos. Debajo de la distribución de datos, puede ver si los datos están etiquetados como RGPD o no. Con esta herramienta, tiene una mejor comprensión de la importancia y el tipo de datos que se almacenan en su base de datos. Para facilitar las cosas, también puede exportar este informe como Excel, PDF o Word y enviarlo por correo electrónico a su gerente comercial o CIO para su revisión. Simplemente haga clic con el botón derecho en cualquier parte del informe y use cualquiera de las opciones que se muestran a continuación.

Seleccione todas las columnas de la lista recomendada

En el ejemplo anterior, aplicó solo una columna de la lista de columnas recomendadas. Sin embargo, tiene la opción de seleccionar todas las columnas en la lista recomendada y hacer que su base de datos cumpla con las políticas de seguridad de datos. Simplemente seleccione la casilla de verificación opción seleccionando así todas las columnas en la lista recomendada, como se muestra en la captura de pantalla a continuación.

Con esta opción, todas las columnas quedan seleccionadas y están listas para ser aplicadas. Para realizar los cambios en su base de datos, haga clic en Aceptar recomendaciones seleccionadas . En la captura de pantalla, puede ver 91 columnas con recomendaciones de clasificación. Con solo hacer clic en un botón, puede aplicar las recomendaciones para todas esas columnas. Tal como lo hizo en el ejemplo anterior para una sola columna, continúe y haga clic en Guardar para completar el proceso.

Una vez que haga clic en Guardar , los cambios de clasificación se actualizan correctamente. Ahora, haga clic en Ver informe para ver el informe detallado de clasificación de datos.

En este informe, puede ver que todas las columnas clasificadas pertenecían a las tablas dentro de 4 esquemas. Para obtener detalles de los nombres de las tablas, haga clic en Tabla columna para ver. El informe tiene un gráfico circular con detalles de la sensibilidad de GDPR. También hay otro gráfico circular útil para la distribución del tipo de información.

Añadir opción de clasificación

Es posible que haya notado que varias tablas se etiquetaron como que contenían datos confidenciales del informe de clasificación de datos generado. Esto fue a través de la recomendación que se generó al usar esta herramienta de clasificación de datos. Sin embargo, es posible que desee revisar el informe más a fondo y agregar su propia clasificación de datos en función de su comprensión de los datos. Este es un proceso manual, donde seleccionamos las columnas por nuestra cuenta. En el informe de clasificación de datos a continuación, puede ver que solo una columna TaxRate en las Líneas de pedido la tabla está clasificada para contener datos confidenciales.

Sin embargo, se da cuenta de que otras columnas de esta tabla también deben estar en este informe. Puede revisar las Líneas de pedido tabla y planee incluir la Descripción columna en el informe de clasificación de datos.

En este caso, haga clic con el botón derecho en la base de datos y realice las mismas operaciones que realizó anteriormente para clasificar los datos. Verá Agregar clasificación opción.

Una vez hecho esto, puede seleccionar la tabla y la columna como se muestra a continuación. Seleccione las opciones que están disponibles en el menú desplegable para clasificar los datos. En la captura de pantalla a continuación, puede ver que la Descripción columna en Líneas de pedido la tabla está marcada como Confidencial . Agregue la clasificación de datos haciendo clic en Agregar botón.

Una vez hecho esto, haga clic en Guardar para actualizar los cambios.

Para confirmar que los cambios se han aplicado correctamente, puede volver a ejecutar el informe de clasificación de datos como lo hizo en los pasos anteriores. Después de eso, puede verificar que la columna se agregó correctamente.

En el informe, puede confirmar que la Descripción De hecho, la columna se agregó con éxito y está etiquetada como confidencial. Con este enfoque, puede etiquetar otras columnas de su elección según ciertos requisitos o instrucciones de la administración.

Propiedades extendidas en columnas

Cuando revisa más las columnas, puede obtener detalles de la vista del catálogo de propiedades extendidas relacionadas con las columnas etiquetadas para la clasificación de datos. Por ejemplo, cuando hace clic con el botón derecho en Descripción columna en Sales.OrderLines tabla, podrá ver los detalles en las Propiedades extendidas sección para esa columna.

El sys_information_type_name y sys_sensitivity_label_name los valores son descripciones en la columna de sys.extended_properties vista de catálogo. Los metadatos relacionados con estas clasificaciones de datos se almacenan en esta vista de catálogo:sys.extended_properties .

Comentarios adicionales

Con esta nueva herramienta, notará que el equipo de producto de Microsoft ha hecho que esta tarea de clasificación de datos sea tan simple y fácil de usar. Para ser honesto, no hay una excusa real para la falta de comprensión de los datos subyacentes dentro de su base de datos. Teniendo en cuenta la importancia de la protección de los datos de los usuarios y las preocupaciones de varias agencias globales sobre el compromiso de los datos de los usuarios por parte de organizaciones conocidas, es muy importante que los DBA y los profesionales de datos se tomen en serio la protección de datos y se mantengan al día con la última oferta tecnológica. Teniendo en cuenta que esta herramienta es gratuita y fácil de usar, no hay ninguna razón real para no para usarlo en todos sus sistemas de producción.

Conclusión

  • En este artículo, leyó sobre el uso de una nueva característica interesante dentro de SQL Server Management Studio (SSMS)
  • Aprendió brevemente una serie de elementos importantes relacionados con la protección de datos
  • Comprendes la importancia de mantener tu versión de SSMS actualizada con las últimas versiones para que no te pierdas ninguna característica nueva o actualización
  • Vio cómo puede probar fácilmente nuevas funciones al restaurar una base de datos de SQL Server de muestra
  • Aprendiste a clasificar los datos usando SSMS
  • Aprendió a generar informes para ver los detalles de las columnas etiquetadas
  • Aprendió a agregar manualmente sus propias clasificaciones de datos en función de su comprensión de los datos subyacentes
  • También sabe que todas las clasificaciones de datos se pueden realizar con esta sencilla herramienta y puede generar informes sorprendentes y comprender mejor los datos y la base de datos que está administrando.