El valor de los buenos datos de prueba para los administradores de bases de datos es bien conocido:
“La prueba de aplicaciones con uso intensivo de bases de datos tiene desafíos únicos que se derivan de dependencias ocultas, diferencias sutiles en la semántica de los datos, esquemas de bases de datos de destino y reglas comerciales implícitas. Estos desafíos se vuelven aún más difíciles cuando la aplicación involucra bases de datos integradas y heterogéneas o datos confidenciales. Los datos de prueba adecuados que simulan problemas de datos del mundo real son fundamentales para lograr puntos de referencia de calidad razonables para la validación de entrada funcional, la carga, el rendimiento y las pruebas de estrés. ” – Ali Raza y Stephen Clyde, resumen de Creación de conjuntos de datos para probar bases de datos relacionales
Las operaciones de prueba de la base de datos, la creación de prototipos del almacén de datos y los trabajos ETL/ELT, la subcontratación segura de muestras e informes de archivos y la ejecución de puntos de referencia de rendimiento en dispositivos de base de datos requieren datos de prueba con la apariencia de la base de datos de producción para que las aplicaciones que utilizan esos datos de prueba ahora realizar con éxito con datos reales más adelante. En su libro de 2012, Raza y Clyde comparan la generación de datos de prueba con la extracción de datos de prueba.
IRI y sus usuarios saben que no es deseable utilizar datos reales para las pruebas. La razón más obvia hoy en día es que los datos reales corren el riesgo de exponer información de identificación personal (PII) que debe mantenerse confidencial. Un desarrollador o probador no desea ejecutar procesos ni probar un sistema de base de datos y arriesgarse a compartir información de clientes como números de seguro social, información de tarjetas de crédito, fechas de nacimiento, etc. durante esta fase. Es posible que los datos reales disponibles en la actualidad no sean lo suficientemente sólidos o realistas para realizar pruebas de estrés en aplicaciones o bases de datos que tendrán que manejar volúmenes y/o rangos de valores más grandes.
Desafortunadamente, Raza y Clyde escribieron su libro antes de que se lanzara RowGen v3, cuando pudieron haber observado que genera datos de prueba que:
1) no expone PII porque contiene valores de columna nuevos o aleatorios reales
2) mantiene la integridad estructural y referencial definida en el DDL original
3) no se limita a los volúmenes de datos de la base de datos original o los rangos de valores
4) se pueden personalizar a través de la generación de scripts para abordar requisitos complejos
5) se clasifican previamente y se cargan de forma masiva automáticamente para la población más rápida posible
6) se definen por lotes scripts que tienen diversa flexibilidad y se pueden exportar, reutilizar y modificar según sea necesario
IRI RowGen v3 es la última versión del generador de datos de prueba de gran volumen más rápido y sólido del mundo para bases de datos relacionales. RowGen se ejecutará desde la GUI de IRI Workbench basada en Eclipse, en la línea de comandos o desde programas por lotes, para producir la calidad y la cantidad de datos de prueba necesarios para reflejar con precisión el alcance, los diseños y las relaciones dentro de las bases de datos de producción y, a su vez, almacenes de datos y almacenes de datos operativos.
El nuevo asistente DB Test Data de RowGen v3, cuando se inicia desde la GUI de IRI Workbench, guía a los usuarios a través de la especificación y automatización de:
Análisis – al seleccionar el esquema y las tablas para completar, RowGen traduce las descripciones de las tablas de la base de datos y las restricciones de integridad en secuencias de comandos .rcl que especifican la estructura de origen, los conjuntos dependientes y la creación de datos, en el orden necesario para completar las tablas en el formato correcto, y con todas las claves primarias, índices únicos y relaciones de claves externas respetadas.
Generación – construyendo y ejecutando los scripts .rcl para crear un archivo de prueba por tabla que se puede cargar de forma masiva y/o guardar para uso futuro.
Población – mediante la carga masiva de las tablas de destino en el orden correcto con datos de prueba preclasificados estructural y referencialmente correctos.
El proceso puede cargar rápidamente enormes bases de datos de prueba y cumplir tanto con las reglas comerciales como con las leyes de privacidad de datos. Los datos generados son realistas y lo suficientemente sólidos como para realizar pruebas de estrés en las operaciones de la base de datos y las aplicaciones de consulta.
RowGen v3 también admite opciones basadas en reglas y secuencias de comandos para controlar valores de campos específicos y distribuciones de rangos de valores que se adaptan a las restricciones específicas de la base de datos y representan mejor la apariencia y las tasas de ocurrencia de los datos en producción. Los usuarios también pueden graficar y corroborar visualmente que los valores de prueba se ajustan a distribuciones lineales, normalizadas, ponderadas o estándar.
Para obtener más información sobre RowGen v3, consulte www.iri.com/products/rowgen, www.iri.com/products/rowgen/gui o lea los demás artículos en la sección Test Data del blog de IRI.