Las bases de datos de aprendizaje automático están alcanzando la mayoría de edad. Esto presenta enormes oportunidades para los profesionales de bases de datos que pueden evolucionar para aprovechar este cambio.
Actualmente, los profesionales de bases de datos, por ejemplo, administradores de bases de datos (DBA) y desarrolladores de bases de datos, son algunos de los puestos más importantes en cualquier organización de TI. Un profesional de bases de datos es responsable de crear, administrar y proporcionar acceso controlado a una base de datos. Tener a la persona adecuada como DBA puede ayudar a las empresas a ahorrar tiempo y acortar el tiempo de desarrollo de aplicaciones. Sin embargo, con el creciente acceso a una enorme cantidad de datos, las responsabilidades de un profesional de bases de datos están evolucionando rápidamente.
Se han desarrollado varias tecnologías que se pueden usar no solo para administrar y explorar datos, sino que también pueden ayudar a tomar decisiones bien informadas sobre la base de los datos. El aprendizaje automático es una de esas tecnologías que ha experimentado un gran auge en la última década. Este artículo proporciona una breve descripción de cómo el aprendizaje automático puede afectar las profesiones de las bases de datos y cuáles son las ventajas de tener el aprendizaje automático como un conjunto de habilidades.
¿Qué es el aprendizaje automático?
El aprendizaje automático es un proceso de comprensión y extracción de patrones útiles de los datos con la ayuda de varios algoritmos estadísticos. El aprendizaje automático se divide a su vez en técnicas de aprendizaje supervisadas y no supervisadas. El aprendizaje automático se está utilizando actualmente para resolver muchos problemas complejos, como la clasificación de correos electrónicos no deseados y no deseados, la predicción del precio de la vivienda, la generación de poesía, la clasificación de imágenes, etc.
¿El aprendizaje automático reemplazará las profesiones de las bases de datos?
Uno de los conceptos erróneos más comunes sobre el aprendizaje automático es que reemplazará a los humanos en muchos trabajos. Si bien esto puede ser cierto para algunas tareas repetitivas, la IA y el aprendizaje automático básicamente complementarán el cerebro humano, no lo reemplazarán. Para los profesionales de las bases de datos, las bases de datos de aprendizaje automático no los reemplazarán, sino que los ayudarán enormemente.
Permitirá a los profesionales de las bases de datos centrarse mucho más en la planificación y las tareas estratégicas, ya que automatizará las tareas más aburridas y autónomas, como la instalación, la configuración y las actualizaciones periódicas de la base de datos. Por lo tanto, en lugar de temer el impacto del aprendizaje automático en sus trabajos, los profesionales de bases de datos deberían adoptarlo como una forma de completar tareas menos desafiantes de manera mucho más rápida y eficiente. .
Manejar Big Data es un desafío
Debido al auge de la red mundial en las últimas dos décadas, los datos están disponibles en todas las formas y tamaños. De hecho, el término big data se usa a menudo para el conjunto de datos que es enorme en volumen, llega a gran velocidad y contiene una variedad de contenido.
El manejo de grandes cantidades de estos datos no estructurados se ha convertido en un desafío para los administradores de bases de datos. Se ha descubierto que los algoritmos que se ejecutan en bases de datos de aprendizaje automático también funcionan bien con datos no estructurados. Una gran cantidad de datos se puede dividir fácilmente en información significativa a través de técnicas de aprendizaje automático que resaltan la necesidad de que los profesionales de bases de datos adquieran habilidades de aprendizaje automático.
Ya están aquí las bases de datos de aprendizaje automático
Empresas como Microsoft y Oracle ya han comenzado a incorporar diferentes capacidades de aprendizaje automático en las bases de datos. Por ejemplo, Microsoft Azure SQL Database tiene un módulo que sugiere y recomienda diferentes estrategias de mejora del rendimiento que se pueden aplicar automáticamente. De manera similar, el Almacén de consultas de SQL Server proporciona un plan para identificar las consultas que provocan cuellos de botella en el rendimiento. La base de datos Oracle 18c contiene capacidades de recuperación automática y puede aplicar parches y actualizar cada vez que se produce un problema en la base de datos. Un buen conocimiento del aprendizaje automático en realidad ayuda a los desarrolladores de bases de datos a comprender la lógica detrás de las diferentes recomendaciones hechas por las herramientas de base de datos de aprendizaje automático.
El advenimiento de las bases de datos totalmente autónomas
Las bases de datos de aprendizaje automático actuales tienen capacidades limitadas. El enfoque de la investigación actual es desarrollar bases de datos completamente automatizadas. ¿No sería bueno tener una base de datos que pueda anticipar los problemas que van a ocurrir y que sea lo suficientemente proactiva como para tomar medidas preventivas con anticipación? ¿O no sería mucho más fácil la vida de un profesional de bases de datos si la base de datos se respaldara automáticamente cada vez que ocurre una transacción crucial? Hay muchos escenarios en los que las bases de datos de aprendizaje automático son extremadamente útiles.
Por ejemplo, las bases de datos existentes realizan copias de seguridad automáticas en un momento específico, pero no vale la pena respaldar todas las transacciones de la base de datos. En este tipo de escenario, las bases de datos de aprendizaje automático podrían volverse lo suficientemente inteligentes como para saber cuándo hacer una copia de seguridad y cuándo no.
Además, muchos problemas de la base de datos se pueden anticipar de antemano. Por ejemplo, en los escenarios en los que varios usuarios acceden a diferentes recursos de la base de datos, la probabilidad de un interbloqueo aumenta muchas veces. Si esto sucediera, una base de datos de aprendizaje automático podría pasar a proporcionar acceso controlado a los recursos y evitar un punto muerto.
Hay varios grupos académicos de investigación que han intentado desarrollar bases de datos totalmente autónomas.
Carnegie Mellon Database Research Group ha desarrollado el proyecto OtterTune que utiliza técnicas de aprendizaje automático y datos de carga de trabajo de una gran cantidad de bases de datos antiguas para crear modelos capaces de ajustar automáticamente nuevas cargas de trabajo. La base de datos de aprendizaje automático de OtterTune también recomienda automáticamente la configuración óptima para mejorar el rendimiento y reducir la latencia para las nuevas aplicaciones de base de datos.
El MIT también ha desarrollado un marco de gestión de base de datos de código abierto llamado DBSee r que predice el rendimiento de un conjunto determinado de recursos de la base de datos e identifica los cuellos de botella del rendimiento.
Curva de aprendizaje
El aprendizaje automático a menudo se define como la intersección de la informática y las estadísticas. Cualquier persona con conocimientos de informática puede desarrollar con relativa rapidez sus habilidades de aprendizaje automático a un nivel intermedio si desarrolla una comprensión razonable de las estadísticas.
Muchas herramientas GUI y plataformas en la nube como Google AI, IBM Watson, Amazon Sagemaker, Azure ML han simplificado el proceso de implementación de técnicas de aprendizaje automático al proporcionar interfaces de arrastrar y soltar basadas en GUI para bases de datos de aprendizaje automático. Los usuarios solo tienen que saber cómo usar la herramienta, ya que la mayor parte del trabajo (agregar conjuntos de datos, seleccionar técnicas de preprocesamiento, entrenar el modelo y finalmente evaluar el modelo) se puede realizar con unos pocos clics del mouse.
Sin embargo, si un profesional de bases de datos realmente quiere desarrollar una carrera en aprendizaje automático avanzado, deberá desarrollar una comprensión profunda de las estadísticas. La experiencia en informática de un profesional de bases de datos será más que suficiente para comprender rápidamente los conceptos de aprendizaje automático relacionados con la informática.
Sin embargo, como dijimos anteriormente, si un profesional de bases de datos solo está interesado en usar el aprendizaje automático para automatizar tareas repetitivas, un conocimiento de las herramientas de aprendizaje automático basadas en GUI será más que suficiente.
Múltiples trayectorias profesionales
El éxito del aprendizaje automático y la inteligencia artificial ha llevado a las organizaciones a desarrollar equipos de ciencia de datos dedicados que contengan expertos en aprendizaje automático.
Actualmente, los expertos en aprendizaje automático y los profesionales de bases de datos tienen diferentes trayectorias profesionales; sin embargo, cada vez más organizaciones esperan que los expertos en aprendizaje automático o ciencia de datos tengan algún nivel de experiencia en bases de datos, y viceversa.
Dado que esto está cambiando actualmente, se prefieren los profesionales de bases de datos con conocimiento de las habilidades de aprendizaje automático y tienen mejores posibilidades de ser contratados como profesionales de bases de datos, expertos en aprendizaje automático o alguien con ambas responsabilidades laborales.
Veredicto final
Es probable que el advenimiento de los macrodatos y las técnicas relacionadas con el aprendizaje automático generen cambios sustanciales en las responsabilidades laborales de los profesionales de las bases de datos, ya que con el tiempo su enfoque cambiará a los datos de la base de datos, ya que las bases de datos de aprendizaje automático se autogestionan cada vez más.
El aprendizaje automático ayudará a los profesionales de bases de datos a automatizar muchas tareas manuales y laboriosas, y los liberará para invertir tiempo y esfuerzo en adoptar las habilidades de aprendizaje automático y ponerlas en práctica.
Aprender las estadísticas requeridas para pasar de ser un profesional de bases de datos a una base de datos más amplia y el aprendizaje automático no es sencillo, pero pagará grandes dividendos en términos de oportunidades y crecimiento profesional.