Oracle anuncia MySQL HeatWave ML, la forma más fácil, rápida y económica para que los desarrolladores añadan potentes capacidades de aprendizaje automático a sus aplicaciones MySQL

Oracle ha anunciado que Oracle MySQL HeatWave soporta ahora machine learning (ML) dentro de la base de datos, como complemento del procesamiento de transacciones y de la analítica disponibles anteriormente, siendo el único servicio de base de datos en la nube de MySQL que lo hace. MySQL HeatWave ML automatiza completamente el ciclo de vida del ML y almacena todos los modelos entrenados dentro de la base de datos MySQL, eliminando la necesidad de mover los datos o el modelo a una herramienta o servicio de machine learning. La eliminación del ETL reduce la complejidad de la aplicación, disminuye el coste y mejora la seguridad tanto de los datos como del modelo. HeatWave ML se incluye con el servicio cloud de la base de datos MySQL HeatWave en las 37 regiones de Oracle Cloud Infrastructure (OCI).

Hasta ahora, añadir capacidades de machine learning a las aplicaciones de MySQL ha sido prohibitivamente difícil y ha consumido mucho tiempo de los desarrolladores. En primer lugar, está el proceso de extracción de datos fuera de la base de datos y en otro sistema para crear y desplegar modelos de ML. Este enfoque crea múltiples silos para aplicar el machine learning a los datos de la aplicación e introduce latencia a medida que los datos se mueven. También conduce a la proliferación de datos fuera de la base de datos, lo que la hace más vulnerable a las amenazas de seguridad y añade complejidad para que los desarrolladores programen en múltiples entornos. En segundo lugar, los servicios existentes esperan que los desarrolladores sean expertos en guiar el proceso de entrenamiento del modelo ML; de lo contrario, el modelo no es óptimo, lo que degrada la precisión de las predicciones. Por último, la mayoría de las soluciones de ML existentes no incluyen la funcionalidad de proporcionar explicaciones sobre por qué los modelos que los desarrolladores construyen ofrecen predicciones específicas.

MySQL HeatWave ML resuelve estos problemas integrando de forma nativa las capacidades de machine learning dentro de la base de datos MySQL, eliminando la necesidad de extraer, transformar y cargar (ETL) los datos a otro servicio. HeatWave ML automatiza completamente el proceso de entrenamiento y crea un modelo con el mejor algoritmo, las características óptimas y los hiperparámetros óptimos para un conjunto de datos dado y una tarea especificada. Todos los modelos generados por HeatWave ML pueden proporcionar explicaciones sobre el modelo y la predicción.

Ningún otro proveedor de bases de datos en la nube ofrece capacidades de ML tan avanzadas directamente dentro de su servicio de base de datos. Oracle publicó pruebas de referencia de ML realizadas en un gran número de conjuntos de datos de clasificación y regresión de machine learning disponibles públicamente, como Numerai, Namao y Bank Marketing, entre otros. De media, en el clúster más pequeño, HeatWave ML entrena modelos de machine learning 25 veces más rápido con el 1% del coste de Redshift ML. Además, la ventaja de rendimiento sobre Redshift ML aumenta cuando el entrenamiento se realiza en un clúster de HeatWave más grande. El entrenamiento es un proceso que requiere mucho tiempo y, dado que puede realizarse de forma muy eficiente y rápida con MySQL HeatWave, los clientes pueden ahora volver a entrenar sus modelos con más frecuencia y mantenerse al día con los cambios en los datos. Esto mantiene los modelos actualizados y mejora la precisión de las predicciones.

“Al igual que integramos la analítica y el procesamiento de transacciones dentro de una única base de datos, ahora estamos llevando el machine learning dentro de MySQL HeatWave”, afirma Edward Screven, chief corporate architect, Oracle. “MySQL HeatWave es uno de los servicios en la nube de más rápido crecimiento en Oracle. Un número cada vez mayor de clientes ha migrado desde Amazon y otros servicios de bases de datos en la nube a MySQL HeatWave, y han obtenido importantes mejoras de rendimiento y menores costes. Hoy también anunciamos una serie de innovaciones que enriquecen las capacidades de HeatWave, mejoran la disponibilidad y reducen el coste. Nuestros nuevos y totalmente transparentes resultados de benchmark vuelven a demostrar que Snowflake, AWS, Microsoft y Google son más lentos y más caros que MSQL HeatWave por un amplio margen”.

HeatWave ML ofrece las siguientes capacidades en comparación con otros servicios de bases de datos cloud:
· Fully Automated Model Training: todas las etapas de creación de un modelo con HeatWave ML están totalmente automatizadas y no requieren ninguna intervención de los desarrolladores. Esto da como resultado un modelo ajustado que es más preciso, no requiere trabajo manual y el proceso de entrenamiento siempre se completa. Otros servicios de bases de datos en la nube, como Amazon Redshift, ofrecen integración con capacidades de aprendizaje automático en servicios externos, que requieren amplias entradas manuales de los desarrolladores durante el proceso de entrenamiento de ML.
· Model and Inference Explanations: la explicabilidad del modelo ayuda a los desarrolladores a entender el comportamiento de un modelo de aprendizaje automático. Por ejemplo, si un banco deniega un préstamo a un cliente, el banco necesita poder determinar qué parámetros del modelo se han tenido en cuenta, o si el modelo contiene algún sesgo. La explicabilidad de las predicciones es un conjunto de técnicas que ayudan a responder a la pregunta de por qué un modelo de aprendizaje automático hizo una predicción específica. Las explicaciones de las predicciones son cada vez más importantes hoy en día, ya que las empresas deben ser capaces de explicar las decisiones tomadas por sus modelos de aprendizaje automático. HeatWave ML integra tanto la explicación del modelo como las explicaciones de la predicción, como parte de su proceso de entrenamiento del modelo. Como resultado, todos los modelos creados por HeatWave ML pueden ofrecer explicaciones tanto del modelo como de la inferencia sin necesidad de datos de entrenamiento en el momento de la explicación de la inferencia. Oracle ha aumentado las técnicas de explicación existentes para mejorar el rendimiento, la interpretabilidad y la calidad. Otros servicios de bases de datos en la nube no ofrecen una capacidad de explicación tan rica para todos sus modelos de aprendizaje automático.
· Hyper-Parameter Tuning: HeatWave ML implementa un nuevo algoritmo de reducción basado en la búsqueda de gradientes para el ajuste de hiperparámetros. Esto permite que la búsqueda de hiperparámetros se ejecute en paralelo sin comprometer la precisión del modelo. El ajuste de hiperparámetros es la etapa que más tiempo consume en el entrenamiento de modelos de ML, y esta capacidad única proporciona a HeatWave ML una ventaja de rendimiento significativa sobre otros servicios en la nube para construir modelos de aprendizaje automático.
· Algorithm Selection: HeatWave ML utiliza la noción de modelos proxy -que son modelos simples que muestran las propiedades de un modelo complejo completo- para determinar el mejor algoritmo de ML para el entrenamiento. Utilizando un modelo proxy simple, la selección del algoritmo se realiza de forma muy eficiente, sin pérdida de precisión. Ningún otro servicio de base de datos para construir modelos de machine learning tiene esta capacidad de modelado proxy.
· Intelligent Data Sampling: durante el entrenamiento del modelo, HeatWave ML muestrea un pequeño porcentaje de los datos para mejorar el rendimiento. Este muestreo se realiza de tal manera que todos los puntos de datos representativos se capturan en el conjunto de datos de la muestra. Otros servicios en la nube para la creación de modelos de machine learning adoptan un enfoque menos eficiente -utilizando un muestreo de datos aleatorio- que muestrea un pequeño porcentaje de datos sin tener en cuenta las características de la distribución de los datos.
· Feature Selection: la selección de características ayuda a determinar los atributos de los datos de entrenamiento que influyen en el comportamiento del modelo de aprendizaje automático para hacer predicciones. Las técnicas de HeatWave ML para la selección de características han sido entrenadas en una amplia gama de conjuntos de datos en múltiples dominios y aplicaciones. A partir de estos datos estadísticos y de la metainformación recopilada, HeatWave ML es capaz de identificar eficazmente las características relevantes en un nuevo conjunto de datos.

Además de las capacidades de aprendizaje automático, Oracle ha incluido más innovaciones al servicio MySQL HeatWave. Real-time elasticity permite a los clientes aumentar y reducir el tamaño de su clúster HeatWave a cualquier número de nodos, sin ningún tiempo de inactividad o de sólo lectura, y sin necesidad de reequilibrar manualmente el clúster. También se incluye la compresión de datos, que permite a los clientes procesar el doble de datos por nodo y reduce los costes en casi un 50%, manteniendo la misma relación calidad-precio. Por último, una nueva función de pausa y reanudación permite a los clientes pausar HeatWave para ahorrar costes. Al reanudar, tanto los datos como las estadísticas necesarias para MySQL Autopilot se recargan automáticamente en HeatWave.

Impulso de clientes y socios en MySQL HeatWave

Astute Business Solutions es un socio líder de Oracle Cloud MSP. “Recientemente tuvimos la oportunidad de utilizar las capacidades de aprendizaje automático de HeatWave ML. Nos pareció muy innovador, fácil de usar, muy rápido y, lo más importante, es seguro, ya que los datos o el modelo no salen de la base de datos”, indica Arvind Rajan, Co-Founder and CEO of Astute Business Solutions. “Creemos que proporcionar machine learning en la base de datos es de gran interés para nuestros clientes y acelerará aún más la adopción de MySQL HeatWave”.

Estuda.com es un proveedor de SaaS educativo para las pruebas de los estudiantes K-12 en Brasil. “MySQL HeatWave mejoró el rendimiento de nuestras complejas consultas en 300 veces para obtener respuestas en segundos y a un 85 por ciento del coste en comparación con Google BigQuery, sin cambios en el código. Ahora podemos ofrecer mejor análisis en tiempo real a una escala de tres millones de usuarios y mejorar continuamente nuestra aplicación para mejorar el rendimiento de los estudiantes”, asegura Vitor Freitas, Co-founder and CTO, Estuda.com.

VRGlass es un productor brasileño de SaaS de aplicaciones y equipos metaversos para clientes corporativos. “Motivados por los avances logrados dentro del programa Oracle for Startup, VRGlass migró todos los datos de la aplicación a MySQL HeatWave desde AWS EC2. En tres horas logramos un aumento de 5 veces en el rendimiento de la base de datos para un evento virtual que alojó a más de un millón de visitantes y 1,7 millones de sesiones con mayor seguridad, y a la mitad del coste”, afirma Ohmar Tacla, CEO, VRGlass.

Genius Sonority es diseñador, desarrollador y operador de videojuegos en Japón. “Descubrimos que MySQL HeatWave mejoraba el rendimiento en 90 veces, lo que resolvió todos nuestros retos y preocupaciones que teníamos al mover los datos para realizar análisis en tiempo real. Fue una gran sorpresa para nosotros. Las extremas mejoras en el rendimiento nos ayudan a mejorar continuamente la experiencia de juego para que los clientes de todo el mundo disfruten del entretenimiento”, confirma Masayuki Kawamoto, Director, CTO, Genius Sonority.

Neovera es un proveedor de confianza de soluciones de ciberseguridad gestionadas desde hace más de 20 años. “MySQL HeatWave en OCI aumentó el rendimiento de nuestras consultas en 300 veces con una reducción del 80% del coste total de propiedad en comparación con nuestro entorno de base de datos MySQL local. Ahora podemos obtener informes analíticos en tiempo real dentro de nuestra base de datos OLTP para acelerar la mejora de nuestra aplicación de seguridad”, indica Arman Rawls, Sr. Oracle Database Architect, Neovera Inc.

“Oracle anunció MySQL HeatWave con Autopilot el pasado mes de agosto, lo que bien podría haber sido la mayor innovación en bases de datos de código abierto cloud en los últimos 20 años hasta ese momento”, afirma Carl Olofson, Research Vice President, Data Management Software, IDC. “Ahora Oracle ha ido más allá de su original unificación de OLTP y OLAP en HeatWave, con MySQL HeatWave ML. Oracle está trayendo todo el procesamiento y los modelos de aprendizaje automático dentro de la base de datos, de modo que los clientes no sólo evitan la gestión de las bases de datos ML aparte de la base de datos principal, sino que también eliminan las molestias de ETL, ganando velocidad, precisión y rentabilidad en el negocio”.

Deja una respuesta

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Salir /  Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Salir /  Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Salir /  Cambiar )

Conectando a %s

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.