Amazon Aurora

¿Qué es Amazon Aurora?

Amazon Aurora (Aurora) es un motor de base de datos relacional completamente administrado compatible con MySQL y PostgreSQL. Ya sabe cómo MySQL y PostgreSQL combinan la velocidad y la fiabilidad de las bases de datos comerciales de gama alta con la sencillez y la rentabilidad de las bases de datos de código abierto.

El código, las herramientas y las aplicaciones que se utilizan actualmente con las bases de datos MySQL y PostgreSQL se pueden usar con Aurora. Con algunas cargas de trabajo, Aurora puede proporcionar hasta cinco veces el rendimiento de MySQL y hasta tres veces el rendimiento de PostgreSQL sin requerir cambios en la mayoría de las aplicaciones existentes.

Aurora incluye un subsistema de almacenamiento de alto rendimiento. Sus motores de base de datos compatibles con MySQL y PostgreSQL están personalizados para aprovechar su almacenamiento de rápida distribución.

El almacenamiento subyacente crece automáticamente en función de las necesidades. Un volumen de clúster de Aurora puede aumentar hasta un tamaño máximo de 128 tebibytes (TiB). Aurora también automatiza y estandariza la agrupación en clústeres y la reproducción de base de datos, que suelen ser algunos de los aspectos más problemáticos de la configuración y administración de las bases de datos.

Aurora forma parte del servicio de base de datos administrada de Amazon Relational Database Service (Amazon RDS). Amazon RDS es un servicio web que facilita la configuración, el funcionamiento y el escalado de una base de datos relacional en la nube. Si no está familiarizado con Amazon RDS, consulte la Guía del usuario de Amazon Relational Database Service.

¿Qué caracteriza a Amazon Aurora?

Las principales características son la escalabilidad y el alto rendimiento:

 

  1. Procesamiento hasta 5 veces superior al de MySQL

Las pruebas con valores de referencia estándar, como SysBench, han revelado un aumento del rendimiento 5 veces mayor con respecto a un MySQL tradicional en hardware similar.

Amazon Aurora utiliza distintas técnicas de software y hardware para garantizar que el motor de base de datos pueda utilizar plenamente los recursos informáticos, la memoria y las redes disponibles. Las operaciones de E/S utilizan técnicas de sistemas distribuidos, como los cuórums, para mejorar la estabilidad del rendimiento.

  1. Escalado de informática con el botón de inserción

Mediante las API de Amazon Relational Database Service (Amazon RDS) o con unos pocos clics en la consola de administración de AWS, podrá escalar los recursos informáticos y de memoria a fin de ampliar o reducir su implementación. Las operaciones de escalado de informática normalmente se llevan a cabo en cuestión de minutos.

  1. Escalado automático de almacenamiento

Amazon Aurora aumenta automáticamente el tamaño del volumen de la base de datos a medida que aumentan las necesidades de almacenamiento. El volumen aumenta de a 10 GB, hasta un máximo de 128 TB. No es necesario que aprovisione un almacenamiento excesivo para la base de datos para afrontar el crecimiento futuro.

  1. Réplicas de lectura de baja latencia

Puede aumentar el rendimiento de lectura para admitir solicitudes de aplicaciones de volumen alto mediante la creación de hasta 15 réplicas de bases de datos de Amazon Aurora. Estas réplicas comparten el mismo almacenamiento subyacente que la instancia fuente, lo que reduce los costos y evita la necesidad de realizar escrituras en los nodos de réplica.

Esto libera más capacidad de procesamiento para atender las solicitudes de lectura y reduce el tiempo de retraso de la réplica, que suele limitarse a milisegundos de un solo dígito. Aurora suministra un punto de enlace del lector para que la aplicación pueda conectarse sin tener que realizar un seguimiento de las réplicas a medida que se agregan y eliminan.

También admite el escalado automático, que permite la incorporación y la eliminación automática de réplicas en respuesta a los cambios en las métricas de rendimiento que usted especifique.

  1. Configuración sin servidor

Amazon Aurora Serverless es una configuración de escalado automático bajo demanda para Aurora, en la que la base de datos activa, cierra, amplía o reduce su capacidad automáticamente en función de las necesidades de la aplicación. Ejecute su base de datos en la nube sin necesidad de administrar ninguna instancia de base de datos.

  1. Puntos de enlace de base de datos personalizados

Los puntos de enlace personalizados le permiten distribuir y equilibrar las cargas de trabajo entre diferentes conjuntos de instancias de base de datos. Por ejemplo, puede aprovisionar un conjunto de réplicas de Aurora para utilizar un tipo de instancia con mayor capacidad de memoria a fin de ejecutar una carga de trabajo de análisis.

Luego, un punto de enlace personalizado puede ayudarlo a dirigir la carga de trabajo a estas instancias configuradas correctamente, mientras que las demás instancias se mantienen aisladas de la carga de trabajo.

  1. Consulta en paralelo

La consulta en paralelo de Amazon Aurora permite realizar consultas de análisis más rápidas en relación a sus datos actuales. Puede agilizar las consultas en hasta dos órdenes de magnitud, mientras se mantiene un alto rendimiento en la carga de trabajo de transacciones principal.

Si lleva el procesamiento de consultas a la capa de almacenamiento de Aurora, gana una gran cantidad de potencia de informática, a la vez que reduce el tráfico de la red. Utilice las consultas en paralelo para ejecutar cargas de trabajo transaccionales y analíticas una junto a la otra en la misma base de datos de Aurora.

 

La clave: los clústeres

Una de las principales razones de su eficiencia son los clústeres de bases. Un clúster de base de datos de Amazon Aurora se compone de una o varias instancias de base de datos y de un volumen de clúster que administra los datos de esas instancias de base de datos.

Un volumen de clúster de Aurora es un volumen de almacenamiento de base de datos virtual que abarca varias zonas de disponibilidad, de modo que una de esas zonas tiene una copia de los datos del clúster de base de datos. Un clúster de base de datos Aurora se compone de dos tipos de instancias de base de datos:

  • Instancia de base de datos principal: admite operaciones de lectura y escritura y realiza todas las modificaciones de los datos en el volumen de clúster. Cada clúster de base de datos Aurora tiene una instancia de base de datos principal.
  • Réplica de Aurora: se conecta con el mismo volumen de almacenamiento que la instancia de base de datos principal y solo admite operaciones de lectura. Cada clúster de base de datos Aurora puede tener hasta 15 réplicas de Aurora, además de la instancia de base de datos principal. Mantenga una alta disponibilidad localizando réplicas de Aurora en distintas zonas de disponibilidad. Aurora cambiará automáticamente a una réplica de Aurora en caso de que la instancia de base de datos principal deje de estar disponible. Puede especificar la prioridad de conmutación por error para réplicas de Aurora. Las réplicas de Aurora también pueden descargar las cargas de trabajo de lectura desde la instancia de base de datos principal.

El clúster de Aurora muestra la separación de la capacidad informática y almacenamiento. Por ejemplo, una configuración de Aurora con solo una instancia de base de datos sigue siendo un clúster, pero el volumen de almacenamiento subyacente implica que haya varios nodos de almacenamiento distribuidos en varias zonas de disponibilidad (AZ).

 

 

Mejora tu rentabilidad con Amazon Aurora

  1. Paga solo por lo que utilizas

Con Amazon Aurora no existen los compromisos iniciales, sino que simplemente se paga una tarifa por hora por cada instancia lanzada. Además, cuando ya no necesite una instancia de base de datos de Amazon Aurora, puede eliminarla fácilmente.

No es necesario aprovisionar almacenamiento en exceso como medida de seguridad y solo paga por el almacenamiento que consuma realmente. Para obtener más detalles, consulte la página de precios de Amazon Aurora.

  1. Optimiza los costos de E/S

Para una aplicación de análisis intensivo, los costos de E/S son por norma general el factor que más influye en el costo de la base de datos. E/S se refiere a las operaciones entrantes y salientes que realiza el motor de base de datos de Aurora en la capa de almacenamiento virtualizado basado en SSD.

Cada operación de lectura de página de la base de datos se cuenta como una operación de E/S. El motor de base de datos de Aurora emite lecturas en la capa de almacenamiento para recuperar páginas de base de datos que no se encuentran en la caché del búfer.

Cada página de base de datos representa 16 KB en Aurora compatible con MySQL. Aurora se diseñó para eliminar operaciones de E/S innecesarias. Esto permite reducir costos y garantizar que los recursos estén disponibles cuando se necesiten para el tráfico de lectura y escritura.

Solo se consumen operaciones de E/S de escritura cuando se insertan registros de transacciones en la capa de almacenamiento para que las escrituras sean duraderas. Las operaciones de E/S de escritura se cuentan en unidades de 4 KB. Por ejemplo, un registro de transacción que tiene 1024 bytes se cuenta como una operación de E/S.

Sin embargo, las operaciones de escritura simultáneas cuyo registro de transacción tenga menos de 4 KB se pueden agrupar por lotes en el motor de base de datos de Aurora para optimizar el consumo de operaciones de E/S. A diferencia de los motores de base de datos tradicionales, Amazon Aurora nunca inserta páginas de base de datos modificadas en la capa de almacenamiento, y esto permite reducir el consumo de operaciones de E/S.

Para ver la cantidad de operaciones de E/S que consume una instancia de Aurora, vaya a la consola de AWS. Para buscar su consumo de operaciones de E/S, vaya a la sección RDS de la consola, mire la lista de instancias, seleccione las instancias de Aurora y luego busque las métricas “Operaciones de lectura facturadas” y “Operaciones de escritura facturadas” en la sección de monitoreo. Para obtener más detalles, consulte la página de precios de Amazon Aurora.