Amazon S3
¿Qué es Amazon S3?
Amazon S3 o Amazon Simple Storage Service es un servicio de Amazon Web Services (AWS) que ofrece almacenamiento de objetos a través de una interfaz de servicio web. Se utiliza el mismo sistema de almacenamiento escalable que Amazon.com utiliza para operar su red global de comercio electrónico. Esta herramienta se puede utilizar para almacenar cualquier forma de objeto que se puede utilizar para aplicaciones de Internet como el almacenamiento, backup, etc.
Clientes de todos los tamaños y sectores pueden utilizar Amazon S3 para almacenar y proteger cualquier cantidad de datos para diversos casos de uso, como sitios web, aplicaciones móviles, procesos de copia de seguridad y restauración, operaciones de archivado, aplicaciones empresariales, dispositivos IoT y análisis de big data. S3 proporciona características de administración fáciles de utilizar que le permiten organizar los datos y configurar sofisticados controles de acceso con objeto de satisfacer sus requisitos empresariales, organizativos y de conformidad. S3 está diseñado para ofrecer una durabilidad del 99,999999999 % (11 nueves) y almacena datos de millones de aplicaciones para empresas de todo el mundo.
Historia de Amazon S3
En 2006, Amazon Web Services agregó AmazonS3. En abril de 2013, se estima que tiene más de 2 billones de artículos. Esto refleja una mejora respecto de 10.000 millones de objetos en octubre de 2007, 14.000 millones de objetos en enero de 2008, 29.000 millones de objetos en octubre de 2008, 52.000 millones de objetos en marzo de 2009, 64.000 millones de objetos en agosto de 2009 y 102.000 millones de objetos en marzo de 2010. AWS introdujo capacidades de cifrado por defecto a nivel de cubo en noviembre de 2017.
Diseño de Amazon S3
Aunque Amazon Web Services ( AWS) no proporciona públicamente los detalles del diseño técnico de S3, Amazon S3 gestiona los datos con una arquitectura de almacenamiento de objetos que tiene como objetivo proporcionar 99.99999999999 por ciento de durabilidad y entre 99.95 por ciento a 99.99 por ciento de disponibilidad con escalabilidad , alta disponibilidad y baja latencia (aunque no hay acuerdo a nivel de servicio para la durabilidad).
Los objetos que se agrupan en buckets son las unidades de almacenamiento fundamentales de esta herramienta. Una clave especial asignada por el usuario identifica cada objeto. Los buckets se pueden controlar ya sea usando la consola provista por Amazon S3, programáticamente usando el SDK de AWS, o usando la interfaz de programación (API) de la aplicación REST de S3. Los objetos se pueden manejar usando el SDK de AWS o la API REST de Amazon S3, y con dos kilobytes de metadatos, pueden tener hasta cinco terabytes de tamaño.
Las solicitudes se permiten utilizando una lista de controles de acceso asociados con y bucket de elementos y compatibilidad de versionado que está deshabilitada por defecto. Note que debido a que los buckets en otros sistemas suelen ser del tamaño de un sistema de archivos completo, este esquema de control de acceso es bastante grueso, i.e. no puede tener controles especiales de acceso relacionados con archivos. Los bucket names y las claves se seleccionan para poder manejar objetos usando URLs HTTP, algunas de ellas son:
- http://s3.amazonaws.com/bucket/key (for a bucket created in the US East (N. Virginia) region)
- https://s3.amazonaws.com/bucket/key
- http://s3-region.amazonaws.com/bucket/key
- https://s3-region.amazonaws.com/bucket/key
- http://s3.region.amazonaws.com/bucket/key
- https://s3.region.amazonaws.com/bucket/key
- http://s3.dualstack.region.amazonaws.com/bucket/key (for requests using IPv4 or IPv6)
Características de Amazon S3
- Administración del almacenamiento: Los nombres de los buckets de S3, prefijos, etiquetas de objetos y S3 Inventory le ofrecen diversas formas de clasificar sus datos en categorías y de informar sobre estos; posteriormente, podrá configurar otras características de S3 para realizar acciones. S3 Batch Operations facilita la administración de datos en S3 a cualquier escala.
- Monitorización del almacenamiento: Aplique etiquetas a los buckets de S3 para asignar costos en múltiples dimensiones de negocio (por ejemplo, centros de costos, nombres de aplicación o propietarios) y, después, utilice los informes de asignación de costos de AWS para ver el uso y los costos que agregan las etiquetas de bucket.
- Seguridad: Utilice los puntos de enlace de la VPC para conectarse a los recursos de S3 desde su instancia de Amazon Virtual Private Cloud (Amazon VPC). Amazon S3 admite el cifrado tanto del lado de servidor (con tres opciones de administración clave) como del lado de cliente para cargas de datos. Utilice S3 Inventory para comprobar el estado de cifrado de sus objetos de S3.
- Consulta in situ: S3 Select es una característica de S3 diseñada para incrementar el rendimiento de las consultas en hasta un 400 % y para reducir los costos de estas hasta un 80 %. Su funcionamiento consiste en recuperar un subconjunto de datos de un objeto (mediante expresiones SQL simples) en lugar de todo el objeto, que puede tener un tamaño de hasta 5 terabytes.
- Transferencia de datos: AWS proporciona un paquete de servicios de transferencia de datos con el fin de brindar la solución adecuada para cualquier proyecto de migración de datos. Brinda herramientas de transferencia como: Almacenamiento de nube híbrida(AWS Storage Gateway), Transferencia de datos en línea(AWS DataSync), Transferencia de datos sin conexión(AWS Snow Family).
Hosting de sitios web (Hosting)
La elección de alojar sitios web HTML estáticos con soporte de documentos de índice y soporte de documentos de error es proporcionada por Amazon S3. Los sitios web alojados en S3 pueden designar una página por defecto que se mostrará y otra página que se mostrará en caso de una URL parcialmente inválida, como un error 404, que proporciona a los visitantes con contenido útil con un nombre de host de registro CNAME en lugar de una URL del árbitro de cubo directa.
Clases de almacenamiento de Amazon S3
Esta herramienta proporciona cuatro grupos diferentes de almacenamiento que proporcionan diferentes criterios de longevidad, disponibilidad y niveles de rendimiento.
- La clase predeterminada es Amazon S3 Standard.
- Amazon S3 Standard Infrequent Access (IA) está optimizada para acceder a datos con menos regularidad. Los casos típicos de uso incluyen soluciones de respaldo y recuperación ante desastres.
- Amazon S3 One Zone-Infrequent Access está diseñado para datos que no suelen ser necesarios, pero que deben ser accedidos rápidamente cuando sea necesario.
- Amazon Glacier está diseñado para el almacenamiento a largo plazo de datos a los que rara vez se accede y donde minutos u horas de retraso de recuperación son apropiados. ‘Glacier Deep Archive’ es una opción con un mínimo de 12 horas de tiempo de recuperación, pero 1/4 del precio. Está pensado como una alternativa a las bibliotecas de cinta magnética y está destinado a 7 a 10 años de retención de datos a largo plazo.
Puntos de acceso de S3
Los puntos de acceso de S3 simplifican la administración del acceso de datos a escala para aplicaciones que utilizan conjuntos de datos compartidos en S3. Con los puntos de acceso de S3, ahora puede fácilmente crear cientos de puntos de acceso por bucket, representando un nuevo modo de suministrar acceso a conjuntos de datos compartidos. Los puntos de acceso proporcionan una ruta personalizada hacia un bucket, con un nombre de host único y una política de acceso que imponga los permisos específicos y los controles de red para cualquier solicitud realizada a través del punto de acceso.
Ejemplos de implementaciones de almacenamiento compatibles con Amazon S3:
- ActiveScale (Quantum)
- Caringo Swarm
- Ceph with RADOS gateway
- Cloudian HyperStore
- CloudServer
- Apache CloudStack
- Connectria’s Cloud Storage
- DDN Web Object Scaler (WOS) for on-premise cloud storage
- DELL EMC Elastic Cloud Storage (ECS)
- DreamHost DreamObjects
- DigitalOcean Spaces
- Eucalyptus
- IBM Cloud Object Storage
Autor: Juan Sebastián Martínez Martínez
Editor: Carlos Iván Pinzón
Código: UCRV-8
Universidad: Universidad Central
Fuentes:
[1] AWS. (2020).Amazon S3: Almacenamiento de datos seguro en la nube(S3). Amazon Web Services:
[2] Amazon S3. (19 de septiembre de 2020). En Wikipedia:
[3] AWS. (2015). Características de Amazon S3. Amazon Web Services:
[4] AWS. (2015). Amazon S3 Batch Operations[Imagen]. Amazon Web Services:
[5] López Bonilla P. (2019). amazon-s3[Imagen]. Una al Día:
[6] Wittig A. (2016). fig_s3_overview[Imagen].cloudonaut:
[7] AWS. (2020). Diagram_S3_Access_Points[Imagen]. Amazon Web Services: