Hola a todos, bienvenido a #BreakingtheCloud, yo soy Carlos Cortez @ccortezb y esto es cobertura del re:invent 2020 día tras día.
¡Vayamos directo al grano!
Nuevas instancias y más nombres que aprenderse
Alguna de ellas que soportan Arm Graviton2
Amazon EC2 C6gn! Con 100 gbps
Durante la mañana también fue lanzado:
*D3dn (Dense Storage)
*R5b (EBS Performance)
*M5zn (ntel Xeon Scalable CPU)
*G4ad (AMD GPUs)
Nuevas características:
Nueva EC2 D3 y D3dn hace referencia a instancias con bajo costo en discos magnéticos. Son perfectos para procesamiento big data y montar los datos en HDFS, procesamiento de logs, etc.
Cabe resaltar que el costo de Terabytes es 80% menor que cuando usábamos D2.
Nueva EC2 R5b, nueva en la familia, con AWS Nitro System, con 60 gbps de ancho de banda en el EBS y con 260 mil de IOPS ya se nos desborda de las manos! OMG! La R5 norma solo llega hasta 19 gbps
Cuando pensábamos que ya habíamos tocado el cielo, viene la nueva EC2 M5zn! La evolución de la z1d, también con AWS Nitro System y EFA (Elastic Fabric Adapter) especialmente diseñada para HPC.
Pero, ¿para qué se necesitaría este tipo de instancia? Lo vimos en la Keynote, un buen ejemplo es BOOM, Supersonic Passenger Airplanes.
*Industria Aeroespacial
*Automoviles
*Aplicaciones financieras
*Simulación de modelamiento de aplicaciones
*Energía, etc..
Habana Gaudi-based Amazon EC2 instances
La verdadera competencia de NVIDIA
AWS, nunca escapa poder presentar nueva tecnología para machine learning, pero que cosa realmente es Habana Gaudi?
Habana Labs es una start-up israelí, adquirida luego por Intel que tienen los Procesadores para AI, llamados Gaudi AI processors.
Excelentes para correr modelos de deep learning, en todas sus gamas: NLP, Computer vision, motor de recomendaciones, etc.
Por qué Habana Gaudi?
40% más económicas que las anteriores EC2 con procesamiento de GPU para ML. Y Lo más impactante es que tendremos hasta 8 tarjetas Gaudi:
An 8-card Gaudi EC2 instance can process about 12,000 images->per-second training the ResNet-50 model on TensorFlow. Each >Gaudi processor integrates 32GB of HBM2 memory and features >RoCE on-chip integration used for inter-processor >connectivity inside the server. Scaling across servers will >be enabled using the AWS Elastic Fabric Adapter (EFA) >technology, allowing AWS and its customers to seamlessly >expand use of multiple Gaudi based systems for efficient and >scalable distributed training.
Fuente: Hanaba: https://habana.ai/habana-gaudi-ai-processors-to-bring-lower-cost-to-train-to-amazon-ec2-customers/
El hermano menor de Inferencia: AWS Trainium
Un Billón de cálculos por segundo? La mayor cantidad de TFLOPS, chip de entrenamiento? ¿Qué son estas cosas y cómo lo entendemos más fácil?
Primero que todo, volvamos a Inferentia, que fue lanzado en el 2019. Palabras claves?
- Chip de inferencia para modelos de ML
- Neuron SDK, ¿qué es? Un compilador.
- Instancias Inf1 EC2, que corren con el chip de Inferencia.
Aprendamos los términos:
El término FLOPS (Floating point operations per second) >significa “operaciones de coma flotante por segundo”, es una >unidad que se utiliza para medir cálculos matemáticos que >puede hacer por segundo una CPU o en una GPU.
De allí viene GigaFlops, es decir millones de cálculos por >segundo y TeraFlops, Billones de cálculos por segundo.
AWS Trainium sale a cubrir todo lo que Inferentia no hace, es decir la parte del entrenamiento. También funcionará con Neuron SDK y en instancias Inf1
Ya puedo usarlo?
No, aún estará disponible en los primeros meses del 2021. Así que atento a las noticias.
Nos alineamos con las nubes. ECS y EKS desde cualquier lado.
Ahora podremos correr cargas de trabajo literalmente desde donde se nos plazca,
Como funcionará?
- Seguiremos usando el Clásico ECS Control Plane dentro de la región
- Se instalará el agente de AWS Systems Manager
- Se agrega y veremos un nuevo tipo de opción para lanzar ECS, aparte de los ya conocidos “EC2” y “FARGATE” se tendrá uno nuevo llamado “EXTERNAL”.
Revisen el blog oficial donde encontrarán una demo y un diagrama de cómo se verá realmente:
EKS Distro de código abierto!
ECS no es el único que recibe una actualización, sino que EKS también podrá “desplegarse en cualquier lado” de una manera distinta. La distribución de Kubernetes que usa EKS será puesta a disposición de la comunidad.
Veamos qué podemos construir con esta nueva característica en la que recién tendremos acceso a mediados del 2021.
Github Repo:
Lambda ahora nos cobra por cada 1 ms. Debo preocuparme?
Serverless Lovers, acaso no es genial que ahora Lambda nos cobre por cada milisegundo procesado de cómputo?
Solo si tienen cargas de trabajo de millones y millones de transacciones verás la diferencia sustancial.
Tengo que resaltar que también va a ser soportado por Provisioned Concurrency para realizar pruebas de carga. Esto sí está espectacular!
Ejemplo:
50 millones de transacciones de 100 ms vs 50 ms tiene una mejora de 25% en costos.
Desarrollando microservicios ahora con AWS Proton!, es en serio? Más vendor lock-in? más simplicidad?
Después de leerme parte de la documentación, tengo que decirles que aprovechen este post, porque les explicaré algo que me tomó varios minutos entenderlo. Vamos AWS, sí que hiciste algo complicado al inicio con todos esos componentes nuevos, templates, environments, services, services templates y más! Ufff, ahora sí vayamos a AWS Proton:
Qué realmente es?
Automatiza:
- aprovisionamiento y
- despliegue: Sólo para infraestructura relacionada con Serverless y Contenedores. Con 2 caminos: Equipo de infra aprovisiona y Equipo de desarrollo consume.
- Infra estandarizada: CloudFormation
- CI/CD Integrado para que sea consumido por los desarrolladores.
Cómo va funcionar?
Antes de nada según la documentación nos piden algunos pre-requisitos!!!!!
Permisos de Admin, IAM Roles, Saber CloudFormation y Jinja y pues un repositorio Github
Proton desde cero:
- Creamos la plantilla de ambientes (environment template)
- Creamos un ambiente (Proton Environment)
- Crear una plantilla de servicio
- Crear un Proton Service y desplegar una aplicación
Proton simplifica la entrega de infraestructura como también define un estándar. Es cierto que seguimos usando CloudFormation, posiblemente veamos integraciones internas con SAM y luego con third-party apps como Terraform que puedan ir agregándole a esta gran herramienta.
Genera vendor lock-in de alguna manera, seguimos usando CloudFormation, tal vez en el roadmap de desarrollo estén pensando integrar herramientas de testing para plantillas así como pruebas de seguridad,
Beneficios?
*Rapidez en la entrega de Infraestructura para los que ya *tenemos todo corriendo con CloudFormation.
*Simplicidad para el desarrollador elegir y desplegar en ambientes aislados
*Pruebas rápidas de aplicaciones
Estemos atentos a lo que se viene con AWS Proton!
¡Actualizados al fin! ¡Llegó la nueva generación de EBS! gp3 e io2
¿Qué hay de nuevo con gp3? 20% más económico y 4x mejor performance
Simplemente una muy buena opción, ahora tendremos 3,000 IOPS de base para todo el volumen, mientras que en gp2 tenemos 3 IOPS por GB.
Habrá que afinar más la calculadora para ver cuál conviene y en qué momento.
Acciones inmediatas
: Migremos todo a gp3 right now!
Pueden revisar más en el blog oficial de AWS:
https://aws.amazon.com/es/blogs/aws/new-amazon-ebs-gp3-volume-lets-you-provision-performance-separate-from-capacity-and-offers-20-lower-price/
Y por último, tenemos a:
Nuevo EBS io2 Block Express al mismo precio que io1?
La nueva generación de los discos EBS especializados para IOPS, tienen un gran aumento en el ratio de IOPS por GB, subiendo a 500 IOPS por GB.
Lo interesante y raro al mismo tiempo es que está al mismo precio que su generación anterior y sport muchisimo más IOPS, de manera que es mandatorio que migremos todo lo que actualmente esté en io1 hacia io2
Algo tan simple como esto:
aws ec2 modify-volume --volume-id vol-0b3c663aeca5aabb7 --volume-type io2
Pueden revisar más en el blog oficial de AWS:
https://aws.amazon.com/es/blogs/aws/new-ebs-volume-type-io2-more-iops-gib-higher-durability/
Definitivamente fue un día muy largo y lleno de emociones. Lo vivimos tal cual fuese presencial, como un partido de Fútbol, cómo cuándo Perú volvió al mundial después de 36 años. Gritando cada nuevo servicio lanzado, especialmente los de Sagemaker que son mis favoritos y haré un post especial para cada uno de ellos!
Por ahora terminamos con esta parte 1 del Keynote, realmente espectacular y esperando probar estos servicios en estos días, espero les haya servido y por favor comenten y compartan.
En la siguiente parte:
- Parte 1: EC2 y microservicios
- Parte 2: Bases de datos y ML
- Parte 3: Contact Center e Industrial IoT
Unanse al Slack de AWS UG Perú para recibir noticias en vivo del re:invent 2020,
Estén atentos para cuando lancemos los After Party de los anuncios en las noches, y puedas unirte a discutir con nosotros. Vive las reacciones en vivo, repasemos los nuevos servicios y más sorpresas y sorteos!
Slack: https://join.slack.com/t/aws-peru/shared_invite/zt-jt2324io-3VBHUQ8iH5rEkqGchKicEw
Carlos Cortez - AWS UG Perú Leader / AWS ML Community Builder
ccortez@aws.pe
@ccortezb
Podcast: imperiocloud.com @imperiocloud
twitch.tv/awsugperu
cennticloud.thinkific.com
Top comments (0)