Mas leido
Building Stories
Modo Rua: Redefiniendo el desarrollo de aplicaciones mediante iteración centrada en el usuario Ago 23
Building Stories
NuStories: Adaptación de productos para clientes fanáticos en varios países Oct 30
Culture & Values
Cómo los valores y la cultura de Nu dan forma a los productos que creamos Ago 7
Carreras
Reunimos a grandes mentes de diversos orígenes que permiten la discusión y el debate y mejoran la resolución de problemas.
Conoce más sobre nuestras carreras



La primera edición de 2025 del Nubank Engineering Meetup comenzó con un tema fundamental para quienes trabajan con arquitecturas distribuidas, microservicios y confiabilidad de sistemas: la observabilidad.
El evento, realizado en febrero, inauguró el calendario de encuentros técnicos del año con la participación de Guto (ingeniero en Nu y anfitrión de la noche), AWS Solution Architects Lucas Vieira Souza da Silva and Luis Tiani, as well as Nubank’s engineering team. Our representatives, Caio (Engineering Manager) and Otávio (Lead Engineer), shared the behind-the-scenes evolution of our log stack and the creation of the Observability Stream and Alexandria platforms.
El enfoque de la presentación fue discutir cómo integrar herramientas Open Source con servicios administrados de AWS para crear pipelines de observabilidad escalables y eficientes. La sesión abarcó desde los fundamentos de los tres pilares de la observabilidad—métricas, logs y traces—hasta demostraciones prácticas usando OpenTelemetry, Prometheus, Grafana y OpenSearch.
¿Qué es la observabilidad, realmente?
La pregunta que abrió la discusión fue tan sencilla como clave: ¿qué significa hacer que un sistema sea observable? La respuesta tiene que ver con la capacidad de responder, con datos concretos, a preguntas sobre el comportamiento interno de las aplicaciones en producción. Para eso usamos tres tipos de señales:
Estas señales se complementan entre sí y forman la base para construir dashboards, configurar alertas y realizar análisis profundos del sistema.
Descubre las oportunidades
El papel de OpenTelemetry
Una de las herramientas open source más relevantes hoy en día es OpenTelemetry, un proyecto mantenido por la CNCF que proporciona:
Con OpenTelemetry, es posible instrumentar aplicaciones, recolectar señales en distintos formatos (incluso Prometheus) y enviarlas a distintos destinos como OpenSearch, Prometheus y más.
Open source es libertad, pero también complejidad
La CNCF mantiene un ecosistema completo de herramientas open source para observabilidad, desde la ingesta de datos hasta la visualización. Pero montar y operar una stack 100% open source requiere tiempo, conocimientos técnicos y responsabilidad sobre la infraestructura, actualizaciones, escalabilidad y seguridad.
Aquí es donde entran los servicios administrados. La propuesta de AWS es simplificar la operación sin renunciar a la apertura tecnológica. En lugar de gestionar tu propia instancia de Prometheus o Grafana, puedes utilizar sus versiones administradas, con integración más simple y escalabilidad automática.
OpenSearch: de Elastic Search a vector search
Uno de los grandes protagonistas fue OpenSearch, un fork de Elastic Search creado en 2021 y ahora mantenido por la Linux Foundation. Es ampliamente utilizado para:
AWS ofrece OpenSearch en dos modalidades:
OpenSearch también incluye OpenSearch Ingestion, basado en Data Prepper, para transformar y enviar datos en formato JSON al clúster.
Construyendo una stack de observabilidad administrada
La presentación también mostró cómo integrar distintos servicios de AWS para formar una stack de observabilidad sólida:
Demo práctica: OpenTelemetry en un clúster EKS
Para llevar los conceptos a la práctica, Lucas presentó una demo en vivo de la aplicación “OpenTelemetry Demo” corriendo en un clúster EKS. La app, con un generador de tráfico, emitía señales procesadas por un Collector de OpenTelemetry y enviadas a Prometheus y OpenSearch.
Desde allí, Grafana reunía métricas, logs y traces en dashboards unificados, permitiendo:
Explorar un trace específico con vista tipo waterfall y logs asociados;
Todo esto usando variables en Grafana que combinaban datos de Prometheus y OpenSearch, facilitando la investigación de incidentes y la correlación de información.
Reconstruyendo el stack de logs de Nubank: desafíos de escala y eficiencia
En la segunda mitad del meetup, Caio y Otávio compartieron detalles sobre la evolución de la plataforma interna de observabilidad de logs de Nubank — una trayectoria marcada por un crecimiento acelerado, limitaciones con proveedores externos y decisiones estratégicas para garantizar eficiencia en costos y control sobre los datos.
El problema: crecimiento del volumen de logs y costos con proveedores externos
Con más de 3.000 microservicios y una base de clientes en constante expansión, Nubank llegó a manejar volúmenes diarios de hasta medio petabyte de logs. La estrategia original — basada en un proveedor SaaS — empezó a mostrar limitaciones en dos frentes clave:
La solución fue construir una plataforma completamente interna, altamente escalable, resiliente y mucho más eficiente.
Observability Stream: una nueva plataforma para ingestión de datos
El primer paso en esta reestructuración fue crear Observability Stream, nuestra plataforma interna para recolectar y procesar datos de telemetría — comenzando por logs y luego expandiéndose a traces.
Requisitos técnicos
El equipo definió cuatro pilares fundamentales:
Arquitectura basada en micro-batching
Para equilibrar performance y viabilidad técnica, se adoptó un modelo de micro-batching, con etapas de procesamiento desacopladas a través de colas (SQS). El flujo incluye:
Esta arquitectura trajo robustez y modularidad, preparando el camino para la siguiente etapa: la búsqueda.
Alexandria: nuestra plataforma interna de búsqueda de logs
Con todos los datos estructurados y almacenados, el siguiente paso fue construir Alexandria — la plataforma interna de búsqueda de logs utilizada por las y los ingenieros de Nubank.
Búsqueda escalable con Trino y Parquet
La arquitectura se basa en:
Resultados alcanzados
Observabilidad eficiente con open source y la nube
El Nubank Engineering Meetup #11 ofreció una inmersión profunda y práctica en el universo de la observabilidad con Open Source y AWS. Además de reforzar la importancia de las métricas, los logs y los traces, mostró cómo construir una stack moderna combinando herramientas de código abierto con la eficiencia de los servicios administrados.
Con ejemplos reales, arquitectura detallada y demostraciones visuales, el encuentro fue un recurso valioso para ingenieras, ingenieros y equipos de plataforma que buscan mejorar la visibilidad y confiabilidad de sus sistemas.
Sigue atento a las próximas ediciones del Nubank Engineering Meetup para más contenido técnico sobre los desafíos y soluciones al construir productos financieros simples, seguros e innovadores.
Descubre las oportunidades