{"id":36731,"date":"2026-05-14T11:30:00","date_gmt":"2026-05-14T14:30:00","guid":{"rendered":"https:\/\/building.nubank.com\/?p=36731"},"modified":"2026-05-14T11:22:45","modified_gmt":"2026-05-14T14:22:45","slug":"de-la-complejidad-a-la-simplicidad-un-enfoque-estructurado-para-entender-grandes-volumenes-de-datos","status":"publish","type":"post","link":"https:\/\/building.nubank.com\/es\/de-la-complejidad-a-la-simplicidad-un-enfoque-estructurado-para-entender-grandes-volumenes-de-datos\/","title":{"rendered":"De la complejidad a la simplicidad: un enfoque estructurado para entender grandes vol\u00famenes de datos"},"content":{"rendered":"\n<p class=\"wp-block-paragraph\"><em>Escrito por: Rodrigo Medina, Ivette Ayala<\/em><\/p>\n\n\n\n<p class=\"wp-block-paragraph\">En Nubank, cientos de equipos generan miles de activos de datos para atender a m\u00e1s de 130 millones de clientes en varios pa\u00edses. La arquitectura distribuida que hace posible esta escala tambi\u00e9n trae consigo un desaf\u00edo anal\u00edtico: a medida que la plataforma de datos crece, se vuelve cada vez m\u00e1s compleja y fragmentada, lo que dificulta su comprensi\u00f3n y navegaci\u00f3n.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">DiscoverDf naci\u00f3 de la premisa de que, en un entorno distribuido, entender los activos de datos no puede dejarse al azar. Es necesario abordarlo de manera sistem\u00e1tica, convirtiendo esa complejidad en algo estructurado y accesible. El objetivo es que cualquier analista, en cualquier equipo, pueda pasar del primer contacto con un conjunto de datos a hacer contribuciones significativas en d\u00edas, no en semanas ni meses.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\"><strong>El costo invisible de la curva de aprendizaje<\/strong><\/h2>\n\n\n\n<p class=\"wp-block-paragraph\">Cualquier persona que haya llegado a un nuevo equipo como Analista de Negocios conoce esa sensaci\u00f3n. Llegas con energ\u00eda e ideas, pero antes de poder aportar, hay un peaje invisible que pagar: entender los datasets del equipo. Qu\u00e9 tablas importan realmente, qu\u00e9 representa cada filtro, d\u00f3nde viven los casos especiales. Alcanzar ese nivel de fluidez puede llevar semanas, a veces meses.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Ahora imagina un proyecto transversal con un plazo ajustado. Necesitas trabajar con datasets que pertenecen a otros equipos, que no has tenido tiempo de entender a fondo. El enfoque habitual es pragm\u00e1tico: contar filas, revisar algunas columnas y luego contactar al BA o AE del equipo para completar los vac\u00edos.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Funciona, pero es fr\u00e1gil. Filtros importantes vinculados a tu contexto espec\u00edfico pueden pasarse por alto, las oportunidades de segmentaci\u00f3n pueden quedar sin explorar, y las decisiones terminan construidas sobre un modelo mental incompleto de los datos. Esto no sucede por falta de habilidad del analista, sino porque no existe una forma estructurada de explorarlos.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Aqu\u00ed es donde comienza la hip\u00f3tesis. El costo de incorporaci\u00f3n no es inevitable, porque los datasets no son intr\u00ednsecamente dif\u00edciles de entender, sino porque nos falta una manera consistente y repetible de aproximarnos a ellos desde el primer contacto.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Y si ese proceso pudiera comprimirse, \u00bfc\u00f3mo ser\u00eda? En lugar de semanas de absorci\u00f3n pasiva de contexto, un analista podr\u00eda ejecutar una sola funci\u00f3n y, en minutos, entender el contenido del dataset, sus l\u00edmites, distribuciones y estructura. A partir de ah\u00ed, las conversaciones con los due\u00f1os de los datos cambiar\u00edan: el analista pasar\u00eda de la dependencia a la contribuci\u00f3n, y de pedir explicaciones a proponer ideas fundamentadas.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\"><strong>No puedes explorar lo que no sabes que existe<\/strong><\/h2>\n\n\n\n<p class=\"wp-block-paragraph\">Cuando los analistas se acercan hoy a un dataset nuevo, suelen empezar por lo que ya conocen: exploran campos familiares, preguntan al equipo responsable sobre el resto y construyen gradualmente una comprensi\u00f3n operativa. Una vez que sabes d\u00f3nde buscar, este proceso es \u00e1gil y efectivo. El problema es que asume que ya sabes d\u00f3nde buscar.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Imagina ahora un dataset con docenas o cientos de columnas que abarca identidades de clientes, horizontes temporales y categor\u00edas de comportamiento. El analista perfila lo que le resulta familiar, pide contexto sobre lo que no, y avanza \u2014 pero hay m\u00e1s por descubrir.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Dimensiones de segmentaci\u00f3n con potencial permanecen ocultas, y patrones que revelan la estructura de los datos est\u00e1n presentes, pero no siempre emergen a la superficie. Estos elementos pueden influir directamente en mejores decisiones, y sin embargo suelen quedar sin explorar.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Esto se vuelve a\u00fan m\u00e1s relevante en proyectos que involucran m\u00faltiples datasets, a veces pertenecientes a distintos equipos. Cada capa adicional de comprensi\u00f3n suma valor, y cuanto m\u00e1s completo es el panorama, m\u00e1s s\u00f3lida es la base para todo lo que viene despu\u00e9s.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Hay una diferencia importante entre conocer algunas dimensiones y entender verdaderamente un objeto de datos que captura la actividad, los estados y el comportamiento de los clientes. Cuando un analista alcanza ese nivel de comprensi\u00f3n, las conversaciones de alineaci\u00f3n cambian. En lugar de pedir contexto, llega listo para contribuir, con una visi\u00f3n clara del panorama completo que representan los datos.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\"><strong>Tres principios para entender cualquier dataset<\/strong><\/h2>\n\n\n\n<p class=\"wp-block-paragraph\">La idea central detr\u00e1s de DiscoverDf es que cualquier dataset, independientemente del dominio o de qui\u00e9n sea su due\u00f1o, puede entenderse a trav\u00e9s de tres principios universales. Cada uno est\u00e1 asociado a un nivel diferente de cardinalidad de columna.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\"><strong>El Qu\u00e9: qu\u00e9 entidades contiene este dataset y a qu\u00e9 escala<\/strong><\/h2>\n\n\n\n<p class=\"wp-block-paragraph\">Las columnas con mayor cardinalidad, que a menudo tienen millones o cientos de millones de valores \u00fanicos, responden la pregunta m\u00e1s fundamental: \u00bfqu\u00e9 entidades existen en este dataset y a qu\u00e9 escala?<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Suelen ser identificadores: IDs de clientes, IDs de cuentas, IDs de transacciones, IDs de facturas. Al observar el conteo de valores \u00fanicos en la parte superior de un perfil ordenado, el analista puede inferir r\u00e1pidamente la granularidad de los datos, estimar el tama\u00f1o de la poblaci\u00f3n y entender c\u00f3mo se relacionan las entidades entre s\u00ed.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\"><strong>El Cu\u00e1ndo: la estructura temporal de los datos<\/strong><\/h2>\n\n\n\n<p class=\"wp-block-paragraph\">Las columnas con cardinalidad que va de cientos a decenas de miles suelen representar tiempo. Incluso sin depender de los nombres de columna, ese rango es una se\u00f1al clara de estructura temporal.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">A partir de ah\u00ed, el analista identifica la columna de fecha principal revisando conteos de nulos, valores m\u00ednimos y m\u00e1ximos, y la distribuci\u00f3n a lo largo del tiempo. En cuesti\u00f3n de segundos queda claro qu\u00e9 tan atr\u00e1s llegan los datos, cu\u00e1n recientes son y si hay brechas que necesitan atenci\u00f3n.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\"><strong>El C\u00f3mo: las dimensiones disponibles para el an\u00e1lisis<\/strong><\/h2>\n\n\n\n<p class=\"wp-block-paragraph\">Las columnas con cardinalidad baja, a menudo con cien o menos valores \u00fanicos, definen c\u00f3mo se pueden explorar los datos. Son campos categ\u00f3ricos y de estado: tipos de producto, estados de pr\u00e9stamo, segmentos de clientes, flags y categor\u00edas de comportamiento.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Representan los ejes naturales para filtrar, agrupar y analizar. Al mismo tiempo, suelen ser las m\u00e1s ignoradas durante la exploraci\u00f3n inicial. DiscoverDf las hace expl\u00edcitas, mostrando cada dimensi\u00f3n junto con su distribuci\u00f3n completa de valores. Lo que de otro modo depender\u00eda del conocimiento del dominio se convierte en algo estructurado e inmediatamente accionable.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\"><strong>Donde los principios se encuentran con el c\u00f3digo<\/strong><\/h2>\n\n\n\n<p class=\"wp-block-paragraph\">Estos tres principios son independientes del lenguaje o las herramientas utilizadas. Describen una forma de pensar sobre los datos, no una implementaci\u00f3n espec\u00edfica.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">DiscoverDf est\u00e1 implementado como una funci\u00f3n reutilizable de Scala que corre en Databricks. El analista pasa un DataFrame y recibe un perfil estructurado con diecis\u00e9is indicadores anal\u00edticos por columna.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">El conteo de valores \u00fanicos en todas las columnas se convierte en la nueva clave de ordenamiento: <strong>cuando el analista organiza las columnas de mayor a menor cardinalidad, el dataset se organiza en las tres capas descritas. El Qu\u00e9, el Cu\u00e1ndo y el C\u00f3mo emergen directamente de los datos.<\/strong><\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Cada columna se explora en profundidad. Los campos de marca de tiempo se estandarizan en formatos de fecha, y cada columna se enriquece con un conjunto consistente de se\u00f1ales: distribuciones de nulos y ceros, valores m\u00ednimos y m\u00e1ximos, conteos categ\u00f3ricos y de fechas, y res\u00famenes estad\u00edsticos.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Para las dimensiones de baja cardinalidad, la funci\u00f3n proporciona distribuciones completas por categor\u00eda. Para los campos de fecha, muestra distribuciones temporales y se\u00f1ales de monitoreo. Para las columnas de alta cardinalidad, devuelve valores de muestra representativos.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">El resultado es una vista estructurada del dataset que hace visibles de inmediato su forma, sus l\u00edmites y su potencial anal\u00edtico.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\"><strong>Ver el panorama completo antes de la primera consulta<\/strong><\/h2>\n\n\n\n<p class=\"wp-block-paragraph\">Para ilustrar c\u00f3mo funciona la funci\u00f3n, consideremos ejecutar DiscoverDf sobre un dataset con cientos de millones de filas y decenas de columnas.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Una vez que las columnas se ordenan por valores \u00fanicos en orden descendente, comienza a emerger una estructura. El primer bloque muestra tres columnas con cientos de millones de valores \u00fanicos para IDs de transacciones, seguidas de decenas de millones para IDs de clientes y cuentas. La escala y la granularidad quedan inmediatamente claras, <strong>y el Qu\u00e9 queda respondido.<\/strong> Se trata de un dataset transaccional donde cada fila representa un evento individual conectado a una poblaci\u00f3n de clientes m\u00e1s amplia.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">El siguiente bloque contiene nueve columnas con entre uno y dos mil valores \u00fanicos. Ese rango de cardinalidad es una se\u00f1al de campos de fecha. El analista identifica la columna que sirve como referencia de fecha principal, luego revisa su nombre, valores m\u00ednimo y m\u00e1ximo, y distribuci\u00f3n de nulos. El marco temporal queda claro en segundos, abarcando varios a\u00f1os hasta los registros m\u00e1s recientes. <strong>El Cu\u00e1ndo queda respondido:<\/strong> el dataset captura a\u00f1os de historial transaccional.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">En la parte inferior del perfil, once columnas tienen menos de setenta valores \u00fanicos cada una. Son tipos, estados, flags y campos de segmentaci\u00f3n, todos presentados con sus distribuciones completas de valores. <strong>El C\u00f3mo queda respondido:<\/strong> el analista puede ver once dimensiones distintas para filtrar, agrupar y analizar antes de escribir una sola consulta.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\"><strong>El descubrimiento como pr\u00e1ctica, no solo como herramienta<\/strong><\/h2>\n\n\n\n<p class=\"wp-block-paragraph\">Una de las distinciones m\u00e1s importantes que aprendimos a establecer es la diferencia entre descubrimiento y ejecuci\u00f3n. DiscoverDf est\u00e1 dise\u00f1ado para el primer contacto con un dataset, cuando el analista necesita construir un modelo mental completo desde cero. Una vez que ese modelo est\u00e1 en su lugar y el contexto es claro, el trabajo cotidiano migra naturalmente hacia consultas m\u00e1s r\u00e1pidas y espec\u00edficas.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">El objetivo no es reemplazar el flujo de trabajo del analista, sino comprimir el tiempo que transcurre antes de \u00e9l. Lo que normalmente toma semanas de absorci\u00f3n pasiva de contexto se convierte en un proceso estructurado y mucho m\u00e1s \u00e1gil.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Con el tiempo emergi\u00f3 un segundo caso de uso: la validaci\u00f3n. Cuando los equipos crean nuevos datasets o refactorizan pipelines existentes, DiscoverDf proporciona una forma estructurada de verificar si el resultado se ajusta a las expectativas. Ayuda a confirmar que la granularidad es correcta, que la cobertura temporal es completa y que las dimensiones categ\u00f3ricas contienen los valores esperados.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\"><strong>Principios anal\u00edticos que trascienden la tecnolog\u00eda<\/strong><\/h2>\n\n\n\n<p class=\"wp-block-paragraph\">La contribuci\u00f3n m\u00e1s duradera de este trabajo es el marco conceptual. El Qu\u00e9, El Cu\u00e1ndo y El C\u00f3mo son principios que cualquier analista puede aplicar en cualquier entorno, independientemente del stack tecnol\u00f3gico. DiscoverDf es una forma de implementarlos hoy en Databricks. El pensamiento detr\u00e1s tiene vocaci\u00f3n de perdurar m\u00e1s all\u00e1 de cualquier tecnolog\u00eda espec\u00edfica.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">El pr\u00f3ximo paso ya est\u00e1 tomando forma. A medida que los flujos de trabajo impulsados por IA evolucionan, el proceso de descubrimiento descrito aqu\u00ed no tiene que seguir siendo manual. Los agentes pueden ejecutar perfilados estructurados, identificar dimensiones clave y generar res\u00famenes antes de que el analista escriba una sola consulta. El rol humano pasa de la exploraci\u00f3n a la interpretaci\u00f3n y el juicio, que es donde los analistas generan mayor valor.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">La pregunta m\u00e1s amplia, y la que vale la pena perseguir como organizaci\u00f3n, es qu\u00e9 sucede cuando esto deja de ser una pr\u00e1ctica individual y se convierte en un est\u00e1ndar de equipo, integrado en la forma en que incorporamos personas, documentamos y colaboramos entre equipos. Ese es el punto en que una herramienta \u00fatil se convierte en una capacidad duradera.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\"><strong>Por qu\u00e9 esto importa m\u00e1s all\u00e1 de la herramienta<\/strong><\/h2>\n\n\n\n<p class=\"wp-block-paragraph\">DiscoverDf es m\u00e1s que una herramienta. Refleja una forma de pensar que los equipos de an\u00e1lisis necesitan cultivar. Uno de los mayores desaf\u00edos que enfrentan los Squad Leads es ayudar a los analistas a alcanzar su m\u00e1ximo potencial r\u00e1pidamente.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">El costo de incorporaci\u00f3n descrito en este art\u00edculo tambi\u00e9n es un costo de confianza. Los analistas que pasan sus primeras semanas operando en modo de dependencia, pidiendo contexto y esperando orientaci\u00f3n, tienden a internalizar esa din\u00e1mica. Y una vez establecida, se tarda tiempo en desaprenderla.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Cuando esa din\u00e1mica desaparece, el efecto es inmediato. Cuando un analista llega a una conversaci\u00f3n ya entendiendo el dataset, ya siendo capaz de hacer mejores preguntas o sugerir direcciones, la interacci\u00f3n cambia. Cambia la forma en que los analistas se ven a s\u00ed mismos y c\u00f3mo los equipos perciben su rol.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">A escala, esto se multiplica. Cuando todos se ponen al d\u00eda m\u00e1s r\u00e1pido y operan con mayor autonom\u00eda, el impacto eleva el est\u00e1ndar de lo que Nubank puede lograr con datos. Esto es un multiplicador de la capacidad del equipo.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Tambi\u00e9n hay una dimensi\u00f3n cultural en este trabajo. Un equipo identific\u00f3 una brecha estructural, construy\u00f3 una soluci\u00f3n y la comparti\u00f3. Este instinto de resolver para el equipo, y no solo para las necesidades individuales, es parte definitoria de la cultura anal\u00edtica que se est\u00e1 construyendo en Nubank. DiscoverDf es un ejemplo. Muchos otros vendr\u00e1n. El cambio importante es que esta mentalidad se est\u00e1 convirtiendo en la norma.<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Escrito por: Rodrigo Medina, Ivette Ayala En Nubank, cientos de equipos generan miles de activos de datos para atender a m\u00e1s de 130 millones de clientes en varios pa\u00edses. La arquitectura distribuida que hace posible esta escala tambi\u00e9n trae consigo un desaf\u00edo anal\u00edtico: a medida que la plataforma de datos crece, se vuelve cada vez [&hellip;]<\/p>\n","protected":false},"author":178110103,"featured_media":36725,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"_acf_changed":false,"_jetpack_newsletter_access":"","_jetpack_dont_email_post_to_subs":false,"_jetpack_newsletter_tier_id":0,"_jetpack_memberships_contains_paywalled_content":false,"_jetpack_feature_clip_id":0,"_jetpack_memberships_contains_paid_content":false,"footnotes":"","jetpack_post_was_ever_published":false},"categories":[2608],"tags":[],"ppma_author":[2321],"class_list":["post-36731","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-analytics-engineering-es"],"acf":[],"yoast_head":"<!-- This site is optimized with the Yoast SEO plugin v27.8 - https:\/\/yoast.com\/product\/yoast-seo-wordpress\/ -->\n<title>De la complejidad a la simplicidad: un enfoque estructurado para entender grandes vol\u00famenes de datos - Building Nubank<\/title>\n<meta name=\"description\" content=\"C\u00f3mo el perfilado estructurado de datos facilita una incorporaci\u00f3n m\u00e1s r\u00e1pida, an\u00e1lisis m\u00e1s profundos y mayor autonom\u00eda anal\u00edtica en sistemas distribuidos\" \/>\n<meta name=\"robots\" content=\"index, follow, max-snippet:-1, max-image-preview:large, max-video-preview:-1\" \/>\n<link rel=\"canonical\" href=\"https:\/\/building.nubank.com\/es\/de-la-complejidad-a-la-simplicidad-un-enfoque-estructurado-para-entender-grandes-volumenes-de-datos\/\" \/>\n<meta property=\"og:locale\" content=\"es_ES\" \/>\n<meta property=\"og:type\" content=\"article\" \/>\n<meta property=\"og:title\" content=\"De la complejidad a la simplicidad: un enfoque estructurado para entender grandes vol\u00famenes de datos - Building Nubank\" \/>\n<meta property=\"og:description\" content=\"C\u00f3mo el perfilado estructurado de datos facilita una incorporaci\u00f3n m\u00e1s r\u00e1pida, an\u00e1lisis m\u00e1s profundos y mayor autonom\u00eda anal\u00edtica en sistemas distribuidos\" \/>\n<meta property=\"og:url\" content=\"https:\/\/building.nubank.com\/es\/de-la-complejidad-a-la-simplicidad-un-enfoque-estructurado-para-entender-grandes-volumenes-de-datos\/\" \/>\n<meta property=\"og:site_name\" content=\"Building Nubank\" \/>\n<meta property=\"article:published_time\" content=\"2026-05-14T14:30:00+00:00\" \/>\n<meta property=\"og:image\" content=\"https:\/\/building.nubank.com\/wp-content\/uploads\/2026\/05\/Nubank_Photoshoot_Brasil_-Fotografia_Edu-Vieira-12-1024x682.jpg\" \/>\n\t<meta property=\"og:image:width\" content=\"1024\" \/>\n\t<meta property=\"og:image:height\" content=\"682\" \/>\n\t<meta property=\"og:image:type\" content=\"image\/jpeg\" \/>\n<meta name=\"author\" content=\"Nubank Editorial\" \/>\n<meta name=\"twitter:card\" content=\"summary_large_image\" \/>\n<meta name=\"twitter:label1\" content=\"Escrito por\" \/>\n\t<meta name=\"twitter:data1\" content=\"Nubank Editorial\" \/>\n\t<meta name=\"twitter:label2\" content=\"Tiempo de lectura\" \/>\n\t<meta name=\"twitter:data2\" content=\"10 minutos\" \/>\n<script type=\"application\/ld+json\" class=\"yoast-schema-graph\">{\"@context\":\"https:\\\/\\\/schema.org\",\"@graph\":[{\"@type\":\"Article\",\"@id\":\"https:\\\/\\\/building.nubank.com\\\/es\\\/de-la-complejidad-a-la-simplicidad-un-enfoque-estructurado-para-entender-grandes-volumenes-de-datos\\\/#article\",\"isPartOf\":{\"@id\":\"https:\\\/\\\/building.nubank.com\\\/es\\\/de-la-complejidad-a-la-simplicidad-un-enfoque-estructurado-para-entender-grandes-volumenes-de-datos\\\/\"},\"author\":{\"name\":\"Nubank Editorial\",\"@id\":\"https:\\\/\\\/building.nubank.com\\\/es\\\/#\\\/schema\\\/person\\\/462f4f5a8d4ec3ccbc3d661dde00f0a4\"},\"headline\":\"De la complejidad a la simplicidad: un enfoque estructurado para entender grandes vol\u00famenes de datos\",\"datePublished\":\"2026-05-14T14:30:00+00:00\",\"mainEntityOfPage\":{\"@id\":\"https:\\\/\\\/building.nubank.com\\\/es\\\/de-la-complejidad-a-la-simplicidad-un-enfoque-estructurado-para-entender-grandes-volumenes-de-datos\\\/\"},\"wordCount\":2242,\"commentCount\":0,\"image\":{\"@id\":\"https:\\\/\\\/building.nubank.com\\\/es\\\/de-la-complejidad-a-la-simplicidad-un-enfoque-estructurado-para-entender-grandes-volumenes-de-datos\\\/#primaryimage\"},\"thumbnailUrl\":\"https:\\\/\\\/i0.wp.com\\\/building.nubank.com\\\/wp-content\\\/uploads\\\/2026\\\/05\\\/Nubank_Photoshoot_Brasil_-Fotografia_Edu-Vieira-12.jpg?fit=9391%2C6250&ssl=1\",\"articleSection\":[\"Analytics Engineering\"],\"inLanguage\":\"es\",\"potentialAction\":[{\"@type\":\"CommentAction\",\"name\":\"Comment\",\"target\":[\"https:\\\/\\\/building.nubank.com\\\/es\\\/de-la-complejidad-a-la-simplicidad-un-enfoque-estructurado-para-entender-grandes-volumenes-de-datos\\\/#respond\"]}]},{\"@type\":\"WebPage\",\"@id\":\"https:\\\/\\\/building.nubank.com\\\/es\\\/de-la-complejidad-a-la-simplicidad-un-enfoque-estructurado-para-entender-grandes-volumenes-de-datos\\\/\",\"url\":\"https:\\\/\\\/building.nubank.com\\\/es\\\/de-la-complejidad-a-la-simplicidad-un-enfoque-estructurado-para-entender-grandes-volumenes-de-datos\\\/\",\"name\":\"De la complejidad a la simplicidad: un enfoque estructurado para entender grandes vol\u00famenes de datos - Building Nubank\",\"isPartOf\":{\"@id\":\"https:\\\/\\\/building.nubank.com\\\/es\\\/#website\"},\"primaryImageOfPage\":{\"@id\":\"https:\\\/\\\/building.nubank.com\\\/es\\\/de-la-complejidad-a-la-simplicidad-un-enfoque-estructurado-para-entender-grandes-volumenes-de-datos\\\/#primaryimage\"},\"image\":{\"@id\":\"https:\\\/\\\/building.nubank.com\\\/es\\\/de-la-complejidad-a-la-simplicidad-un-enfoque-estructurado-para-entender-grandes-volumenes-de-datos\\\/#primaryimage\"},\"thumbnailUrl\":\"https:\\\/\\\/i0.wp.com\\\/building.nubank.com\\\/wp-content\\\/uploads\\\/2026\\\/05\\\/Nubank_Photoshoot_Brasil_-Fotografia_Edu-Vieira-12.jpg?fit=9391%2C6250&ssl=1\",\"datePublished\":\"2026-05-14T14:30:00+00:00\",\"author\":{\"@id\":\"https:\\\/\\\/building.nubank.com\\\/es\\\/#\\\/schema\\\/person\\\/462f4f5a8d4ec3ccbc3d661dde00f0a4\"},\"description\":\"C\u00f3mo el perfilado estructurado de datos facilita una incorporaci\u00f3n m\u00e1s r\u00e1pida, an\u00e1lisis m\u00e1s profundos y mayor autonom\u00eda anal\u00edtica en sistemas distribuidos\",\"breadcrumb\":{\"@id\":\"https:\\\/\\\/building.nubank.com\\\/es\\\/de-la-complejidad-a-la-simplicidad-un-enfoque-estructurado-para-entender-grandes-volumenes-de-datos\\\/#breadcrumb\"},\"inLanguage\":\"es\",\"potentialAction\":[{\"@type\":\"ReadAction\",\"target\":[\"https:\\\/\\\/building.nubank.com\\\/es\\\/de-la-complejidad-a-la-simplicidad-un-enfoque-estructurado-para-entender-grandes-volumenes-de-datos\\\/\"]}]},{\"@type\":\"ImageObject\",\"inLanguage\":\"es\",\"@id\":\"https:\\\/\\\/building.nubank.com\\\/es\\\/de-la-complejidad-a-la-simplicidad-un-enfoque-estructurado-para-entender-grandes-volumenes-de-datos\\\/#primaryimage\",\"url\":\"https:\\\/\\\/i0.wp.com\\\/building.nubank.com\\\/wp-content\\\/uploads\\\/2026\\\/05\\\/Nubank_Photoshoot_Brasil_-Fotografia_Edu-Vieira-12.jpg?fit=9391%2C6250&ssl=1\",\"contentUrl\":\"https:\\\/\\\/i0.wp.com\\\/building.nubank.com\\\/wp-content\\\/uploads\\\/2026\\\/05\\\/Nubank_Photoshoot_Brasil_-Fotografia_Edu-Vieira-12.jpg?fit=9391%2C6250&ssl=1\",\"width\":9391,\"height\":6250},{\"@type\":\"BreadcrumbList\",\"@id\":\"https:\\\/\\\/building.nubank.com\\\/es\\\/de-la-complejidad-a-la-simplicidad-un-enfoque-estructurado-para-entender-grandes-volumenes-de-datos\\\/#breadcrumb\",\"itemListElement\":[{\"@type\":\"ListItem\",\"position\":1,\"name\":\"Home\",\"item\":\"https:\\\/\\\/building.nubank.com\\\/es\\\/\"},{\"@type\":\"ListItem\",\"position\":2,\"name\":\"De la complejidad a la simplicidad: un enfoque estructurado para entender grandes vol\u00famenes de datos\"}]},{\"@type\":\"WebSite\",\"@id\":\"https:\\\/\\\/building.nubank.com\\\/es\\\/#website\",\"url\":\"https:\\\/\\\/building.nubank.com\\\/es\\\/\",\"name\":\"Building Nubank\",\"description\":\"We make the extraordinary happen\",\"potentialAction\":[{\"@type\":\"SearchAction\",\"target\":{\"@type\":\"EntryPoint\",\"urlTemplate\":\"https:\\\/\\\/building.nubank.com\\\/es\\\/?s={search_term_string}\"},\"query-input\":{\"@type\":\"PropertyValueSpecification\",\"valueRequired\":true,\"valueName\":\"search_term_string\"}}],\"inLanguage\":\"es\"},{\"@type\":\"Person\",\"@id\":\"https:\\\/\\\/building.nubank.com\\\/es\\\/#\\\/schema\\\/person\\\/462f4f5a8d4ec3ccbc3d661dde00f0a4\",\"name\":\"Nubank Editorial\",\"image\":{\"@type\":\"ImageObject\",\"inLanguage\":\"es\",\"@id\":\"https:\\\/\\\/secure.gravatar.com\\\/avatar\\\/8c056170dc75ffd365b306a0ac7bea4e51d1cdab52a0c84e6ba0a42f7e2f4633?s=96&d=identicon&r=g0a78bc815f2126d9ba65b2af185671f1\",\"url\":\"https:\\\/\\\/secure.gravatar.com\\\/avatar\\\/8c056170dc75ffd365b306a0ac7bea4e51d1cdab52a0c84e6ba0a42f7e2f4633?s=96&d=identicon&r=g\",\"contentUrl\":\"https:\\\/\\\/secure.gravatar.com\\\/avatar\\\/8c056170dc75ffd365b306a0ac7bea4e51d1cdab52a0c84e6ba0a42f7e2f4633?s=96&d=identicon&r=g\",\"caption\":\"Nubank Editorial\"},\"url\":\"https:\\\/\\\/building.nubank.com\\\/es\\\/author\\\/editorial\\\/\"}]}<\/script>\n<!-- \/ Yoast SEO plugin. -->","yoast_head_json":{"title":"De la complejidad a la simplicidad: un enfoque estructurado para entender grandes vol\u00famenes de datos - Building Nubank","description":"C\u00f3mo el perfilado estructurado de datos facilita una incorporaci\u00f3n m\u00e1s r\u00e1pida, an\u00e1lisis m\u00e1s profundos y mayor autonom\u00eda anal\u00edtica en sistemas distribuidos","robots":{"index":"index","follow":"follow","max-snippet":"max-snippet:-1","max-image-preview":"max-image-preview:large","max-video-preview":"max-video-preview:-1"},"canonical":"https:\/\/building.nubank.com\/es\/de-la-complejidad-a-la-simplicidad-un-enfoque-estructurado-para-entender-grandes-volumenes-de-datos\/","og_locale":"es_ES","og_type":"article","og_title":"De la complejidad a la simplicidad: un enfoque estructurado para entender grandes vol\u00famenes de datos - Building Nubank","og_description":"C\u00f3mo el perfilado estructurado de datos facilita una incorporaci\u00f3n m\u00e1s r\u00e1pida, an\u00e1lisis m\u00e1s profundos y mayor autonom\u00eda anal\u00edtica en sistemas distribuidos","og_url":"https:\/\/building.nubank.com\/es\/de-la-complejidad-a-la-simplicidad-un-enfoque-estructurado-para-entender-grandes-volumenes-de-datos\/","og_site_name":"Building Nubank","article_published_time":"2026-05-14T14:30:00+00:00","og_image":[{"width":1024,"height":682,"url":"https:\/\/building.nubank.com\/wp-content\/uploads\/2026\/05\/Nubank_Photoshoot_Brasil_-Fotografia_Edu-Vieira-12-1024x682.jpg","type":"image\/jpeg"}],"author":"Nubank Editorial","twitter_card":"summary_large_image","twitter_misc":{"Escrito por":"Nubank Editorial","Tiempo de lectura":"10 minutos"},"schema":{"@context":"https:\/\/schema.org","@graph":[{"@type":"Article","@id":"https:\/\/building.nubank.com\/es\/de-la-complejidad-a-la-simplicidad-un-enfoque-estructurado-para-entender-grandes-volumenes-de-datos\/#article","isPartOf":{"@id":"https:\/\/building.nubank.com\/es\/de-la-complejidad-a-la-simplicidad-un-enfoque-estructurado-para-entender-grandes-volumenes-de-datos\/"},"author":{"name":"Nubank Editorial","@id":"https:\/\/building.nubank.com\/es\/#\/schema\/person\/462f4f5a8d4ec3ccbc3d661dde00f0a4"},"headline":"De la complejidad a la simplicidad: un enfoque estructurado para entender grandes vol\u00famenes de datos","datePublished":"2026-05-14T14:30:00+00:00","mainEntityOfPage":{"@id":"https:\/\/building.nubank.com\/es\/de-la-complejidad-a-la-simplicidad-un-enfoque-estructurado-para-entender-grandes-volumenes-de-datos\/"},"wordCount":2242,"commentCount":0,"image":{"@id":"https:\/\/building.nubank.com\/es\/de-la-complejidad-a-la-simplicidad-un-enfoque-estructurado-para-entender-grandes-volumenes-de-datos\/#primaryimage"},"thumbnailUrl":"https:\/\/i0.wp.com\/building.nubank.com\/wp-content\/uploads\/2026\/05\/Nubank_Photoshoot_Brasil_-Fotografia_Edu-Vieira-12.jpg?fit=9391%2C6250&ssl=1","articleSection":["Analytics Engineering"],"inLanguage":"es","potentialAction":[{"@type":"CommentAction","name":"Comment","target":["https:\/\/building.nubank.com\/es\/de-la-complejidad-a-la-simplicidad-un-enfoque-estructurado-para-entender-grandes-volumenes-de-datos\/#respond"]}]},{"@type":"WebPage","@id":"https:\/\/building.nubank.com\/es\/de-la-complejidad-a-la-simplicidad-un-enfoque-estructurado-para-entender-grandes-volumenes-de-datos\/","url":"https:\/\/building.nubank.com\/es\/de-la-complejidad-a-la-simplicidad-un-enfoque-estructurado-para-entender-grandes-volumenes-de-datos\/","name":"De la complejidad a la simplicidad: un enfoque estructurado para entender grandes vol\u00famenes de datos - Building Nubank","isPartOf":{"@id":"https:\/\/building.nubank.com\/es\/#website"},"primaryImageOfPage":{"@id":"https:\/\/building.nubank.com\/es\/de-la-complejidad-a-la-simplicidad-un-enfoque-estructurado-para-entender-grandes-volumenes-de-datos\/#primaryimage"},"image":{"@id":"https:\/\/building.nubank.com\/es\/de-la-complejidad-a-la-simplicidad-un-enfoque-estructurado-para-entender-grandes-volumenes-de-datos\/#primaryimage"},"thumbnailUrl":"https:\/\/i0.wp.com\/building.nubank.com\/wp-content\/uploads\/2026\/05\/Nubank_Photoshoot_Brasil_-Fotografia_Edu-Vieira-12.jpg?fit=9391%2C6250&ssl=1","datePublished":"2026-05-14T14:30:00+00:00","author":{"@id":"https:\/\/building.nubank.com\/es\/#\/schema\/person\/462f4f5a8d4ec3ccbc3d661dde00f0a4"},"description":"C\u00f3mo el perfilado estructurado de datos facilita una incorporaci\u00f3n m\u00e1s r\u00e1pida, an\u00e1lisis m\u00e1s profundos y mayor autonom\u00eda anal\u00edtica en sistemas distribuidos","breadcrumb":{"@id":"https:\/\/building.nubank.com\/es\/de-la-complejidad-a-la-simplicidad-un-enfoque-estructurado-para-entender-grandes-volumenes-de-datos\/#breadcrumb"},"inLanguage":"es","potentialAction":[{"@type":"ReadAction","target":["https:\/\/building.nubank.com\/es\/de-la-complejidad-a-la-simplicidad-un-enfoque-estructurado-para-entender-grandes-volumenes-de-datos\/"]}]},{"@type":"ImageObject","inLanguage":"es","@id":"https:\/\/building.nubank.com\/es\/de-la-complejidad-a-la-simplicidad-un-enfoque-estructurado-para-entender-grandes-volumenes-de-datos\/#primaryimage","url":"https:\/\/i0.wp.com\/building.nubank.com\/wp-content\/uploads\/2026\/05\/Nubank_Photoshoot_Brasil_-Fotografia_Edu-Vieira-12.jpg?fit=9391%2C6250&ssl=1","contentUrl":"https:\/\/i0.wp.com\/building.nubank.com\/wp-content\/uploads\/2026\/05\/Nubank_Photoshoot_Brasil_-Fotografia_Edu-Vieira-12.jpg?fit=9391%2C6250&ssl=1","width":9391,"height":6250},{"@type":"BreadcrumbList","@id":"https:\/\/building.nubank.com\/es\/de-la-complejidad-a-la-simplicidad-un-enfoque-estructurado-para-entender-grandes-volumenes-de-datos\/#breadcrumb","itemListElement":[{"@type":"ListItem","position":1,"name":"Home","item":"https:\/\/building.nubank.com\/es\/"},{"@type":"ListItem","position":2,"name":"De la complejidad a la simplicidad: un enfoque estructurado para entender grandes vol\u00famenes de datos"}]},{"@type":"WebSite","@id":"https:\/\/building.nubank.com\/es\/#website","url":"https:\/\/building.nubank.com\/es\/","name":"Building Nubank","description":"We make the extraordinary happen","potentialAction":[{"@type":"SearchAction","target":{"@type":"EntryPoint","urlTemplate":"https:\/\/building.nubank.com\/es\/?s={search_term_string}"},"query-input":{"@type":"PropertyValueSpecification","valueRequired":true,"valueName":"search_term_string"}}],"inLanguage":"es"},{"@type":"Person","@id":"https:\/\/building.nubank.com\/es\/#\/schema\/person\/462f4f5a8d4ec3ccbc3d661dde00f0a4","name":"Nubank Editorial","image":{"@type":"ImageObject","inLanguage":"es","@id":"https:\/\/secure.gravatar.com\/avatar\/8c056170dc75ffd365b306a0ac7bea4e51d1cdab52a0c84e6ba0a42f7e2f4633?s=96&d=identicon&r=g0a78bc815f2126d9ba65b2af185671f1","url":"https:\/\/secure.gravatar.com\/avatar\/8c056170dc75ffd365b306a0ac7bea4e51d1cdab52a0c84e6ba0a42f7e2f4633?s=96&d=identicon&r=g","contentUrl":"https:\/\/secure.gravatar.com\/avatar\/8c056170dc75ffd365b306a0ac7bea4e51d1cdab52a0c84e6ba0a42f7e2f4633?s=96&d=identicon&r=g","caption":"Nubank Editorial"},"url":"https:\/\/building.nubank.com\/es\/author\/editorial\/"}]}},"jetpack_featured_media_url":"https:\/\/i0.wp.com\/building.nubank.com\/wp-content\/uploads\/2026\/05\/Nubank_Photoshoot_Brasil_-Fotografia_Edu-Vieira-12.jpg?fit=9391%2C6250&ssl=1","jetpack_shortlink":"https:\/\/wp.me\/pbKBB5-9yr","jetpack_sharing_enabled":true,"authors":[{"term_id":2321,"user_id":178110103,"is_guest":0,"slug":"editorial","display_name":"Nubank Editorial","avatar_url":"https:\/\/secure.gravatar.com\/avatar\/8c056170dc75ffd365b306a0ac7bea4e51d1cdab52a0c84e6ba0a42f7e2f4633?s=96&d=identicon&r=g","0":null,"1":"","2":"","3":"","4":"","5":"","6":"","7":"","8":""}],"_links":{"self":[{"href":"https:\/\/building.nubank.com\/es\/wp-json\/wp\/v2\/posts\/36731","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/building.nubank.com\/es\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/building.nubank.com\/es\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/building.nubank.com\/es\/wp-json\/wp\/v2\/users\/178110103"}],"replies":[{"embeddable":true,"href":"https:\/\/building.nubank.com\/es\/wp-json\/wp\/v2\/comments?post=36731"}],"version-history":[{"count":2,"href":"https:\/\/building.nubank.com\/es\/wp-json\/wp\/v2\/posts\/36731\/revisions"}],"predecessor-version":[{"id":36733,"href":"https:\/\/building.nubank.com\/es\/wp-json\/wp\/v2\/posts\/36731\/revisions\/36733"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/building.nubank.com\/es\/wp-json\/wp\/v2\/media\/36725"}],"wp:attachment":[{"href":"https:\/\/building.nubank.com\/es\/wp-json\/wp\/v2\/media?parent=36731"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/building.nubank.com\/es\/wp-json\/wp\/v2\/categories?post=36731"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/building.nubank.com\/es\/wp-json\/wp\/v2\/tags?post=36731"},{"taxonomy":"author","embeddable":true,"href":"https:\/\/building.nubank.com\/es\/wp-json\/wp\/v2\/ppma_author?post=36731"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}