mais lidos
Life at Nu
Conheça a sede do Nubank em Pinheiros, São Paulo/Brasil jan 11
Design
A nova aparência do Nubank: conheça nossa nova logo maio 17
Culture & Values
Como os valores e a cultura da Nu moldam os produtos que criamos ago 7
Carreiras
Reunimos grandes mentes de diversas origens que permitem a discussão e o debate e melhoram a resolução de problemas.
Saiba mais sobre nossas carreiras



No Nubank, a inovação em machine learning (ML) e ciência de dados (DS) impulsiona nossa missão de construir o Futuro Roxo. Recentemente, realizamos a 92ª edição do nosso DS & ML Meetup, com o tema “Práticas para Escalar Operações de Machine Learning”. Este evento mergulhou nos desafios técnicos e nas soluções para construir sistemas de ML em tempo real, com foco na detecção de fraudes—um domínio onde velocidade, precisão e escalabilidade são críticas.
Liderada por Otávio Vasques, Lead Machine Learning Engineer, a sessão explorou a arquitetura, estratégias de otimização e práticas de implantação por trás dos modelos de ML em tempo real do Nubank. Os principais tópicos incluíram as diferenças entre modelos batch e em tempo real, o papel do Model Server, técnicas para reduzir a latência e os custos de infraestrutura, e as melhores práticas para testar e implantar modelos usando o modo shadow.
Neste artigo, vamos desvendar esses insights, oferecendo um olhar por trás das cenas de como o Nubank escala as operações de machine learning para proteger milhões de clientes. Se você é um cientista de dados, engenheiro de ML ou simplesmente curioso sobre ML em tempo real, este post oferece lições práticas para construir sistemas robustos e escaláveis. Vamos lá!
O que são modelos em tempo real?
Modelos em tempo real diferem dos modelos batch tradicionais em um aspecto crucial: eles operam dentro da infraestrutura de serviços, não apenas em pipelines de dados. Enquanto os modelos batch processam grandes volumes de dados durante a noite e geram previsões para o dia seguinte, os modelos em tempo real respondem a eventos conforme eles acontecem.
Isso é essencial para casos de uso como detecção de fraudes, onde atrasar uma decisão por alguns segundos pode significar a diferença entre bloquear uma transação fraudulenta ou permitir que ela seja concluída.
Por exemplo, se alguém rouba seu cartão de crédito e tenta fazer uma compra, um modelo em tempo real pode sinalizar a transação imediatamente, enquanto um modelo batch só a detectaria no dia seguinte—muito depois que o estrago foi feito.
Conheça nossas oportunidades
A arquitetura dos modelos em tempo real no Nubank
No Nubank, nossos modelos em tempo real são construídos sobre uma arquitetura robusta que garante baixa latência e alta confiabilidade. Veja como funciona:
Otimizando para escala e velocidade
Modelos em tempo real são intensivos em recursos, especialmente quando operam na escala do Nubank. Aqui estão algumas das técnicas que usamos para otimizar o desempenho:
1. Implantação Fragmentada vs. Global
2. Filtragem Pré-Policy
3. Paralelização da Recuperação de Features
4. Monitoramento e Timeouts
Construindo pipelines de features confiáveis
A engenharia de features é uma parte crítica de qualquer modelo de ML, mas é especialmente desafiadora em sistemas em tempo real. Veja como garantimos consistência e confiabilidade:
Testes e modo shadow
A implantação de modelos em tempo real exige testes rigorosos para garantir que eles funcionem conforme o esperado. Aqui está nossa abordagem:
Considerações finais
Construir modelos de ML em tempo real é um desafio complexo, mas recompensador. No Nubank, aprendemos que o sucesso depende de uma combinação de arquitetura robusta, otimização cuidadosa e colaboração entre equipes. Embora as técnicas que desenvolvemos sejam adaptadas à detecção de fraudes, muitos dos princípios—como paralelizar a recuperação de features, monitorar dependências e testar rigorosamente—podem ser aplicados a outros casos de uso em tempo real.
Como foi enfatizado durante o meetup, nem todo modelo precisa de todas as otimizações. A chave é ser crítico em relação ao seu caso de uso, entender suas restrições e focar nas melhorias que trarão mais valor. E lembre-se: ML em tempo real é um esforço de equipe. É preciso cientistas de dados, engenheiros e analistas trabalhando juntos para construir sistemas que sejam rápidos e confiáveis.
Conheça nossas oportunidades