mais lidos
Life at Nu
Conheça a sede do Nubank em Pinheiros, São Paulo/Brasil jan 11
Design
A nova aparência do Nubank: conheça nossa nova logo maio 17
Culture & Values
Como os valores e a cultura da Nu moldam os produtos que criamos ago 7
Carreiras
Reunimos grandes mentes de diversas origens que permitem a discussão e o debate e melhoram a resolução de problemas.
Saiba mais sobre nossas carreiras



Escrito por: Nubank Editorial
Durante o Meetup em parceria com GruPy-SP e PyLadies, realizado no escritório do Nubank, em São Paulo, Daniela Canuta, Lead Data Scientist no Nubank, compartilhou uma visão de alto nível sobre como técnicas de ciência de dados podem apoiar decisões de aumento de limite no cartão de crédito. A palestra abordou temas como modelagem preditiva, causalidade, otimização e monitoramento de sistemas de machine learning em produção.
No Nubank, decisões de crédito envolvem muito mais do que uma análise isolada. Em linhas gerais, esses processos combinam diferentes sinais, modelos e mecanismos de monitoramento para apoiar escolhas que buscam equilibrar experiência do cliente, gestão de risco e sustentabilidade da operação.
Esse tipo de desafio vai além de prever comportamento. Também exige entender quais decisões tendem a gerar valor de forma consistente para clientes e para o negócio, sempre com responsabilidade e visão de longo prazo.
O desafio por trás de um aumento de limite
Conceder mais limite é uma decisão que envolve múltiplos fatores. De um lado, está a necessidade de oferecer uma experiência que faça sentido para o cliente e acompanhe sua jornada financeira. Do outro, está a importância de manter uma operação saudável, com atenção a risco, eficiência e contexto regulatório.
Na prática, isso significa construir sistemas capazes de analisar diferentes dimensões de uma mesma decisão e apoiar escolhas mais personalizadas em escala.
Conheça nossas oportunidades
O papel dos modelos preditivos
Uma parte importante desse processo está no uso de modelos preditivos, que ajudam a estimar tendências de comportamento a partir de sinais observados ao longo do tempo. Esses modelos são alimentados por dados tratados e organizados para representar padrões relevantes, em um trabalho que combina conhecimento técnico e entendimento de negócio.
Nessa etapa, a qualidade das variáveis utilizadas faz muita diferença. Mais do que reunir grande volume de dados, o desafio é construir representações úteis, estáveis e interpretáveis para apoiar decisões consistentes.
Também por isso, nem sempre a solução mais complexa é a melhor. Dependendo do problema, abordagens mais simples podem oferecer melhor equilíbrio entre performance, interpretabilidade, custo computacional e escalabilidade.
Mais do que prever: priorizar bem
Em sistemas de decisão, prever é apenas parte do trabalho. Em muitos casos, também é importante priorizar corretamente quais situações merecem mais atenção e quais decisões tendem a gerar melhores resultados relativos.
Isso exige avaliar não apenas a precisão das previsões, mas também a capacidade do sistema de apoiar ordenação, priorização e consistência entre diferentes perfis e contextos.
Quando correlação não é suficiente
Outro ponto central é distinguir correlação de causalidade. Em problemas reais, observar uma mudança de comportamento após uma decisão não significa, por si só, que uma coisa causou a outra.
Por isso, técnicas de análise causal ajudam a complementar a modelagem preditiva. Em vez de olhar apenas para o que tende a acontecer, elas ajudam a investigar em que contextos uma determinada ação realmente faz diferença. Esse tipo de abordagem contribui para decisões mais eficientes, mais responsáveis e mais alinhadas à experiência do cliente.
Modelos em produção exigem acompanhamento contínuo
Colocar um modelo em produção é só o começo. Com o tempo, os dados mudam, os comportamentos evoluem e o ambiente econômico se transforma. Para continuar gerando valor, sistemas de machine learning precisam ser acompanhados continuamente.
Isso inclui observar indicadores de desempenho, estabilidade e qualidade operacional, além de revisar modelos periodicamente para garantir que eles continuem adequados ao contexto em que operam.
Python no centro desse ecossistema
Ao longo de toda essa jornada, Python ocupa um papel central. A linguagem é amplamente utilizada em fluxos de análise, experimentação, desenvolvimento de modelos e integração com ambientes de produção, com apoio de ferramentas amplamente usadas pela indústria, como PySpark, Scikit-learn, PyTorch, Airflow, Docker, Databricks e Grafana.
Mais do que uma ferramenta, Python se tornou parte importante da forma como times técnicos constroem, testam e evoluem sistemas de decisão em larga escala.
Construindo decisões mais responsáveis em escala
A combinação entre machine learning, causalidade, otimização e monitoramento mostra como a ciência de dados pode contribuir para sistemas de decisão mais robustos e sustentáveis. Em um contexto de milhões de clientes, o desafio não é apenas escalar tecnologia, mas fazer isso com responsabilidade, consistência e foco na experiência de quem usa os produtos.
À medida que áreas como Data Science, Machine Learning Engineering e Data Engineering continuam evoluindo, esse tipo de abordagem tende a se tornar cada vez mais relevante para o futuro dos serviços financeiros digitais.
Conheça nossas oportunidades