mais lidos
Life at Nu
Conheça a sede do Nubank em Pinheiros, São Paulo/Brasil jan 11
Design
A nova aparência do Nubank: conheça nossa nova logo maio 17
Culture & Values
Como os valores e a cultura da Nu moldam os produtos que criamos ago 7
Carreiras
Reunimos grandes mentes de diversas origens que permitem a discussão e o debate e melhoram a resolução de problemas.
Saiba mais sobre nossas carreiras



Quando se pensa em machine learning, entender e prever o comportamento dos clientes ao longo do tempo é essencial para diversas aplicações, como detecção de fraudes, recomendação de produtos e análise de risco de crédito. Tradicionalmente, modelos tabulares têm sido utilizados para essa tarefa, agregando informações de comportamento em features estáticas.
No entanto, essa abordagem apresenta limitações significativas quando se trata de capturar a dinâmica temporal e a ordem dos eventos. Neste artigo, exploraremos como arquiteturas sequenciais, especialmente as redes neurais LSTM (Long Short-Term Memory), podem superar essas limitações e oferecer insights mais profundos e precisos.
A importância do comportamento em modelos de machine learning
Comportamento refere-se a informações que dependem de ações realizadas ao longo do tempo e que podem caracterizar algo ou alguém. Exemplos incluem:
Diferentemente de características estáticas, como idade ou gênero, comportamentos são dinâmicos e podem variar significativamente entre indivíduos, oferecendo uma rica fonte de dados para análise preditiva.
Conheça nossas oportunidades
Limitações dos modelos tabulares na modelagem de comportamento
Modelos tabulares clássicos dependem de features agregadas que resumem o comportamento em períodos específicos. Por exemplo, calcular a soma ou a média das compras realizadas nas últimas 24 horas. Embora essa abordagem seja funcional, ela apresenta problemas:
Perda da ordem dos eventos
Ao agregar dados, modelos tabulares ignoram a sequência temporal das ações. Dois clientes que realizaram as mesmas transações, mas em ordens diferentes, seriam tratados de forma idêntica pelo modelo, apesar de seus comportamentos serem distintos.
Ignorando interações temporais
Modelos tabulares não capturam como eventos diferentes interagem ao longo do tempo. Por exemplo, se um cliente faz uma compra grande e, em seguida, realiza um saque incomum, a ordem desses eventos pode ser significativa para a detecção de atividades suspeitas.
Predições independentes
Cada predição em modelos tabulares é independente das anteriores. O modelo não considera eventos passados ao fazer uma nova predição, perdendo a oportunidade de captar padrões comportamentais que se desenvolvem ao longo do tempo.
Arquiteturas sequenciais como alternativa
Para superar essas limitações, arquiteturas sequenciais, como as redes neurais LSTM, oferecem uma solução eficaz. Essas redes são projetadas para processar dados sequenciais, levando em consideração a ordem e o intervalo entre eventos.
Como funcionam as LSTMs
As LSTMs possuem componentes chamados células de memória que retêm informações ao longo do tempo. Elas processam sequências de eventos uma etapa de cada vez, permitindo que informações de eventos anteriores influenciem as predições futuras.
Implementação prática de LSTMs em modelagem de comportamento
Preparação dos dados
Em vez de agregar dados, os eventos são mantidos em sua forma sequencial original. Cada evento pode conter suas features relevantes, como valor da transação, tipo de evento (compra, saque, depósito), e timestamp, por exemplo.
Construção do modelo
Treinamento e predição
A LSTM é treinada para aprender padrões na sequência de eventos que levam a determinado resultado, como uma fraude ou inadimplência. Durante a predição, a rede processa novos eventos, atualizando suas memórias internas e ajustando as predições de acordo com o comportamento observado.
Vantagens das arquiteturas sequenciais
Captura de padrões temporais
Ao preservar a ordem e o intervalo entre eventos, as LSTMs conseguem identificar padrões que seriam perdidos em modelos tabulares. Por exemplo, uma série de pequenas transações em um curto período pode indicar um comportamento suspeito que um modelo tabular não detectaria.
Flexibilidade na inclusão de features
Além das features sequenciais, é possível incorporar features estáticas ou agregadas ao modelo, enriquecendo a análise sem perder a capacidade de captar a dinâmica temporal.
Redução na necessidade de feature engineering
A modelagem sequencial diminui a necessidade de criar múltiplas features agregadas para diferentes janelas de tempo, já que a LSTM aprende automaticamente quais padrões temporais são relevantes.
Desafios e considerações
Complexidade computacional
Redes neurais sequenciais exigem mais recursos computacionais e tempo de treinamento. O uso de GPUs pode acelerar o processo, mas aumenta os custos.
Otimização de hiperparâmetros
Encontrar os parâmetros ideais, como o número de sequências a considerar ou a direção do processamento (do evento mais recente para o mais antigo ou vice-versa), é crucial para o desempenho do modelo.
Avaliação da necessidade
É importante avaliar se a complexidade adicional é justificada. Se a ordem dos eventos ou a temporalidade não forem significativas para o problema em questão, modelos tabulares podem ser mais adequados.
Estudos de caso e resultados práticos
Durante a implementação de LSTMs para detecção de fraudes, foram observados os seguintes resultados:
Integração com features tradicionais
Mesmo ao utilizar arquiteturas sequenciais, é possível e muitas vezes recomendável combinar features tradicionais ao modelo. Por exemplo:
Essa integração permite que o modelo aproveite o melhor dos dois mundos: a capacidade de capturar padrões temporais e o valor de features estáticas comprovadamente úteis.
Perguntas frequentes e esclarecimentos
Como lidar com clientes novos ou com poucos eventos?
Para clientes com poucos ou nenhum evento, o modelo pode preencher as sequências com valores nulos ou zeros, e a rede é treinada para lidar com essas situações. Além disso, features estáticas podem ganhar mais peso nessas circunstâncias.
As LSTMs são sempre a melhor opção?
Não necessariamente. Se a ordem dos eventos não for crucial para o problema, ou se os recursos computacionais forem limitados, modelos tradicionais podem ser mais eficientes.
Como otimizar o desempenho das LSTMs?
Conclusão
Arquiteturas sequenciais, como as LSTMs, representam um avanço significativo na modelagem de comportamento em machine learning. Ao capturar a dinâmica temporal e a ordem dos eventos, oferecem predições mais precisas e insights profundos sobre padrões comportamentais.
Apesar dos desafios, especialmente em termos de recursos computacionais e complexidade, os benefícios podem ser substanciais em aplicações onde o tempo e a sequência dos eventos são críticos.
Para mais insights como esses, assista a gravação do meetup de Ciência de Dados & Machine Learning:
Conheça nossas oportunidades