A ciência de dados é o eixo do Nubank, startup brasileira recentemente licenciada pelo Banco Central como instituição financeira, cujo valuation gira em torno dos US$ 4 bilhões. Para viabilizar o negócio de cartão de crédito e conta corrente digital sem cobrança de taxa, a empresa investiu na formação de uma equipe de cientistas de dados. A base de clientes hoje supera os cinco milhões. É a fintech mais valiosa da América do Sul e, segundo a KPMG e a H2 Ventures, a sétima mais inovadora do mundo.

Em 2013, o Brasil pouco conhecia o termo fintech – empresas que prestam serviços financeiros inteiramente baseados em tecnologia. Naquele ano, o Nubank foi criado com o desafio de competir em um mercado maduro e dominado pelos grupos financeiros tradicionais. Logo na partida, calcou sua estratégia em oferecer cartão de crédito sem taxa de anuidade e com administração totalmente on-line. Ao mesmo tempo, o Nubank teve de buscar a última fronteira da inovação nos mais variados quesitos. Parte expressiva dos investimentos foi direcionada à ciência de dados, que àquela altura já se anunciava como uma grande vantagem competitiva para instituições com este perfil.

Desde o início, o banco estabeleceu como premissa não poupar esforços para encontrar e manter os melhores cientistas de dados do país, um mercado em que a demanda supera a oferta. O Nubank paga salários acima da média para assegurar o melhor capital humano em seu time. Para a fintech, nunca houve outra escolha senão ser uma empresa data-driven – metodologia orientada a dados.

Nos últimos cinco anos, o objetivo principal se manteve: entender exatamente o que os clientes querem para ofertar o melhor produto possível, além de aproveitar as informações para oferecer um bom atendimento – um grande diferencial no setor bancário.

DADOS ACESSÍVEIS

Para potencializar a utilidade da área, o Nubank empregou uma política de dados abertos para seus funcionários: 100% das informações referentes a transações de usuários ficam disponíveis (de maneira anonimizada) em uma plataforma acessível a todos. Dessa forma, os dados podem enriquecer tanto uma equipe de comunicação em busca do valor movimentado por cartões de crédito durante a Black Friday quanto esclarecer, para alguém do atendimento, se determinado produto tem gerado maior ou menor procura. Para uma análise ainda mais profunda dos dados, os funcionários do Nubank têm a possibilidade de recorrer à equipe de Tecnologia de Informação (TI).

A DINÂMICA DA CIÊNCIA DE DADOS

A área de Tecnologia da Informação do banco se divide em três grandes subáreas, chamadas de chapters: Engenharia de Softwares, Gerência de Produtos e Ciência de Dados, que atualmente conta com 15 profissionais dedicados. Dentro de cada chapter, os funcionários se dividem em squads, como são conhecidos os grupos de pessoas dedicadas a resolver o mesmo problema. Esses squads podem incluir pessoas de diferentes chapters, dependendo do caso. Por esta razão, o efetivo varia de tamanho: alguns não passam de 10 pessoas e outros chegam a ter mais de 100.

Apesar dessa divisão, a distribuição interna de tarefas dentro da área é livre, e há um intercâmbio de ideias entre todas. É de maneira descentralizada que as demandas para os cientistas de dados chegam na fintech. Alguém, em algum lugar da empresa, percebe que existe um problema que a ciência de dados pode ajudar a resolver. A questão é levada ao chapter e este começa a trabalhar.

1ª ETAPA: INVESTIGAÇÃO

A primeira etapa é voltada a investigar o problema, identificar as dificuldades trazidas para o banco, que vantagens sua resolução trará e a que custo e, por fim, qual é a urgência da questão. Se os cientistas de dados decidem que a abordagem de fato valerá a pena, seguem em frente.

2ª ETAPA: COLETA E TRATAMENTO

A fase seguinte é de coleta dos dados referentes ao problema para tentar criar um modelo (um pedaço de software) capaz de solucioná-lo. Aqui há dois passos distintos. Primeiro, é necessário descobrir quais informações são relevantes para a resolução da falha. Depois, é preciso tratá-las para que sejam utilizáveis por sistemas computacionais, como algoritmos de aprendizado de máquina, por exemplo.

Pode parecer um processo longevo, mas acontece diariamente: ao fim de cada jornada, uma equipe dedicada à infraestrutura de dados roda um programa que “limpa” os dados coletados nas últimas 24 horas para torná-los adequados ao trabalho dos cientistas. A equipe Nubank se vale de uma série de ferramentas de computação e armazenamento na nuvem, bem como da linguagem de programação Scala para construir conjuntos de dados (data sets, em inglês).

3ª ETAPA: CRIAÇÃO E TESTE DE MODELOS

Após esse ciclo, quando os dados já estão unidos e prontos para serem trabalhados, a equipe de cientistas pode começar a criar os modelos em si. Com base no que já se sabe sobre o problema, os profissionais criam e testam uma série de modelos até que se chegue a um capaz de responder as perguntas necessárias ou resolver o problema com a maior precisão possível. O squad dedicado à resolução daquele problema traz seu trabalho para o resto do chapter opinar sobre a solução. Se a nova criação passar pelo crivo da equipe, ela pode então ser implementada. Para que o processo não pareça abstrato, segue um exemplo:

Há alguns meses, a equipe de atendimento percebeu que o tempo de resposta para dúvidas dos clientes que chegavam pelo chat estava demorado demais. Como a empresa investe muito em atendimento como diferencial, julgou-se que valia a pena dedicar horas dos cientistas de dados ao problema. Para resolvê-lo, a solução encontrada foi criar um sistema capaz de, automaticamente, encaminhar as mensagens que chegavam pelo chat à pessoa adequada. Era basicamente o mesmo trabalho de uma triagem de hospital: explica-se o que está sentindo para ser encaminhado a um especialista.

 

CRIAÇÃO DO SISTEMA

Ao analisar as mensagens que chegavam pelo chat, foi possível desenvolver um sistema capaz de identificar o que o cliente queria apenas com base nas palavras usadas. Se uma mensagem continha os termos “aumento” e “limite”, por exemplo, ele era direcionado para um funcionário capaz de avaliar se poderia ou não ter um aumento de limite, quanto poderia aumentar e por quê. Quando o sistema atingiu um nível de precisão aceitável, foi levado para avaliação do chapter. Depois de passar pelo crivo do restante da equipe, foi implementado para facilitar a vida dos funcionários da área de atendimento – e dos clientes que precisavam deles.

OUTRAS APLICAÇÕES DA CIÊNCIA DE DADOS

O uso de dados vai além da criação de modelos. Há casos críticos no Nubank que os utilizam para determinar como aumentar limites de clientes de maneira a otimizar sua satisfação e diminuir risco para a empresa. Ou ainda, detectar se um cliente está sendo vítima de fraude com base em suas transações.

Novos produtos também utilizam dados para se firmar. Recentemente, a fintech lançou a NuConta, uma conta-corrente totalmente digital. Para determinar os clientes que poderiam ter acesso à novidade, dados foram fontes. E para otimizar seu uso, que pode envolver a transferência de recursos via QR Code entre contas, a equipe trabalhou para determinar quais pessoas eram próximas dessa primeira leva de usuários e que também estariam aptas a receber o recurso.

Os tipos de dados usados para trabalhar essas questões variam bastante. Como o Nubank é uma empresa de crédito, muitas vezes são números como gasto médio das transações, gasto médio mensal, limites e tempo de atraso de pagamentos. Mas também podem ser textos, como no caso do chat, e exigir outro tipo de tratamento.

E há também as imagens envolvidas no processo de solicitação do cartão, que exige fotos de documentos tiradas com o celular. É preciso processá-las para que sirvam como fontes de dados – e até para identificar automaticamente se alguém está tentando pedir algo com um documento adulterado.

A FINTECH

Desde sua fundação em 2013, o Nubank alcançou a marca de cinco milhões de clientes no cartão de crédito e na conta corrente, ambos digitais. A fintech está entre os cinco maiores emissores brasileiros de cartão de crédito, é considerado o maior desafiante de bancos do mundo fora da Ásia.

No primeiro semestre de 2018, o valor de mercado foi avaliado em mais de US$ 1 bilhão, o que colocou o Nubank na seleta lista brasileira de unicórnios – apelido para empresas nascentes de tecnologia que chegam ao primeiro bilhão de dólares em valor de mercado.  Hoje, no entanto, o valuation estimado já é de US$ 4 bilhões.

O Nubank já captou US$ 707,6 milhões em aportes. O valor inclui um recente investimento de US$ 180 milhões da gigante chinesa Tencent. O estudo Fintech 100 2018, elaborado pela KPMG e H2 Ventures, aponta a fintech como a sétima mais inovadora do mundo. A meta de longo prazo é ser uma plataforma financeira completa em que os clientes consigam acessar diferentes produtos.