Dimensionamento da inteligência artificial (IA) em Open Banking: Criando a plataforma de aprendizado de máquina da Trustly
Engenheiro de aprendizado de máquina
"O que importa são osdados!" Essa frase ficou comigo quando decidi me juntar ao Trustly como seu primeiro engenheiro de aprendizado de máquina no início de 2023. É impressionante o que realizamos em um período tão curto desde que começamos a construir nossa plataforma de aprendizado de máquina! O tempo entre o desenvolvimento do modelo e a implantação do modelo usado para a tomada de decisões na produção caiu de meses para cerca de uma semana.
Introduzimos a governança do modelo e várias proteções pré e pós-implantação para reduzir o risco de erros de produção que afetam nosso tráfego e nossa lucratividade. Também reduzimos o tempo de resposta do modelo de segundos para apenas alguns milissegundos. Os marcos alcançados são tantos que fica difícil contar. Neste blog, descreverei como o Trustly entrou na corrida para se tornar um dos principais participantes em aprendizado de máquina e IA no espaço Open Banking e por que estamos bem posicionados para vencê-la.
Pagamentos instantâneos garantidos dependem de Open Banking Modelos de risco
Se os dados são o petróleo que alimenta a lucratividade de longo prazo, a América do Norte Open Banking é um reservatório ainda a ser descoberto, enterrado nas profundezas de décadas de ineficiências e complexidades do sistema financeiro. Vamos nos concentrar em uma dessas ineficiências: os trilhos de pagamento tradicionais, como o ACH. A ACH nos EUA leva dias para ser processada, e tem sido complicado e inconveniente para os clientes pagarem com seu banco devido à má experiência do usuário e aos longos tempos de liquidação. Por exemplo, você consegue imaginar comprar ativos de criptografia e recebê-los dias depois? Esse era o caso até que o Trustly chegou ao mercado com o Guaranteed Payments.
Agora, você pode fazer login no seu banco, escolher de qual conta bancária deseja pagar e, com apenas alguns cliques, seu pagamento estará concluído. O comerciante recebe o pagamento e você recebe seus ativos digitais imediatamente. Qualquer cliente pode pagar imediatamente diretamente de sua conta, de qualquer banco, com o clique de um botão e sem precisar de um cartão de crédito ou inserir manualmente números de conta e de roteamento. Além disso, a plataforma Open Banking da Trustlyajuda os comerciantes a reduzir as caras taxas de processamento (a taxa média de processamento de cartão de crédito é de 2,24%, o que aumenta os custos de pagamento dos comerciantes).
Para que o pagamento ACH ocorra em tempo real, o Trustly paga o comerciante diretamente de seu próprio bolso no momento da transação e, posteriormente, cobra o pagamento da conta do cliente. Como você pode imaginar, o Trustly pode não conseguir coletar o pagamento devido a fraude (que ainda é muito menor do que a fraude de cartão não presente, graças à autenticação multifator do banco) ou simplesmente porque o cliente não tinha fundos suficientes durante a transação. Alguns riscos, como os descritos acima, estão envolvidos no fornecimento de uma experiência de pagamento tão instantânea, mas é aí que entra o aprendizado de máquina. O aprendizado de máquina reforça o mecanismo de risco do Trustly para mitigar transações arriscadas e garantir que ainda possamos fornecer pagamentos garantidos e econômicos.
Trustly A desenvolveu conectores de pagamento com a maioria dos bancos da América do Norte, abrangendo 99% das instituições financeiras entre o Canadá e os EUA. Essa tecnologia permite que o Trustly acesse e use dados atualizados do Open Banking para realizar análises de risco e decidir se aprova ou recusa uma transação. A capacidade de nossa plataforma está diretamente ligada ao sucesso de nossos modelos de risco. Embora os riscos sejam altos, a capacidade de acessar dados financeiros atualizados de consumidores nos dá uma vantagem competitiva para criar produtos de dados em escala usando aprendizado de máquina.
A plataforma de aprendizado de máquina: Tomada de decisões de alto risco em escala
Criamos nossa plataforma de aprendizado de máquina para apoiar a tomada de decisões na avaliação de riscos transacionais. Vamos falar sobre escala: Trustly conecta empresas a milhares de instituições financeiras nos EUA e no Canadá como um método de pagamento de conta para conta.
Um dos desafios mais difíceis em Open Banking é a dificuldade de estabelecer um único padrão de dados entre todas as instituições financeiras. Cada instituição tem suas formas específicas de gerenciar e compartilhar seus dados. O Trustly consolida os dados financeiros das instituições financeiras e os categoriza em um único modelo de dados padrão. Nosso modelo de dados unificado nos permite criar um Feature Store que centraliza os dados de todas as instituições financeiras conectadas ao Trustly: os mesmos conjuntos de recursos podem, portanto, ser usados tanto pelos grandes bancos quanto pelos bancos locais. Esse alto nível de padronização nos permite dimensionar nossa operação de ML entre instituições e regiões geográficas. Atualmente, temos mais de 1.700 recursos que podem ser reutilizados em todos os nossos modelos de aprendizado de máquina para melhorar a tomada de decisões.
Embora os recursos possam ser conectados e utilizados em qualquer modelo, geralmente precisamos dar atenção específica aos principais parceiros comerciais ou instituições financeiras. Por exemplo, uma grande instituição financeira nos EUA pode exigir um modelo específico, enquanto instituições menores com comportamento semelhante podem ser agrupadas em um único modelo. O siteTrustly opera atualmente vários modelos individuais de aprendizado de máquina, juntamente com outros modelos que desafiam os que estão em produção para garantir um ciclo de feedback contínuo. Continuamos nos esforçando para melhorar nosso desempenho.
Enquanto na maioria dos setores as equipes de ciência de dados geralmente operam como artesãos, em que cada desenvolvimento de modelo tem um cientista de dados dedicado e seu próprio código, o site Trustly exige uma abordagem mais industrial. Como parte de nossa plataforma, criamos um pipeline de modelo padronizado que abrange todos os aspectos da criação, implantação e observabilidade do modelo, inclusive preparação de dados, seleção de recursos, ajuste de hiperparâmetros, regularização, validação de recursos, orquestração, rastreamento de artefatos e agrupamento de pontos de extremidade de serviço. Esse pipeline é versionado em uma biblioteca interna. Ele é orientado por configurações e se baseia em etapas configuráveis.
Por exemplo, é obrigatório aplicar o ajuste de hiperparâmetros para o desenvolvimento do modelo, mas é possível escolher diferentes algoritmos de ajuste por meio de uma configuração declarativa. Com esse esforço, conseguimos reduzir o tempo de desenvolvimento de modelos de cerca de 3 meses para uma única semana. Conseguimos atualizar todos os nossos modelos por meio de retreinamento automatizado graças à existência dessa padronização.
Por último, mas não menos importante, nossos modelos mais solicitados operam e mantêm um desempenho robusto de solicitação por segundo (RPS) em condições comerciais normais e podem demonstrar um aumento significativo da capacidade durante grandes eventos, como o Super Bowl. Além disso, como operamos em um negócio transacional, a avaliação de risco deve responder a fortes restrições de tempo. Nenhum cliente espera segundos para ter seu pedido processado. À medida que introduzimos avanços metodológicos na seleção de recursos, regularização e processamento paralelo, reduzimos em até 10 vezes os tempos de resposta e temos todos os nossos novos modelos com latência p99 abaixo de 200 ms, sendo que alguns modelos respondem abaixo de 35 ms!
Além da escalabilidade, também precisamos lembrar que oferecemos uma garantia e atendemos a negócios em verticais de alto risco, como criptomoedas e apostas, com um impacto direto em nossos resultados se algo der errado com a avaliação de risco. Se nossa plataforma de aprendizado de máquina cair, estaremos em sérios apuros! Para evitar esse risco, desenvolvemos medidas e processos de controle rigorosos: Cada alteração nos modelos e políticas segue procedimentos rigorosos de governança, como revisão por pares, cartões de modelo, testes automatizados, verificações de cobertura de testes, testes de estresse e várias outras formas de validação. Além disso, temos salvaguardas para reduzir o raio de explosão e a gravidade de possíveis incidentes. Por exemplo, cada modelo é acompanhado por pelo menos um modelo de reserva que pode ser ativado se o principal ficar indisponível. O modelo de fallback pode atuar como substituto se um grupo de recursos não for calculado ou se o ponto de extremidade do modelo começar a atingir o tempo limite, o que nos permite continuar as operações sem tempo de inatividade em caso de falhas.
Dimensionamento da IA em Open Banking
Somos uma equipe pequena e jovem de Engenharia de Aprendizado de Máquina e Cientistas de Dados. Ainda há muito trabalho de base a ser feito. Pode não ser hoje, amanhã ou no próximo ano, mas estamos confiantes de que nosso trabalho preparará o terreno para a IA de classe mundial em Open Banking. Trustly abriu a superfície e cavou tão fundo que atingiu o grande reservatório do sistema financeiro norte-americano que são os dados Open Banking aliados ao aprendizado de máquina. Os dados estão bombando. É hora de continuar a construir nossa plataforma de aprendizado de máquina para alimentar novos aplicativos Open Banking .