Como é definida a primeira tela que você vê? A história da recomendação personalizada de banners na

O banner da home é a principal área que aparece primeiro na tela inicial do cliente, e maximiza a taxa de cliques (CTR) e a experiência do usuário por meio de um sistema de recomendação hiperpersonalizado
Saindo do método anterior de simples otimização de CTR baseado em MAB (Multi-Armed Bandit), a empresa passou a refletir com mais precisão as características de banners e usuários com algoritmos modernos como DeepFM, Two-Tower e HGNN e embeddings baseados em grafos
Problemas característicos do domínio, como ciclo de vida curto dos banners, feedback de clique com muito ruído e desbalanceamento de dados, foram resolvidos com Continual Learning e operação híbrida entre modelos individuais e integrados
Como resultado final, foi construída uma pipeline de recomendação estruturada com melhoria de mais de 16% no CTR, resposta a novos banners e usuários cold start, além de integração com tempo real e políticas de negócio
Daqui para frente, a evolução continuará com serving em tempo real, Multi-Task Learning, aprimoramento da qualidade dos embeddings e adoção de métricas de desempenho mais amplas

Criando uma experiência melhor com big banners personalizados para cada cliente

Com o aumento dos gostos dos clientes e da diversidade do conteúdo exibido, havia um limite para oferecer uma experiência satisfatória com exibição uniforme de banners
Com o objetivo de maximizar o CTR, foi conduzido um projeto para introduzir lógica de exibição personalizada no big banner do topo da home de cada store

Importância e características do banner da home

O banner da home é um banner deslizante no topo da tela que o cliente vê primeiro no serviço da Musinsa (35 peças no total); no app, é exibida uma peça, e na web, três
Cerca de 97% de todo o tráfego da Musinsa encontra o banner da home ao entrar na tela principal
Os cliques no banner da home representam 35% do total de cliques e 37% das sessões em que ocorre clique, mostrando sua grande relevância
É uma área com impacto muito alto em conversão de negócio devido à alta frequência de exposição

Limitações do método de recomendação anterior

Antes, a recomendação era feita com foco em CTR usando o algoritmo MAB (Multi-Armed Bandit)
- Balanceamento entre exploração (Exploration) e aproveitamento (Exploitation)
Três limitações:
- Dependência de um único indicador de CTR, com pouca capacidade de refletir diferentes preferências de clientes e características dos banners
- Dificuldade para refletir a relação entre banners (tratamento independente)
- Cold start (queda de desempenho quando faltam dados de clique para novos banners)
Para superar essas limitações, foi projetado um novo sistema de recomendação

Pipeline do sistema de recomendação

O sistema é composto por uma pipeline em múltiplas etapas
1. Reforço da representação do banner: extração de embeddings baseados em texto, imagem e produtos relacionados ao banner (com uso de HGNN e GraphSAGE)
2. Treinamento do modelo de previsão de cliques: aplicação simultânea dos modelos DeepFM (interação entre features) e Two-Tower (embeddings separados de usuário/banner)
3. Scoring e aplicação dos banners: cálculo batch/em tempo real do score previsto de CTR por usuário
  - Para usuários com dados suficientes, personalização refinada
  - Para usuários novos ou cold, recomendação baseada em segmento
4. Reflexo das políticas de negócio: além da pontuação do sistema, políticas e estratégias da empresa, banners de campanha e mudanças urgentes também são refletidos em tempo real
5. Exibição final dos banners: recomendação e exibição final dos banners Top-N com maior score

Apresentação dos principais modelos de recomendação

DeepFM: estrutura paralela de FM (interações de 2ª ordem) + DNN (interações de alta dimensão), aprendendo de forma eficaz tanto dados esparsos quanto interações complexas, com excelente desempenho em previsão de CTR
Two-Tower: extração de embeddings de usuário e banner em redes neurais independentes, com pontos fortes em dados de grande escala e serving em tempo real, além de recomendação baseada em similaridade

DeepFM

Combinação de camada FM (interação de features de 2ª ordem) + camada DNN (integração não linear de features em alta dimensão)
Forte para dados esparsos e com estrutura de aprendizado End-to-End, permitindo otimização consistente de desempenho
Usa como features informações do usuário, metadados do banner e embeddings (64 dimensões)
Trata o vetor de embedding como um único bloco para garantir eficiência e estabilidade no aprendizado
Gera o ranking dos banners com base no resultado de previsão de CTR

Two-Tower

Usuário e banner são embutidos em redes neurais separadas (torres), e a recomendação é feita por cálculo de similaridade
Oferece escalabilidade adequada para grandes volumes de dados e resposta rápida com vetorização prévia (baixa latência)
Cada tower aproveita diferentes informações de entrada, como demografia, logs de comportamento, texto/imagem etc.
Sua estrutura de aprendizado separado/processamento paralelo permite responder de forma rápida e flexível a grandes problemas de recomendação

Principais dificuldades encontradas na aplicação prática

Os banners da home têm ciclo de vida muito curto (2 a 3 dias, e às vezes até em escala de horas), exigindo reflexão em tempo real
O sinal de feedback depende principalmente de cliques, dificultando identificar a preferência real do usuário
Diferentemente de produtos e marcas, banners têm pouca metadata estruturada, e entender o contexto de imagem e texto é difícil
O desbalanceamento de dados entre stores (diferença de tráfego e atividade entre categorias especializadas) pode degradar o desempenho geral
Para superar esses problemas, o sistema foi redesenhado em torno de três eixos técnicos: reforço da expressividade, atualização contínua e mitigação do desbalanceamento

Medidas práticas de melhoria

Reforço das características do banner

Para superar as limitações do uso da média de embeddings do PinSAGE (limite para representar banners complexos e impossibilidade de recomendar novos banners), foi adotado HGNN
Com base nos padrões de comportamento dos usuários, a relação banner-produto foi embutida na estrutura de grafo com GraphSAGE
Para informações de texto e imagem, foi usada uma combinação de embeddings de LLM
Foi introduzida atualização em tempo real dos embeddings de usuário e Continual Learning, refletindo os interesses mais recentes do usuário
Aumento de 8,3% no CTR

Continual Learning

Em vez de aprendizado em lote com todos os dados, foi introduzida atualização contínua (a cada 1 hora, com logs das últimas 3 horas)
A taxa de aprendizado é ajustada dinamicamente conforme o volume de atividade (até 5x durante a semana, 2x à noite)
Isso viabilizou adaptação rápida, prevenção do envelhecimento do modelo e incorporação ágil de recomendações sem queda de desempenho
Aumento de 24% no CTR

Escolha estratégica de modelos

Foi definida a melhor estratégia de modelagem para cada store
Na main store, DeepFM+Continual; nas categorias especializadas, modelos individuais Two-Tower, com melhoria de 19% no CTR

Resultado final

Em relação ao MAB anterior, houve melhora de 11,2% no CTR com Two-Tower e 16,1% com DeepFM
Na home da Musinsa, foi aplicado em produção o DeepFM+Continual Learning; nas categorias especializadas, o modelo Two-Tower

Próximos passos

Estão em andamento avanços como migração para arquitetura de serving em tempo real, adoção de Multi-Task Learning (CTR+GGMV), melhoria da qualidade dos embeddings e da estrutura do grafo e diversificação das métricas de desempenho
O plano é evoluir para um modelo que vá além de um CTR único e avalie também diferentes objetivos de negócio e a qualidade da experiência

Como é definida a primeira tela que você vê? A história da recomendação personalizada de banners na home da Musinsa

Criando uma experiência melhor com big banners personalizados para cada cliente

Importância e características do banner da home

Limitações do método de recomendação anterior

Pipeline do sistema de recomendação

Apresentação dos principais modelos de recomendação

DeepFM

Two-Tower

Principais dificuldades encontradas na aplicação prática

Medidas práticas de melhoria

Reforço das características do banner

Continual Learning

Escolha estratégica de modelos

Resultado final

Próximos passos

1 comentários

Como é definida a primeira tela que você vê? A história da recomendação personalizada de banners na home da Musinsa

Criando uma experiência melhor com big banners personalizados para cada cliente

Importância e características do banner da home

Limitações do método de recomendação anterior

Pipeline do sistema de recomendação

Apresentação dos principais modelos de recomendação

DeepFM

Two-Tower

Principais dificuldades encontradas na aplicação prática

Medidas práticas de melhoria

Reforço das características do banner

Continual Learning

Escolha estratégica de modelos

Resultado final

Próximos passos

Leituras relacionadas

1 comentários