- Projeto que raspou dados de todos os restaurantes de Londres e construiu um modelo de machine learning para analisar o impacto estrutural do algoritmo do Google Maps na sobrevivência de pequenos negócios urbanos
- O ranking do Google Maps não é apenas uma lista, mas atua como um 'formador de mercado', organizando ativamente a demanda por meio dos sinais de relevância, distância e prominence (proeminência)
- O estudo mostra uma estrutura reforçada cumulativamente por volume e velocidade de reviews, reconhecimento de marca e menções na web, gerando um ciclo de exposição inicial → aumento da demanda → aumento de reviews → exposição adicional
- Essa estrutura favorece redes e restaurantes em áreas centrais, enquanto novos restaurantes independentes enfrentam um ‘problema de cold start’, em que é difícil até serem descobertos por falta de reviews
- Para distinguir isso, foi construído um modelo de ML que prevê a nota esperada (contrafactual) com base apenas nas condições estruturais do restaurante, e a diferença em relação à nota real é calculada como residual, identificando restaurantes superestimados ou subestimados pelo algoritmo
- Indo além, o projeto agrega restaurantes por região e analisa a força estrutural dos hubs de restaurantes com PCA e clustering, mostrando como a plataforma reorganiza o ecossistema gastronômico da cidade
Google Maps não é um diretório, mas um formador de mercado (Market Maker)
- Ao contrário da narrativa oficial de que o Google Maps apenas reflete passivamente “o que as pessoas gostam”, na prática ele organiza a demanda por meio de três sinais centrais: relevance (relevância), distance (distância) e prominence (proeminência)
- relevance é inferida por correspondência textual entre a busca e os metadados do negócio; distance é um fator puramente espacial
- prominence é calculada a partir de número de reviews, velocidade de reviews, nota média, reconhecimento de marca, visibilidade na web etc., e é aí que começa seu impacto político-econômico
- Ela reflete com que frequência as pessoas interagem com um lugar, o mencionam e já o conhecem
- Em outras palavras, o Google Maps não apenas ‘reflete’ a demanda: ele é um formador de mercado (market maker) que a organiza por meio de seu algoritmo de ranking
Estrutura de vantagem cumulativa e efeito Mateus
- A visibilidade na lista de rankings determina os visitantes; os visitantes determinam a velocidade de acúmulo de reviews; e esses reviews voltam a alimentar o sinal de prominence, criando uma vantagem cumulativa (cumulative advantage)
- É semelhante à forma como o capital se multiplica por juros compostos nos mercados financeiros, uma versão do efeito Mateus (Matthew Effect) de Robert Merton aplicada a uma lanchonete de kebab
- O princípio de que “a quem tem, mais será dado”
- Redes saem na frente graças ao reconhecimento de marca em vários pontos da cidade, e estabelecimentos em áreas de alto fluxo acumulam reviews mais rapidamente mesmo com a mesma qualidade, subindo no ranking de prominence
- Novos negócios independentes enfrentam o problema de cold start: sem reviews, são difíceis de descobrir; sem serem descobertos, também é difícil acumular reviews
- O que parece uma escolha neutra do consumidor deve, na verdade, ser entendido como um desenho de mercado mediado por algoritmo
A plataforma como formadora de mercado
- Em economia, um market maker não apenas reflete oferta e demanda, mas molda ativamente liquidez, matching e descoberta de preços
- Plataformas como o Google Maps desempenham papel semelhante em serviços locais ao controlar não o preço, mas a visibilidade
- Na linguagem da economia digital, o algoritmo de ranking funciona como um attention allocator, direcionando a demanda para certos negócios e afastando-a de outros
Uma cidade contrafactual construída com machine learning
- Se o Google Maps é um formador de mercado da demanda urbana, a pergunta central passa a ser: como a cidade pareceria sem essa camada de amplificação?
- Para separar o desempenho intrínseco de um restaurante do efeito de visibilidade da plataforma, foi construído um modelo de machine learning
- Foi usado o HistGradientBoostingRegressor (árvore de decisão com gradient boosting do scikit-learn)
- Adequado para dados tabulares grandes, mistos e desorganizados, além de capturar efeitos de interação sem definição manual
- Features do modelo:
- número de reviews (com transformação log para refletir o efeito decrescente da atenção)
- tipo de culinária, se é rede ou independente, faixa de preço, categoria do negócio (restaurante/café/takeaway/bar)
- localização na cidade por meio de uma grade espacial
Modelo separado para classificação do tipo de culinária
- Foi identificado que a classificação de tipos de culinária no Google Maps é imprecisa e inconsistente
- Muitos lugares aparecem com rótulos vagos como "restaurant", "cafe" e "meal takeaway"
- Foi então criado um modelo de classificação separado para prever o tipo de culinária a partir do nome do restaurante, idioma do cardápio e texto das reviews
- O filtro de tipo de culinária no dashboard usa o resultado do machine learning, e não as tags do Google
- Erros na classificação de culinária distorcem análises de diversidade, clustering e relações competitivas de curta distância
Medindo a subavaliação algorítmica com o residual da nota
- Todas as features passam por um pipeline padrão de pré-processamento, incluindo imputação de ausências e encoding
- O modelo aprende apenas o mapeamento entre características observáveis na plataforma e a nota
- Para cada restaurante, é gerada uma nota esperada contrafactual (counterfactual expected rating)
- A diferença entre a nota real e a nota prevista é o rating residual
- residual positivo: desempenho real superior ao baseline da plataforma
- residual negativo: desempenho inferior ao que o algoritmo costuma recompensar
- Não é uma medida perfeita da qualidade da comida, mas é um indicador forte para medir subprecificação algorítmica (algorithmic mispricing)
- Ele captura pontos em que o valor social e culinário diverge daquilo que a plataforma amplifica estruturalmente
Limites da visibilidade paga por anúncio
- Alguns restaurantes pagam por promoted pins ou anúncios em busca local
- A visibilidade paga não é pública, então não pode ser estimada
- Isso é um sinal de como o poder da plataforma se tornou opaco
- O residual de nota pode acabar refletindo parcialmente gastos com publicidade não observáveis
Apresentando o London Food Dashboard
- Foi criado o London food dashboard para resumir os resultados da análise
- Recursos atuais: busca por nome, filtro de joias subestimadas (identificadas pelo algoritmo de machine learning), tipo de culinária, borough, faixa de preço, nota mínima e número de reviews
- Ainda é uma versão beta, mas funciona como um microscópio para observar a economia alimentar algorítmica de Londres
- Endereço: laurenleek.eu/food-map
- O filtro “underrated gems” é um exemplo de uso do residual de machine learning
- Bolhas maiores e mais escuras indicam lugares subestimados pelo algoritmo
Do restaurante individual à vizinhança algorítmica
- Restaurantes não fracassam sozinhos; fracassam dentro de um ecossistema
- Para analisar o que acontece quando a dinâmica da plataforma se expande do restaurante individual para todo o ecossistema alimentar do bairro, foi adicionada uma segunda camada de modelagem
- Os restaurantes foram agregados em pequenas células espaciais (hexágonos no mapa, melhores que quadrados em edge effect)
- Para cada área, foram calculadas características resumidas: densidade de restaurantes, nota média, residual médio, total de reviews, proporção de redes, entropia de culinária, faixa de preço
- Após padronizar as features, foi aplicado PCA (análise de componentes principais) para comprimir a “força do ecossistema de restaurantes” em um hub score contínuo
- Em seguida, foi aplicado K-means clustering nesse mesmo espaço de features para classificar as áreas em 4 tipos estruturais:
- hubs elite, strong, everyday e weak
Resultados da análise de hubs
- O padrão é familiar: o centro de Londres domina
- O importante não é a localização dos hubs, mas o tipo de hub
- Em vez de usar notas brutas, o hub score total foi usado para identificar os 5 hubs de restaurantes estruturalmente mais fortes de Londres
- Lugares onde densidade, atenção algorítmica, sobrevivência de negócios independentes e poder de compra do consumidor estão alinhados
- Eles aparecem rotulados no mapa
- Para evitar provocar conflitos de bairro, o texto não lista explicitamente esse ranking
Densidade por tipo de culinária e a diversidade culinária de Londres
- Ao sobrepor o painel de densidade de culinárias à análise de hubs, o resultado fica ainda mais claro
- A diversidade culinária de Londres não está distribuída de forma uniforme pela economia de plataforma
- Cozinhas de imigrantes se concentram fortemente em áreas urbanas com visibilidade algorítmica estruturalmente mais fraca
- Italian, Indian, Turkish, Chinese, Thai, British, Japanese, French, American e fish-and-chips refletem, cada uma, histórias específicas de assentamento, redes de trabalho, formatos de varejo e relações com capital e aluguel
- Algumas culinárias formam corredores longos e contínuos; outras aparecem em clusters descontínuos ligados a determinados centros comerciais ou faixas de renda
- Diversidade culinária não é apenas questão de gosto: ela está ligada a onde as famílias se estabeleceram, quais centros comerciais permaneceram baratos por tempo suficiente para que a segunda geração abrisse negócios e quais partes da cidade receberam imigração antes de o ecossistema culinário amadurecer
Implicações para políticas públicas
- O projeto começou como um problema de busca e acabou levando a uma questão maior
- O resultado mais importante não é qual bairro ficou em primeiro lugar, mas o reconhecimento de que a plataforma agora estrutura silenciosamente a sobrevivência em mercados urbanos cotidianos
- A cena gastronômica londrina já não é organizada apenas pelo gosto
- Ela é organizada por visibilidade que cresce em compounding, aluguéis que sobem quando a descoberta chega e algoritmos que distribuem atenção muito antes de o consumidor aparecer
- O que parece “escolha” está se tornando cada vez mais um efeito a jusante dos sistemas de ranking
Necessidade de transparência e auditoria algorítmica
- Se a descoberta agora molda a sobrevivência de pequenos negócios, então concorrência, justiça e regeneração urbana já não podem ignorar os sistemas de ranking das plataformas
- Mesmo que governos locais reconstruam ruas e flexibilizem licenças, a invisibilidade algorítmica pode isolar economicamente certos lugares
- Transparência e auditabilidade das plataformas deixaram de ser um debate técnico de nicho e estão se tornando, silenciosamente, ferramentas de política econômica local
- No mínimo, algoritmos de ranking com esse nível de impacto econômico devem ser auditáveis
- Assim como auditamos mercados financeiros, também deveríamos auditar o mercado da atenção (attention market)
- É preciso prestar atenção ao tamanho do poder que o Google Maps exerce como aplicativo de navegação
2 comentários
Acho que isso, somado à interferência ativa de donos de estabelecimentos nas avaliações, está gerando uma grande ineficiência. É um problema difícil. Antes, as avaliações do Google Maps eram algo em que eu confiava para escolher um lugar, mas agora parece que a área de descoberta está completamente arruinada.
O Naver Maps se tornou bem pouco confiável, e o Kakao Map até que é um pouco melhor. Mesmo assim, também há comentários pagos, então nesse tipo de área, quanto mais mainstream o serviço é, menor tende a ser a confiabilidade.