- A Huawei é alvo de uma denúncia interna segundo a qual teria copiado grandes modelos de IA da Qwen e da DeepSeek e os apresentado como produto próprio sob o nome Pangu
- Segundo o depoimento de um funcionário interno da equipe Pangu, alguns modelos substanciais não foram desenvolvidos internamente, mas apenas renomeados com base em modelos open source externos
- Tecnicamente, foi apontado que modelos importantes como o 135B V2 e o Pro MoE 72B correspondem em grande medida às arquiteturas da Qwen e da DeepSeek
- Internamente, essa prática teria levado à queda de moral entre os pesquisadores e à evasão de talentos, além de ser agravada por ineficiência administrativa e políticas de pessoal pouco transparentes
- Embora também existam modelos realmente desenvolvidos de forma autônoma (como o Pangu V3), a prática de clonagem e a cultura de pesquisa sem reconhecimento deixaram uma grande cicatriz na confiança de toda a organização
- O denunciante afirma ter decidido revelar a verdade com seu nome real e pede reflexão e mudança por parte da organização
A tragédia do Pangu: os bastidores dolorosos dos grandes modelos Pangu no Huawei Noah Ark Lab
Apresentação do denunciante e clima no local
- O autor afirma fazer parte da equipe de grandes modelos Pangu da Huawei Noah, e diz ter validado sua identidade com informações internas sobre a estrutura de organização, projetos e liderança
- O projeto Pangu estaria, na prática, mais próximo de uma organização de entrega do que de uma organização de pesquisa, sofrendo com prazos recorrentes, excesso de trabalho e pressão constante por avaliações e relatórios
- A intensidade do trabalho e a burocracia eram extremas, com longos períodos longe da família em alojamentos e trabalho frequente nos fins de semana
- Na prática, em vez de autonomia e criatividade na pesquisa, predominava uma cultura corporativa centrada em prazos de entrega e resultados para cada linha de produto (Cloud, ICT etc.)
Noites sem dormir, consciência criativa esmagada
- Após a controvérsia sobre o plágio do modelo Qwen, parte dos pesquisadores teria experimentado ao mesmo tempo vergonha, raiva e sensação de impotência
- O próprio denunciante diz temer retaliações de uma grande empresa e de redes internas, mas afirma não conseguir mais suportar o encobrimento dos fatos e a propaganda enganosa para o público externo, decidindo então fazer uma confissão por consciência
Dificuldades técnicas e o início do plágio
- Os modelos Pangu iniciais tentaram treinamento próprio com base em NPUs Ascend da Huawei, mas enfrentaram sérios contratempos, como baixa eficiência do tokenizer e desempenho fraco do modelo
- A equipe ficou atrás de concorrentes (Alibaba, Zhipu) com modelos baseados em GPU, e o treinamento do modelo dense próprio de 230B terminou em fracasso
- Diante disso, o laboratório de modelos pequenos teria apresentado como “desenvolvimento próprio” algo que na verdade era um 135B V2 criado a partir da clonagem e de pequenas modificações do modelo Qwen-1.5 (110B), com semelhanças visíveis internamente em código e estrutura
- A principal liderança e executivos teriam conhecimento dessa realidade, mas a teriam tolerado devido à pressão por resultados externos e desempenho
Conquista técnica real: Pangu V3
- Depois de muito esforço, a equipe treinou de forma independente no Ascend o modelo Pangu V3 (135B Ultra), totalmente desenvolvido internamente desde o início
- Superando diversos obstáculos técnicos (unificação do tokenizer, estabilização da curva de perda etc.), o time teria alcançado desempenho semelhante ao dos concorrentes
- Essa conquista seria uma prova de desenvolvimento independente de grandes modelos, e não de plágio, sendo fonte de orgulho para os pesquisadores
O esforço não reconhecido por trás da divisão de trabalho
- O laboratório de modelos pequenos teria continuamente levado dados, código e resultados para modificar/distribuir modelos com facilidade, enquanto méritos e recompensas ficavam majoritariamente com essa organização
- Como resultado, pesquisadores dedicados teriam deixado a organização ou passado a tratar isso com amargura como uma mancha em suas carreiras técnicas
Casos secundários de plágio, como os clones 224B MoE/718B
- Também no processo de desenvolvimento de um novo modelo 718B MoE, a equipe teria praticamente copiado o DeepSeekv3 e depois o distribuído com o nome Pangu Pro MoE 72B
- Internamente, essa prática seria conhecida, mas prevaleceria um clima de silêncio por causa do medo pela própria sobrevivência e de revelar a verdade
Gestão administrativa absurda
- Aos pesquisadores reais eram aplicados rígidos processos, linhagem de modelos e sistemas de auditoria, o que atrasava a velocidade de desenvolvimento
- Mas, no caso dos modelos clonados, persistiria um duplo padrão enraizado de que “se vier de cima, tudo passa”
Motivo da denúncia e decisão de sair
- Após o caso HonestAGI, teria começado uma tentativa de gestão de crise em nível corporativo e de encobrimento interno
- O denunciante afirma não poder mais participar de “relatórios falsos” e de conluio interno, e diz ter pedido a remoção de seu nome de listas de equipe e relatórios, além de manifestar a intenção de se demitir voluntariamente
Apelo final e afeto pelos colegas
- Colegas já teriam migrado para outras empresas como ByteDance, DeepSeek, Tencent e Kuaishou, mostrando a gravidade da fuga de talentos da Huawei
- O texto enfatiza que, com inovação, ambiente adequado e menos barreiras políticas, seria possível desenvolver grandes modelos e chips de nível mundial
- O autor declara estar disposto a assumir até mesmo possíveis ameaças à segurança de si próprio e de sua família decorrentes da veracidade deste conteúdo e de novas revelações
Contexto adicional
- No caso do clone 135B V2, o laboratório de modelos pequenos teria ficado apenas com benefícios como prêmios e incentivos, enquanto o peso do suporte downstream e da manutenção foi repassado à equipe de desenvolvimento original (4th brigade)
- Até mesmo na autoria do relatório técnico do Pangu, pessoas que contribuíram de forma central para o desenvolvimento do modelo teriam sido excluídas, enquanto não contribuintes ligados ao laboratório de modelos pequenos foram incluídos, refletindo práticas acadêmicas injustas generalizadas
1 comentários
Comentários no Hacker News