Versor: framework para PyTorch que usa rotações geométricas (Rotor) em vez de multiplicação de matrizes
(github.com/Concode0)Por trás dos resultados impressionantes do deep learning sempre esteve o tradicional “produto de matrizes (Wx+b)”. Mas o Versor questiona esse padrão. A ideia é que “as matrizes geram distorções que rasgam ou amassam o manifold durante o processamento dos dados”.
O Versor é um framework para PyTorch baseado em Álgebra Geométrica, desenvolvido para superar esse “teto da álgebra linear (Linear Algebra Ceiling)”. Em vez de matrizes, ele usa rotores (Rotor) para preservar a estrutura topológica intrínseca dos dados, propondo um novo paradigma de deep learning.
Filosofia central: Unbending (desdobrar) depois Filtering (filtrar)
A abordagem do Versor não é simplesmente “manter todas as dimensões sem reduzir nada”. O ponto central é “alinhar os dados sem danificá-los e, depois, extrair com precisão apenas a informação necessária”.
-
Unbending (Rotor)
Enquanto matrizes comuns envolvem cisalhamento (Shear) e alongamento (Stretch), o produto sanduíche de um rotor é uma isometria. Como se estivesse passando ferro em uma folha amassada, ele desdobra os dados girando-os enquanto preserva perfeitamente distâncias e ângulos.
-
Geometric Filtering (BladeSelector)
Quando os dados são desdobrados corretamente do ponto de vista geométrico, a informação se alinha a eixos específicos (Basis Blade) ou graus (Grade). Nesse momento, o
BladeSelectordescarta o ruído e mantém apenas a informação geométrica essencial (por exemplo, componentes vetoriais), reduzindo a dimensionalidade. É uma compressão qualitativamente diferente da projeção tradicional, que força a redução de dimensão deformando os dados.
Principais características
-
Metric-Agnostic Kernel: funciona com o mesmo código, mudando apenas a assinatura (Signature), desde a geometria euclidiana (Cl(3,0)) até espaço-tempo (Cl(1,3)) e geometria conforme (Cl(4,1)).
-
White-Box AI: os parâmetros aprendidos não são números indecifráveis, mas sim “planos de rotação (Bivector)”. Isso permite interpretar “em qual plano e o quanto” o modelo girou os dados para alinhá-los.
-
Alto desempenho com leveza: suporta escalonamento O(n) e é leve o suficiente para permitir inferência em tempo real (5,8 ms/molécula) até mesmo em uma CPU M4.
Enquanto trabalhos recentes da academia, como o GATr, adotam uma “abordagem arquitetural” ao usar GA dentro de uma estrutura Transformer, o Versor se concentra na “essência geométrica”, introduzindo rotores desde a unidade mínima de computação para bloquear a distorção espacial na origem. Com isso, alcança leveza suficiente para inferência em tempo real com muito menos parâmetros.
Resultados de benchmark
-
QM9 (propriedades moleculares): ao aplicar geometria euclidiana 3D (Cl(3,0)), atingiu MAE de 14,42 meV com apenas 1 hora de treinamento em uma única GPU 4090.
-
Motion Alignment (UCI-HAR): alinhou dados de movimento de alta dimensionalidade em um espaço latente linearmente separável usando apenas rotações, alcançando acurácia de ~100%.
-
Semantic Disentanglement (NLP): no dataset 20 Newsgroups, alcançou 100% de Grade Purity por meio de separação geométrica. (Grade Purity de 100% significa que dados complexamente entrelaçados foram perfeitamente separados e alinhados sem ruído, apenas como componentes de “vetor (Vector)”, provando matematicamente o sucesso do aprendizado da estrutura geométrica.)
Isso não seria overfitting?
A velocidade de convergência e a alta acurácia podem gerar essa suspeita, mas isso acontece graças a um forte viés indutivo geométrico (Geometric Inductive Bias).
-
Uma matriz comum (n x n) tem graus de liberdade demais e acaba aprendendo até o ruído,
-
mas os rotores do Versor são matematicamente restritos a permitir apenas “rotação (Rotation)”.
-
Como se trata de uma estrutura incapaz de realizar cisalhamento (Shear) ou alongamento (Stretch), o modelo simplesmente não consegue aprender nada além da estrutura essencial dos dados, mesmo que quisesse. Por isso, apresenta excelente capacidade de generalização com poucos parâmetros.
Como o Versor roda sobre o PyTorch, é possível usar praticamente a mesma interface. Além disso, novos tasks e métricas estão sendo desenvolvidos ativamente no momento, então todo feedback será muito bem-vindo.
10 comentários
Será que você poderia explicar como o projeto que você compartilhou se relaciona com o conteúdo do artigo abaixo?
Versor: A Geometric Sequence Architecture
https://arxiv.org/abs/2602.10195
https://github.com/VersorAI/Versor
O nome é exatamente o mesmo e os conceitos usados também parecem parecidos, mas como não conheço bem essa área, não consigo entender de que forma eles se relacionam.
Como os demos específicos são diferentes, imagino que talvez seja um caso de ideias semelhantes surgindo ao mesmo tempo em períodos parecidos, e pergunto isso porque tenho curiosidade se as tendências mais recentes dessa área em si estão caminhando nessa direção.
Agradeço pelo interesse. Quanto ao artigo mencionado na sua pergunta, eu já tinha conhecimento dele e cheguei a realizar pessoalmente uma análise técnica detalhada.
Com base nessa análise, identifiquei diversos indícios graves de má conduta em pesquisa (Research Misconduct), incluindo a impossibilidade física dos indicadores de desempenho alegados no artigo e manipulação de dados. Por isso, já concluí uma denúncia formal ao comitê de ética em pesquisa da instituição dos autores, a QMUL (Queen Mary University of London).
No momento, recebi um retorno da universidade informando que a denúncia foi devidamente recebida e que o procedimento oficial de investigação já entrou na fase inicial de triagem (Triage stage). Portanto, agradeceria se este artigo fosse entendido não como um caso de coincidência de ideias, mas como um assunto sob investigação oficial após a identificação de falhas éticas na pesquisa.
Mais uma vez, obrigado por reconhecer o valor do projeto original e por deixar sua pergunta.
Entendo. De todo modo, espero que tudo se resolva da melhor forma.
Oh, interessante.
Há algum resultado que possa ser comprovado com números, em vez de métricas vagas como "excelente"?
Obrigado pelo feedback. Talvez os números apresentados no texto tenham parecido um pouco incomuns e, por isso, você os tenha sentido como "vagos", mas o Versor foi desenvolvido com base rigorosa em comprovação numérica. Vou resumir novamente os principais indicadores.
Na tarefa QM9, alcançou 14,42 meV em menos de 1 hora com uma única 4090. Em comparação com os modelos SOTA anteriores, que exigem vários dias de computação em clusters de grande porte, esse número comprova uma eficiência de recursos dezenas de vezes maior.
Mesmo em ambiente de CPU (M4), registrou uma velocidade de inferência de 5,8 ms/molécula, confirmando sua eficiência em relação a outros modelos.
Na tarefa UCI-HAR também obteve 100% de acurácia e Grade Purity por meio de alinhamento geométrico. Esse é o número mais claro de que não se trata de uma simples inferência estatística, mas de um alinhamento perfeito da estrutura topológica dos dados.
O Versor está demonstrando uma realidade matemática chamada restrições geométricas. Também responderemos com números nos benchmarks que serão divulgados no futuro, então contamos com o seu interesse.
Você forneceu bem os números, mas acho que seria bom mostrar uma comparação entre eles. O que eu realmente queria saber é o quanto ficou mais rápido ao fazer algo parecido no mesmo hardware; para muita gente, saber que a velocidade é "tal" na prática não diz muita coisa e nem desperta tanto interesse.
Os dados comparativos naturalmente serão incluídos. Ainda assim, considerei que os números de eficiência por hora em uma única GPU já apresentados são suficientes para explicar o caráter inovador da arquitetura. Se você quiser uma comparação mais intuitiva, agradeço se puder aguardar os gráficos que serão atualizados em breve.
Essa abordagem parece muito boa
Eu achava que o lado da topologia algébrica poderia ser significativo, mas esse caminho é bem mais simples
Agradeço muito pela sua empatia. Eu também considerei uma abordagem pela topologia algébrica durante o processo de pesquisa, mas no fim cheguei à conclusão de que, do ponto de vista de engenharia, a clareza da álgebra geométrica se harmoniza melhor com o deep learning. O fato de você ter reconhecido o valor dessa "simplicidade" me dá muita confiança na minha abordagem.