- É proposto que o operador binário único EML na forma exp(x) − ln(y) pode gerar todas as funções elementares e constantes
- Com esse operador e apenas a constante 1, é possível expressar operações aritméticas, funções transcendentes (sin, cos, log, √ etc.) e constantes complexas (e, π, i)
- Todas as expressões EML são compostas por árvores binárias com a mesma estrutura de nós, o que permite uso em regressão simbólica e aprendizado baseado em gradiente
- O EML é o correspondente matemático do gate NAND, desempenhando o papel de operador universal único na matemática contínua
- A descoberta mostra que todas as funções elementares podem ser reduzidas a uma única regra geradora, abrindo novas possibilidades para busca de fórmulas e IA simbólica
Definição do operador binário único EML
- É proposto que o operador binário único na forma eml(x, y) = exp(x) − ln(y) pode gerar todas as funções elementares
- Com esse operador e apenas a constante 1, é possível expressar operações aritméticas (+, −, ×, /, potenciação), funções transcendentes (sin, cos, log, √ etc.) e constantes (e, π, i)
- Como exemplo, e^x = eml(x, 1) e ln x = eml(1, eml(eml(1, x), 1))
- O operador EML (Exp–Minus–Log) realiza cálculos no domínio dos números complexos (C)
- A constante 1 serve para neutralizar o termo logarítmico por meio de ln(1)=0
- Por meio do cálculo de ln(−1), é possível gerar constantes complexas como i e π
- Esse operador é apresentado como o operador básico único da matemática contínua correspondente ao gate NAND da lógica digital
- Assim como o NAND constrói toda a lógica booleana, o EML constrói todas as funções elementares
Conceito de calculadora baseada em um único operador
- É apresentado o conceito de “calculadora de dois botões”
- Com apenas um operador binário (EML) e uma constante (1), é possível executar todas as funções de uma calculadora científica
- Mesmo sem operadores adicionais, é possível calcular todas as funções elementares reais e complexas
- Não é possível reduzir ainda mais o número de operadores
- No mínimo, é necessário um operador binário e um símbolo terminal (constante)
Características estruturais das expressões EML
- Todas as expressões EML têm uma estrutura de árvore binária composta por nós idênticos
- Forma gramatical: S → 1 | eml(S, S)
- Isso pode ser interpretado como uma linguagem livre de contexto isomórfica à estrutura de Catalan e a árvores binárias completas
- Essa estrutura uniforme permite aplicar otimização baseada em gradiente (como Adam) em regressão simbólica (symbolic regression)
- Ao usar a árvore EML como circuito treinável, é possível recuperar com exatidão funções elementares em forma fechada com profundidade rasa de árvore (máximo 4)
- Quando a lei geradora é uma função elementar, os pesos aprendidos podem convergir para a forma exata da fórmula
Processo de descoberta e implicações matemáticas
- O operador EML foi descoberto por meio de busca exaustiva sistemática (exhaustive search)
- Os resultados da busca confirmaram que o EML constitui uma base operacional completa para uma calculadora científica
- Foi utilizada a abordagem de “calculadora quebrada” (broken calculator), reduzindo gradualmente o número de operadores
- Houve redução de 4 → 3 → 2 → 1 operador, mantendo funcionalidade completa
- O EML tem uma simplicidade inesperada e é um operador binário definido por funções elementares
- A existência do EML mostra que as funções elementares pertencem a uma hierarquia geradora muito mais simples
- Isso amplia a ideia de que diferentes funções podem ser reduzidas a combinações de exp e ln
- Como todas as fórmulas matemáticas podem ser expressas por meio de um único componente repetível,
- torna-se possível uma representação circuital de expressões matemáticas, análoga à construção de circuitos eletrônicos com transistores
- Essa representação uniforme em circuito abre novas possibilidades para busca, avaliação e aprendizado de fórmulas
Conceitos relacionados e contexto histórico
- A universalidade de um único elemento básico é um conceito importante em matemática, engenharia e biologia
- Exemplos: gates NAND/NOR, função de ativação ReLU, combinadores K,S, OISC (SUBLEQ), autômato celular Rule 110 etc.
- Elementos do tipo Sheffer são raros, e sua descoberta exige tempo, computação e sorte
- O EML é apresentado como um exemplo desse tipo de operador contínuo no estilo de Sheffer
- A pesquisa se baseia em relações de redução já conhecidas, como a expressabilidade mútua entre logaritmos e exponenciais (x×y = e^{ln x + ln y}, x+y = ln(e^x × e^y)) e a fórmula de Euler (e^{iφ} = cos φ + i sin φ)
Conjunto de funções elementares e expansões futuras
- O estudo parte de um conjunto de funções elementares no nível de uma calculadora científica
- Constantes: π, e, i, −1, 1, 2, x, y
- Funções unárias: exp, ln, inv(1/x), minus(−x), √, sqr(x²), σ(1/(1+e^−x)), sin, cos, tan, arcsin, arccos, arctan, sinh, cosh, tanh etc.
- Operações binárias: +, −, ×, /, log, pow(x^y), avg((x+y)/2), hypot(√(x²+y²))
- Foi demonstrado que todo esse conjunto pode ser completamente substituído por um único operador EML e a constante 1
- Na busca inicial, também foram encontrados operadores semelhantes com propriedades ainda mais fortes
- Exemplo: uma variante ternária que não requer constantes
- O EML é apresentado como um ponto de partida que mostra a possibilidade da existência de um único operador gerador para a matemática contínua
- No futuro, isso pode ter várias aplicações em descoberta automática de fórmulas, IA simbólica e otimização de representações matemáticas
2 comentários
Em termos de fórmula, então seria $eml(x, y) = e^x - ln(x)$.
Mas parece que isso só vai realmente brilhar quando surgir um processador capaz de calcular $e^x$ ou $ln(x)$ de uma vez só.
Comentários do Hacker News
Essa abordagem não é particularmente especial nem a de menor custo computacional
Por exemplo, se definirmos f(x, y) = 1/(x - y), isso também se torna um operador universal
Se tomarmos x#y = 1/(x - y), então x#0 = 1/x nos dá o recíproco, e (x#y)#0 = x - y permite expressar a subtração
É um problema comum mostrar que, só com recíproco e subtração, dá para construir as quatro operações básicas
Há uma prova curta relacionada nesta nota
Fiquei feliz em ver uma ideia no estilo FRACTRAN chegar à página principal
Isso me lembra o método de codificar uma pilha de 1 bit em binário.
Dar push em 0 dobra o número; dar push em 1 dobra e depois soma 1. Pop equivale a dividir por 2
Eu uso uma linguagem concatenativa chamada Rejoice, baseada em ideias assim. Os dados são representados como multisets compostos por multiplicação
Wiki do Rejoice
Isso é um ótimo benchmark para testar desempenho de LLMs
O Opus(pago) falhou dizendo que “2” era circular, mas como o ChatGPT já tinha feito, ele teve sucesso
ChatGPT(grátis) acertou de primeira, Grok estimou a profundidade, Gemini acertou, Deepseek não conseguiu carregar o PDF, Kimi parou no meio, e GLM foi razoável
Visualização das 36 diferentes funções EML de 2 etapas de uma variável
As 18 primeiras produzem saídas reais, e as demais incluem valores complexos no meio do processo
Link da imagem
As antigas tabelas de funções dos livros de matemática talvez pudessem ser reinterpretadas como uma simples consulta de hash
A frase “é possível computar tudo apenas com EML e o número 1” me lembra o combinador Iota
Parece a ideia de alcançar completude de Turing com um sistema formal mínimo
O link atual do artigo ainda é a v1 e está sem figuras. Deveria ser trocado para a v2
Ainda estou lendo, mas, se for verdade, talvez seja uma grande descoberta em anos
Se der para ajustar dados ou funções de onda com árvores EML em vez de splines ou polinômios,
então funções multivariadas também poderiam ser aprendidas com gradient descent e convertidas em árvores de aproximação EML
Talvez até fosse possível treinar impondo as condições derivadas da equação de Schrödinger
Parece bom demais para ser verdade, mas esse tipo de coisa já aconteceu antes
Para expressar uma única multiplicação, é preciso uma árvore de profundidade 8 com pelo menos 41 folhas
Existe um trade-off entre a elegância de um conjunto mínimo de operações e o comprimento da expressão
Tenho trabalhado numa abordagem que combina redes neurais espectrais e symbolic regression com teoria de operads e teoria das categorias
Polinômios são rápidos de calcular para o nível de expressividade que oferecem
O que você descreveu é parecido com a symbolic regression existente. Já é uma área madura
Ainda assim, é uma descoberta muito interessante
Acho que a derivação de -x está errada
Pela execução na máquina de pilha, eml(z, eml(x,1)) tem a forma e^z - x,
e, para isso virar -x, seria preciso que e^z = 0. Mas esse z complexo não existe
Se expandir z de fato, aparece um problema do tipo ln(0). x^-1 é parecido
Se você assumir ln(0)=∞ e x/∞=0, então ele funciona de modo “plausível”
Pela ordem de cálculo, fica ln(1)=0 → e-ln(0)=+∞ → e-ln(+∞)=-∞
Isso me faz pensar em algumas ideias interessantes
Por diversão, ontem criei o projeto emlvm
A parte sobre “ser possível reconstruir funções em forma fechada com árvores EML de profundidade até 4” é realmente muito legal
Eu sempre me perguntei se algo assim seria possível