Geração de todas as funções elementares a partir de um único operador binário

(arxiv.org)

7 pontos por GN⁺ 17 일 전 | 2 comentários | Compartilhar no WhatsApp

É proposto que o operador binário único EML na forma exp(x) − ln(y) pode gerar todas as funções elementares e constantes
Com esse operador e apenas a constante 1, é possível expressar operações aritméticas, funções transcendentes (sin, cos, log, √ etc.) e constantes complexas (e, π, i)
Todas as expressões EML são compostas por árvores binárias com a mesma estrutura de nós, o que permite uso em regressão simbólica e aprendizado baseado em gradiente
O EML é o correspondente matemático do gate NAND, desempenhando o papel de operador universal único na matemática contínua
A descoberta mostra que todas as funções elementares podem ser reduzidas a uma única regra geradora, abrindo novas possibilidades para busca de fórmulas e IA simbólica

Definição do operador binário único EML

É proposto que o operador binário único na forma eml(x, y) = exp(x) − ln(y) pode gerar todas as funções elementares
- Com esse operador e apenas a constante 1, é possível expressar operações aritméticas (+, −, ×, /, potenciação), funções transcendentes (sin, cos, log, √ etc.) e constantes (e, π, i)
- Como exemplo, e^x = eml(x, 1) e ln x = eml(1, eml(eml(1, x), 1))
O operador EML (Exp–Minus–Log) realiza cálculos no domínio dos números complexos (C)
- A constante 1 serve para neutralizar o termo logarítmico por meio de ln(1)=0
- Por meio do cálculo de ln(−1), é possível gerar constantes complexas como i e π
Esse operador é apresentado como o operador básico único da matemática contínua correspondente ao gate NAND da lógica digital
- Assim como o NAND constrói toda a lógica booleana, o EML constrói todas as funções elementares

Conceito de calculadora baseada em um único operador

É apresentado o conceito de “calculadora de dois botões”
- Com apenas um operador binário (EML) e uma constante (1), é possível executar todas as funções de uma calculadora científica
- Mesmo sem operadores adicionais, é possível calcular todas as funções elementares reais e complexas
Não é possível reduzir ainda mais o número de operadores
- No mínimo, é necessário um operador binário e um símbolo terminal (constante)

Características estruturais das expressões EML

Todas as expressões EML têm uma estrutura de árvore binária composta por nós idênticos
- Forma gramatical: S → 1 | eml(S, S)
- Isso pode ser interpretado como uma linguagem livre de contexto isomórfica à estrutura de Catalan e a árvores binárias completas
Essa estrutura uniforme permite aplicar otimização baseada em gradiente (como Adam) em regressão simbólica (symbolic regression)
- Ao usar a árvore EML como circuito treinável, é possível recuperar com exatidão funções elementares em forma fechada com profundidade rasa de árvore (máximo 4)
- Quando a lei geradora é uma função elementar, os pesos aprendidos podem convergir para a forma exata da fórmula

Processo de descoberta e implicações matemáticas

O operador EML foi descoberto por meio de busca exaustiva sistemática (exhaustive search)
- Os resultados da busca confirmaram que o EML constitui uma base operacional completa para uma calculadora científica
Foi utilizada a abordagem de “calculadora quebrada” (broken calculator), reduzindo gradualmente o número de operadores
- Houve redução de 4 → 3 → 2 → 1 operador, mantendo funcionalidade completa
O EML tem uma simplicidade inesperada e é um operador binário definido por funções elementares
A existência do EML mostra que as funções elementares pertencem a uma hierarquia geradora muito mais simples
- Isso amplia a ideia de que diferentes funções podem ser reduzidas a combinações de exp e ln
Como todas as fórmulas matemáticas podem ser expressas por meio de um único componente repetível,
- torna-se possível uma representação circuital de expressões matemáticas, análoga à construção de circuitos eletrônicos com transistores
Essa representação uniforme em circuito abre novas possibilidades para busca, avaliação e aprendizado de fórmulas

Conceitos relacionados e contexto histórico

A universalidade de um único elemento básico é um conceito importante em matemática, engenharia e biologia
- Exemplos: gates NAND/NOR, função de ativação ReLU, combinadores K,S, OISC (SUBLEQ), autômato celular Rule 110 etc.
Elementos do tipo Sheffer são raros, e sua descoberta exige tempo, computação e sorte
- O EML é apresentado como um exemplo desse tipo de operador contínuo no estilo de Sheffer
A pesquisa se baseia em relações de redução já conhecidas, como a expressabilidade mútua entre logaritmos e exponenciais (x×y = e^{ln x + ln y}, x+y = ln(e^x × e^y)) e a fórmula de Euler (e^{iφ} = cos φ + i sin φ)

Conjunto de funções elementares e expansões futuras

O estudo parte de um conjunto de funções elementares no nível de uma calculadora científica
- Constantes: π, e, i, −1, 1, 2, x, y
- Funções unárias: exp, ln, inv(1/x), minus(−x), √, sqr(x²), σ(1/(1+e^−x)), sin, cos, tan, arcsin, arccos, arctan, sinh, cosh, tanh etc.
- Operações binárias: +, −, ×, /, log, pow(x^y), avg((x+y)/2), hypot(√(x²+y²))
Foi demonstrado que todo esse conjunto pode ser completamente substituído por um único operador EML e a constante 1
Na busca inicial, também foram encontrados operadores semelhantes com propriedades ainda mais fortes
- Exemplo: uma variante ternária que não requer constantes
O EML é apresentado como um ponto de partida que mostra a possibilidade da existência de um único operador gerador para a matemática contínua
- No futuro, isso pode ter várias aplicações em descoberta automática de fórmulas, IA simbólica e otimização de representações matemáticas

2 comentários

carnoxen 14 일 전

Em termos de fórmula, então seria $eml(x, y) = e^x - ln(x)$.

Mas parece que isso só vai realmente brilhar quando surgir um processador capaz de calcular $e^x$ ou $ln(x)$ de uma vez só.

GN⁺ 17 일 전

Comentários do Hacker News

Essa abordagem não é particularmente especial nem a de menor custo computacional
Por exemplo, se definirmos f(x, y) = 1/(x - y), isso também se torna um operador universal
Se tomarmos x#y = 1/(x - y), então x#0 = 1/x nos dá o recíproco, e (x#y)#0 = x - y permite expressar a subtração
É um problema comum mostrar que, só com recíproco e subtração, dá para construir as quatro operações básicas
Há uma prova curta relacionada nesta nota
- A parte interessante é que essa abordagem inclui até as constantes e, π, i. Ela cobre adição, multiplicação, exponenciação, logaritmo e até funções transcendentais
- O método f(x, y) que você mencionou exige um limite (limit) para expressar certos conceitos, enquanto a abordagem EML tem uma estrutura de árvore de computação para representar modelos de sistema
- Boa descoberta. Está citando um artigo de 1935 (artigo da PNAS), e a discussão relacionada continua também no MathOverflow
- Então fico curioso se também dá para derivar funções trigonométricas com essa representação única
- Mas, desse jeito, parece difícil lidar com constantes padrão ou expressões em forma fechada como e, π, exp e log
Fiquei feliz em ver uma ideia no estilo FRACTRAN chegar à página principal
Isso me lembra o método de codificar uma pilha de 1 bit em binário.
Dar push em 0 dobra o número; dar push em 1 dobra e depois soma 1. Pop equivale a dividir por 2
Eu uso uma linguagem concatenativa chamada Rejoice, baseada em ideias assim. Os dados são representados como multisets compostos por multiplicação
Wiki do Rejoice
- Não seria preciso rastrear o tamanho da pilha para saber se há zeros à esquerda?
- A explicação até aqui parece só uma reformulação do princípio básico dos números binários
Isso é um ótimo benchmark para testar desempenho de LLMs
```
paper: https://arxiv.org/pdf/2603.21852
Express "2x + y" as an EML combination
```
O Opus(pago) falhou dizendo que “2” era circular, mas como o ChatGPT já tinha feito, ele teve sucesso
ChatGPT(grátis) acertou de primeira, Grok estimou a profundidade, Gemini acertou, Deepseek não conseguiu carregar o PDF, Kimi parou no meio, e GLM foi razoável
- Hoje aprendi que, se você provoca (taunt) uma LLM, ela vai melhor. Deve ter espírito competitivo
- Copiei só o resumo no DeepSeek e ele produziu um resultado. Tirar pontos porque ele não conhece o PDF é injusto
- Se você gosta desse tipo de experimento, recomendo contribuir com o Terminal Bench Science
- Tentei mudar o prompt assim:
```
eml(x,y)=exp(x)−ln(y)
Express sin(x)/x usando EML e a constante 1
```
- O modo instant do meta.ai também acertou de primeira
```
2x + y = \operatorname{eml}\Big(1,\; \operatorname{eml}\big(\operatorname{eml}(1,\; \operatorname{eml}(\operatorname{eml}(1,\; \operatorname{eml}(\operatorname{eml}(L_2 + L_x, 1), 1) \cdot \operatorname{eml}(y,1)),1)\big),1\big)\Big)
```
  O Gemini confundiu EML com “elementary mathematical layers”
Visualização das 36 diferentes funções EML de 2 etapas de uma variável
As 18 primeiras produzem saídas reais, e as demais incluem valores complexos no meio do processo
Link da imagem
- Seria interessante classificar todas as funções em árvore binária de profundidade fixa desse jeito e codificar as árvores em binário
  As antigas tabelas de funções dos livros de matemática talvez pudessem ser reinterpretadas como uma simples consulta de hash
A frase “é possível computar tudo apenas com EML e o número 1” me lembra o combinador Iota
Parece a ideia de alcançar completude de Turing com um sistema formal mínimo
O link atual do artigo ainda é a v1 e está sem figuras. Deveria ser trocado para a v2
Ainda estou lendo, mas, se for verdade, talvez seja uma grande descoberta em anos
Se der para ajustar dados ou funções de onda com árvores EML em vez de splines ou polinômios,
então funções multivariadas também poderiam ser aprendidas com gradient descent e convertidas em árvores de aproximação EML
Talvez até fosse possível treinar impondo as condições derivadas da equação de Schrödinger
Parece bom demais para ser verdade, mas esse tipo de coisa já aconteceu antes
- Pela minha experiência de um ano pesquisando essa área, EML é poderoso, mas o problema é a explosão da expressão
  Para expressar uma única multiplicação, é preciso uma árvore de profundidade 8 com pelo menos 41 folhas
  Existe um trade-off entre a elegância de um conjunto mínimo de operações e o comprimento da expressão
  Tenho trabalhado numa abordagem que combina redes neurais espectrais e symbolic regression com teoria de operads e teoria das categorias
- É o mesmo motivo pelo qual não implementamos toda lógica booleana só com NAND. É por eficiência computacional
  Polinômios são rápidos de calcular para o nível de expressividade que oferecem
- O artigo é interessante e elegante, mas não é uma alternativa competitiva para regressão ou otimização
  O que você descreveu é parecido com a symbolic regression existente. Já é uma área madura
- A base em EML é legal, mas até funções simples (como +) já são difíceis de expressar
  Ainda assim, é uma descoberta muito interessante
- É um truque bacana, mas chamá-lo de descoberta importante parece exagero
Acho que a derivação de -x está errada
Pela execução na máquina de pilha, eml(z, eml(x,1)) tem a forma e^z - x,
e, para isso virar -x, seria preciso que e^z = 0. Mas esse z complexo não existe
Se expandir z de fato, aparece um problema do tipo ln(0). x^-1 é parecido
Se você assumir ln(0)=∞ e x/∞=0, então ele funciona de modo “plausível”
- O autor menciona notação RPN, mas as fórmulas são fornecidas só como imagem, o que é incômodo
  Pela ordem de cálculo, fica ln(1)=0 → e-ln(0)=+∞ → e-ln(+∞)=-∞
- O próprio artigo reconhece esse problema. Julguei rápido demais
Isso me faz pensar em algumas ideias interessantes
1. Se adicionarmos valor absoluto como sqrt(x*x), então também dá para derivar min, max e signum
2. Se f(x) e f⁻¹(x) forem funções bijetivas expressáveis com eml(), então, usando eml(f(x), f(y)) e f⁻¹(1), dá para criar outra base universal
3. Em vez de logaritmo natural, talvez uma base do tipo 2^x - log₂(y) seja computacionalmente mais eficiente. Isso lembra Elias omega coding
4. Se existisse um algoritmo para calcular derivadas de árvores eml(), talvez desse para provar de forma clara que certas funções não admitem antiderivada simbólica
5. A extensão ao domínio complexo também pode se conectar com lógica fuzzy de valores de verdade complexos. Talvez haja potencial para unificar a lógica de Lukasiewicz e a lógica multiplicativa
Por diversão, ontem criei o projeto emlvm
A parte sobre “ser possível reconstruir funções em forma fechada com árvores EML de profundidade até 4” é realmente muito legal
Eu sempre me perguntei se algo assim seria possível