1 pontos por anima 4 시간 전 | 1 comentários | Compartilhar no WhatsApp

Olá. Sou Jeonghu, e enquanto aprendo programação estou experimentando diretamente runtimes de agentes de IA.

O SongRyeon Core é um pequeno experimento local-first de runtime de agente que trata separadamente os “julgamentos ditos pelo LLM” e os “fatos realmente verificados pelo código”.

Ultimamente, ao criar agentes baseados em LLM, senti que os seguintes problemas aparecem com frequência.

  • O conteúdo inferido pelo LLM é exibido como se fosse um fato do sistema
  • Fallbacks ou heurísticas produzidos pelo código se misturam como se fossem julgamentos do LLM
  • A quantidade de documentos lidos e quais execuções realmente aconteceram aparecem de forma diferente em cada tela
  • A resposta final fica desalinhada com o estado interno do runtime

Por isso, neste projeto as informações são tratadas em três grandes categorias.

  • Informação absoluta: valores que podem ser confirmados por código/trace/schema/tool result
  • Informação relativa: julgamento do LLM correspondente a uma única informação absoluta
  • Informação mista: julgamento do LLM baseado em vários source bundles

Por enquanto ainda é uma pequena versão de prática, mas estou experimentando uma estrutura como a seguinte.

  • node_0 memory supplier
  • node_1 router
  • L loop
  • node_3 reporter
  • node_4 verifier
  • verificação de regressão baseada em smoke-test
  • checagem de integridade do runtime terminal/final renderer

O objetivo, mais do que um “demo impressionante”, é criar um pequeno runtime que esconda o mínimo possível com base em quais evidências um agente de IA disse determinada coisa.

Ainda estou aprendendo a programar, então há muitas partes ainda brutas.
Agradecerei muito qualquer feedback sobre a estrutura, o README, os testes, a definição de termos e o design do runtime de agente.

GitHub:
https://github.com/Junghoo-developer/SongRyeon

1 comentários

 
anima 4 시간 전

Complementando.

No momento, o SongRyeon Core é mais um experimento de runtime focado em CLI local / smoke-test do que um serviço web.

O que dá para verificar imediatamente é o método de execução no README e:

  • python -m compileall songryeon_core main.py
  • python main.py smoke-test

É isso.

Em especial, os pontos sobre os quais eu gostaria de receber feedback são os seguintes.

  • se a distinção entre informação absoluta / informação relativa / informação mista faz sentido do ponto de vista do design
  • se a forma de separar o julgamento do LLM e os fatos verificados por código parece útil em um runtime de agente real
  • quais partes do README são difíceis de entender para quem está vendo isso pela primeira vez

Como ainda é um projeto em aprendizado, há muitas partes brutas. Fico grato se puderem apontar isso com tranquilidade.