Como você mencionou, consultar apenas com o decomposed term já é suficiente. Como isso passou a existir, term era uma condição desnecessária, mas acho que não considerei isso. Graças a você, corrigi. Obrigado!

 

> Um usuário mencionou: “O contraste com laranja brilhante é vantajoso para pessoas com baixa visão.”
> Outro usuário rebateu: “Um design que depende de cores é desfavorável para usuários daltônicos.”

kkkk

 

As máquinas criam código para as máquinas.
O castelo de areia que os humanos construíram sobre a linguagem de máquina está fadado a desmoronar no fim.
...também dá para falar isso, né kkk

 

O link original era para a calculadora, mas achei que o ponto principal estava mais no que o autor escreveu no Hacker News do que na funcionalidade da calculadora em si, então mudei o link para o lado do HN.

Eu também quase não fazia projetos pessoais além da programação do trabalho, mas por causa da IA tenho codado bastante em projetos paralelos.
Ainda nem pensei se vou chegar a publicar algo externamente, mas conforme vou mexendo nas coisas, acaba batendo aquela vontade.

Vendo que realmente muitos projetos estão sendo postados no Show do GeekNews, acho que todo mundo está meio parecido.
Claro que, como ficou fácil demais, às vezes dá uma pena ver coisas sendo compartilhadas ainda com um pouco de falta de acabamento final.

 

Como é 30B A3B, não é tão pesado assim.
É preciso garantir espaço para 30B, mas, uma vez que esse espaço esteja disponível, os parâmetros ativos são 3B, então a velocidade é alta.

Por isso, acho que também vi um método de otimização que consiste em carregar na VRAM apenas as camadas mais usadas.

 

Não acho que o kunggom seja um desenvolvedor sem conhecimento de base a ponto de não conseguir entender nem a analogia com quadro de avisos que eu mencionei.

Acho que a diferença de opinião aqui vem, antes de tudo, da percepção sobre usuários que fazem abuso, então vou falar pela última vez sobre isso.

O que eu esperava era busca semântica.
Busca semântica não é um tema nada fora da realidade no atual boom de IA, e acredito que você saiba que mesmo uma pessoa sozinha consegue implementar isso com tranquilidade.

Desde o início, quando clicamos em um título, não é como se fizéssemos isso entendendo o contexto de quem escreveu o texto, mas estou dizendo que, mesmo que não seja um serviço com tráfego enorme ou que precise gerar receita, isso ainda é algo perfeitamente viável de implementar.

E eu estou falando apenas do título agora.
> Segundo o texto original, esse projeto ~

Estou falando da imagem que imaginei ao ver o título, então essa parte não é necessária na nossa conversa agora.

> A situação da pessoa que escreveu o texto agora
Acho que já entendi como o kunggom vê a pessoa que escreveu o texto. Parece que você a enxerga como um desenvolvedor iniciante, alguém que precisa ser compreendido independentemente do que escreva.

Como eu disse ontem, se a pessoa não tivesse sido marcada, eu também concordaria com isso, mas a partir do momento em que manipulou recomendações do próprio texto, essa discussão perde o sentido.

> E se você realmente acha que é um problema uma pessoa flagrada por abuso voltar a escrever no dia seguinte

Foi isso que você disse acima.
Se mesmo depois de ser marcada a pessoa tem liberdade para escrever, também existe liberdade para criticá-la por isso.
Como você mesmo disse, se acha problemático falar de forma um pouco mais rigorosa nos comentários com alguém que foi marcado, em vez de apontar isso nos comentários, sugiro que leve essa questão à moderação.

 

As especificações da Instinct são HBM4 de 432 GB e largura de banda de 19,6 Tb/s, mas também fico com a impressão de que a capacidade de cache parece grande em relação à capacidade total. Se quiser saber outras especificações (rede etc.), posso informar.

 

Tem sim. Mas, na maioria dos casos, em vez de construir tudo do zero a partir de um artigo, o pessoal acaba seguindo implementações de referência open source.
Hoje em dia, quando sai um paper quente na área de IA, também surgem vários POCs de uma vez, mas, na prática, em produção, por causa de dados/infra/tuning, muitas vezes “até roda, mas não entrega o sabor esperado”.
Por isso, ultimamente, dá a sensação de que está todo mundo migrando para stacks empacotadas, como vLLM e Ollama.

 

Li com bastante interesse. No começo pensei: será que é só um texto dizendo que colocaram um índice? Mas foi legal ver que vocês não pararam nisso, tentaram vários métodos diferentes e compartilharam o processo. No futuro, como você mencionou, seria interessante testar uma trie, ou até melhorar dando um peso maior para termos em tendência que tiveram muitas buscas recentes, por exemplo!

Uma coisa que me deixou curioso é que vocês consultavam tanto term quanto decomposed term com condição or, mas fiquei pensando se não bastaria consultar só decomposed term, já que ele seria um superconjunto. Mesmo que a query seja “neng”, ela seria decomposta como “nieong”, então imagino que encontraria “Naver”. E, no caso de o term real ser “neng”, também deveria ser encontrado da mesma forma.

 

Parece que você também costumava se promover bastante em galerias de outros sites, como em Yugnyong-ui Sidae e Web Samguk Mussangjeon.
Vendo a postura de apresentar trabalhos inacabados só para experimentar a reação e depois abandonar facilmente o projeto, fico pensando no que isso é tão diferente deste post... por que aplicar um padrão tão rígido aos outros?

Será que no DC pode fazer o que quiser porque é um lugar onde crianças brincam, mas no GeekNews, por ser um lugar de que você gosta, não consegue tolerar que outra pessoa o "suje"?

Não estou tentando fazer um argumento muito lógico, só estou comentando porque achei curioso esse dois pesos e duas medidas, então qualquer resposta sua contra isso deve estar certa. Força aí no abuso.

 

Mas, no mundo dos negócios, já existiam casos de ler um artigo e implementar diretamente para usar..?

 

Peço desculpas em relação a este texto e ao texto anterior.
Foi um erro meu, além de uma atitude tola, ter dado upvote usando 2 contas que eu não usava.

Como era um projeto no qual eu vinha me dedicando há muito tempo, agi de forma errada na esperança de que ele chamasse mais atenção das pessoas.
Mas, mesmo que eu tivesse esse motivo, isso não justifica a violação das regras.
Por causa dos upvotes que dei de forma irresponsável, o texto de alguém provavelmente teve que perder posição, e isso deve ter prejudicado a ordem do site.

Além disso, acho que publicar outro texto novo logo no dia seguinte de ter sido marcado como flagged pode muito bem ter dado margem a mal-entendidos.
Sendo sincero, como não havia nenhuma restrição específica de uso do site, pensei se talvez fosse permitido publicar de novo imediatamente. Isso foi falta de reflexão da minha parte.
Agora, pensando melhor, independentemente de haver punição ou não, eu deveria ter me contido.
Tentando pensar pelo lado oposto, se alguém tivesse feito exatamente a mesma coisa em um espaço de que eu gosto, eu também não veria isso com bons olhos.

Desde que comecei a desenvolver, sempre pratiquei a ideia de que "compartilhar" era algo incondicionalmente bom.
Mas, com esse episódio, percebi que existem espaços certos para compartilhar e momentos certos para fazê-lo.
Também senti que, se eu entrei recentemente em um espaço pelo qual outras pessoas têm carinho e interesse, o certo é, antes de tudo, respeitar os outros ao máximo.
Por isso, eu deveria ter lido primeiro as regras de uso e observado o clima do site, evitando qualquer comportamento que fosse contra isso.

Reconheço meu erro e apresento esta explicação, ainda que dessa forma.
Da próxima vez, vou procurar usar o site de maneira mais madura.

 

Eu, na verdade, não entendo. Você está vendo isso como se tivesse sido postado para criticar de forma organizada e em grupo? A sua própria alegação é que parece estar tratando de forma negativa as opiniões que cada indivíduo pode expressar. Daqui para frente, espero que você também olhe com a mesma cordialidade para textos no nível de um diário de desenvolvimento (defini uma meta para melhorar o desenho de estrela com printf e usei um for para melhorar!).

 

Uau. Então a Wikipedia também estava em crise.
Aqui pelo menos ainda tem alguma escala, mas o resto vai todo morrer mesmo

 

Eu considero que o ato de condenar em grupo — ou de dar essa impressão — textos que têm relação suficiente com o tema da comunidade e não são AI slop, dizendo algo como “este texto é abaixo do nível adequado para a nossa comunidade”, talvez seja ainda mais prejudicial ao crescimento e à manutenção da comunidade do que manipulação de votos. Isso porque pode fazer com que a imagem externa dessa comunidade pareça excludente e, por causa disso, atrapalhar bastante a entrada de potenciais novos usuários.

Claro, isso não quer dizer que não se deva fazer críticas. Mas, no mínimo, acho esse clima um pouco estranho. Em comum, havia apenas a decepção de que o conteúdo não era aquilo que cada um esperava; análises e feedbacks que parecessem construtivos foram minoria.

E, se vocês realmente acham problemático que uma pessoa flagrada abusando do sistema volte a postar no dia seguinte, que tal aproveitar esta oportunidade para sugerir formalmente à moderação a inclusão de uma regra relacionada a isso? Pelo que sei, já existe algum nível de sanção, mas parece que vocês consideram isso insuficiente.

 

Você poderia explicar um pouco melhor a parte de que isso seria “algo que não combina muito com a situação de quem escreveu o texto”?
Pelo texto original, está explicitado que o projeto em questão é “um projeto pessoal, e não um serviço com tráfego enorme ou que precise gerar receita”. Portanto, se houvesse algum tipo de otimização mais grandiosa, seria possível supor que isso viria apenas de curiosidade pessoal ou algo do tipo, e não por uma razão prática. Assim, não me parece estranho que esse nível de esforço técnico não tenha sido empregado, e o que eu não consigo entender é por que, entre algumas pessoas, a reação foi tão fortemente negativa. Até porque os números citados no título não entram em contradição com o conteúdo do texto.

 

Quais são as vantagens em relação ao ollama?

 

> Não é um pouco estranho, por si só, esperar algum tipo de otimização grandiosa em vez de se ater ao básico ali?

As pessoas enxergam até onde conhecem.
Para facilitar o entendimento, estou pensando agora no exemplo de criar um fórum.

Criar um fórum foi algo muito recomendado para desenvolvedores iniciantes como primeiro portfólio.

Pensando de forma simples, é fácil.
Você publica um post e, se ele aparecer na lista, acabou. Se for feito de forma realmente simples, talvez nem precise de um banco de dados no backend.

Mas as pessoas enxergam até onde conhecem.
Se você for levar um fórum a sério, começa pelo banco de dados e vai para função de comentários, login, e, evoluindo o login, autenticação OAuth ou JWT; mesmo numa função simples de escrever posts, entram anexos de imagem e vídeo, suporte a formatação de texto e segurança, começando por XSS.

Mesmo com o mesmo texto, a imagem que cada leitor forma pode variar bastante de acordo com o conhecimento prévio que ele tem.

Eu entendi que tipo de autocompletar o kunggom imaginou ao ver o título.

Mas cada leitor viveu uma vida diferente e, no fim, as funcionalidades que imaginaram provavelmente serão bem diferentes entre si.

Também entendo com que intenção você escreveu o comentário.
Eu também concordo com essa opinião, mas acredito que você sabe que isso não combina muito com a situação da pessoa que escreveu o texto agora.

 

Realmente não entendo o que haveria de tão grandioso nisso.
Não estamos falando de 1 milhão ou 10 milhões de registros, e o próprio título já deixa claro que a escala é de pouco mais de 100 mil. Nesse contexto, não parece meio estranho esperar algum tipo de otimização mirabolante em vez de simplesmente fazer bem o básico? Fico curioso para saber o que exatamente estavam esperando de tão grandioso.
Não sei se um texto mostrando, passo a passo, como ajustar o básico com cuidado, partindo de um estado em que o banco de dados não estava devidamente otimizado, deveria ser tratado como se fosse puro clickbait. Na minha opinião, esse tipo de clima excludente de que "se não for a melhor coisa do mundo, então é errado até postar aqui" é prejudicial.

 
geekygeek 2026-01-20 | comentário pai | em: Lançado o modelo GLM-4.7-Flash (huggingface.co)

VRAM de 24 GB...? Ou, se for um Mac, acho que 32 GB de RAM seria o mínimo.