Coleção de leituras de artigos de NLP
- A coleção de leituras de artigos sobre processamento de linguagem natural (NLP) é composta por 22 itens.
- Esta coleção foi atualizada recentemente e é útil para entender as tendências mais recentes de pesquisa na área de NLP.
- NLP é uma tecnologia que permite aos computadores compreender e processar a linguagem humana, com diversas aplicações como tradução automática, análise de sentimentos e sistemas de perguntas e respostas.
Opinião do GN⁺
- Esta coleção é um material que permite ver de relance as pesquisas mais recentes na área de NLP e será muito útil para pesquisadores ou desenvolvedores interessados em NLP.
- NLP é uma das áreas da IA que evolui especialmente rápido, e esta coleção permite entrar em contato com as tendências mais recentes e ideias inovadoras.
- As tecnologias de processamento de linguagem natural estão profundamente integradas ao nosso dia a dia, e esta coleção oferece uma visão da direção de desenvolvimento dessa tecnologia e de suas possibilidades futuras.
1 comentários
Comentários do Hacker News
Levei um tempo para entender este artigo, porque ele se baseia nas técnicas do artigo “Deja Vu” e trata de métodos complexos que exploram esparsidade:
matmul, este slot do vetor terá um valor negativo antes da ReLU, então é possível não carregar aquela coluna da matriz e emitir 0”.Eu esperava encontrar, na conclusão do artigo, uma seção sobre como essa funcionalidade seria disponibilizada ao usuário, mas talvez essa discussão esteja fora do escopo.
Fico curioso sobre quanto do modelo pode deixar de ser carregado antes de começarmos a ver uma diferença real de desempenho.
Vale notar que os dispositivos da Apple têm muito pouca RAM em comparação com aparelhos semelhantes da concorrência.
Tenho entendimento limitado do assunto, mas fico curioso se essa técnica permitiria rodar LLMs offline em celulares.
Aprecio que os artigos recentes estejam falando em “LLM” em vez de “IA”.
É um pouco surpreendente que este artigo não mencione FlashAttention.
A Apple comprou uma empresa iraniana?
Por exemplo, dizem que o modelo OPT 6.7B apresenta 97% de esparsidade dentro das camadas FFN.
Espero que essa técnica seja integrada ao llama.cpp e ao candle.