Explorador de personas coreanas baseado no Nemotron-Personas-Korea
(microworld.dev)Este é um explorador de personas coreanas que utiliza o dataset Nemotron-Personas-Korea, publicado pela NVIDIA.
Este dataset é um conjunto de dados sintéticos em escala de 1 milhão de coreanos, incluindo idade, profissão, região, relações familiares e outros dados. O método de criação do dataset e as informações estatísticas são explicados em detalhes em https://pt.news.hada.io/topic?id=28919.
As principais funcionalidades do explorador de personas são as seguintes.
-
É possível buscar personas ou encontrar personas semelhantes. A similaridade é comparada usando o modelo de embeddings da Qwen.
-
É possível verificar a distribuição populacional das personas em um mapa. Isso utiliza as informações de localização presentes no dataset.
-
É possível conversar com as personas. Elas conseguem responder a perguntas bem simples.
Foi extraído um embedding de 1024 dimensões para todo o dataset com o modelo de embeddings Qwen 0.6 e isso foi transformado em um dataset no Hugging Face. Como a coluna *_persona tem a característica de repetir nomes com frequência, os valores de embedding podem ter viés em relação aos nomes.
- Hugging Face Nemotron-Personas-Korea-Qwen3-0.6B-embeddings
Ainda não há comentários.