1 pontos por tantara 26 일 전 | Ainda não há comentários. | Compartilhar no WhatsApp

Este é um explorador de personas coreanas que utiliza o dataset Nemotron-Personas-Korea, publicado pela NVIDIA.

Este dataset é um conjunto de dados sintéticos em escala de 1 milhão de coreanos, incluindo idade, profissão, região, relações familiares e outros dados. O método de criação do dataset e as informações estatísticas são explicados em detalhes em https://pt.news.hada.io/topic?id=28919.

As principais funcionalidades do explorador de personas são as seguintes.

  1. É possível buscar personas ou encontrar personas semelhantes. A similaridade é comparada usando o modelo de embeddings da Qwen.

  2. É possível verificar a distribuição populacional das personas em um mapa. Isso utiliza as informações de localização presentes no dataset.

  3. É possível conversar com as personas. Elas conseguem responder a perguntas bem simples.

Foi extraído um embedding de 1024 dimensões para todo o dataset com o modelo de embeddings Qwen 0.6 e isso foi transformado em um dataset no Hugging Face. Como a coluna *_persona tem a característica de repetir nomes com frequência, os valores de embedding podem ter viés em relação aos nomes.

Ainda não há comentários.

Ainda não há comentários.