- Versão especializada em coreano do modelo GPT-3 criado pela Kakao Brain
→ Construído com base em 6 bilhões de parâmetros e dados em coreano de 200 bilhões de tokens
-
Executa todo tipo de tarefa de linguagem, como determinar se uma frase é positiva ou negativa, resumir textos longos em uma linha, inferir frases para prever conclusões e responder perguntas compreendendo o contexto
-
Após o coreano, há planos de abrir como código aberto modelos em inglês, japonês, vietnamita e malaio
-
Objetivo de garantir acessibilidade ao abrir em código aberto e contribuir para o avanço da tecnologia de TI no país e para a ativação da pesquisa
3 comentários
Site de demonstração: https://huggingface.co/spaces/akhaliq/kogpt
Ao inserir exatamente a frase abaixo, que já estava incluída ali como exemplo, a fila de espera levou cerca de 2 minutos e saiu este resultado. Parece que o tempo realmente usado no processamento foi de cerca de 16,9 segundos.
input:
“Pensar e agir como um humano, por meio de uma ‘inteligência’, algo que a humanidade até agora não conseguiu resolver”
output:
“Chegou a era em que, por meio de uma ‘inteligência’ que pensa e age como um humano, é preciso responder às inúmeras perguntas que a humanidade até agora não conseguiu resolver. c Pixabay Ao longo das últimas dezenas de milhares de anos, nós, seres humanos, para viver uma vida digna do ser humano, o mais importante que precisávamos resolver”
Muito legal
GPT-J-6B, Cedille e KoGPT têm todos 6 bilhões (6B) de parâmetros.
O GPT-3 já não é mais o único no mercado https://pt.news.hada.io/topic?id=5349
GPT-Neo: projeto para criar um modelo na escala do GPT-3 como open source/gratuito https://pt.news.hada.io/topic?id=3599
Cedille - modelo em francês na escala de 6B lançado como open source https://pt.news.hada.io/topic?id=5372