COYO-700M - conjunto de dados com 740 milhões de pares imagem-texto divulgado pela Kakao Brain

xguru · 2022-09-01T09:15:05+09:00

Um conjunto de dados de treinamento em larga escala que inclui cerca de 740 milhões de pares imagem-texto e muitos outros atributos Coleta imagens presentes em documentos HTML e o atributo alt (texto exibido quando a imagem não pode ser renderizada na tela no HTML) Espera-se que seja usado para treinar modelos de base em larga escala, complementando outros conjuntos de dados semelhantes O “COYO” já foi aplicado no desenvolvimento do modelo ultragrande de geração de imagens por IA RQ-Transformer, divulgado anteriormente, e da artista de IA Karlo Detalhes do processo de coleta de dados poderão ser vistos em um artigo a ser publicado futuramente

(github.com/kakaobrain)

8 pontos por xguru 2022-09-01 | 1 comentários | Compartilhar no WhatsApp

Um conjunto de dados de treinamento em larga escala que inclui cerca de 740 milhões de pares imagem-texto e muitos outros atributos
Coleta imagens presentes em documentos HTML e o atributo alt (texto exibido quando a imagem não pode ser renderizada na tela no HTML)
Espera-se que seja usado para treinar modelos de base em larga escala, complementando outros conjuntos de dados semelhantes
O “COYO” já foi aplicado no desenvolvimento do modelo ultragrande de geração de imagens por IA RQ-Transformer, divulgado anteriormente, e da artista de IA Karlo
Detalhes do processo de coleta de dados poderão ser vistos em um artigo a ser publicado futuramente

1 comentários

xguru 2022-09-01

COYO-700M: Dataset de pares imagem-texto
Kakao Brain divulga globalmente o ‘COYO’, um dataset de altíssimo nível

COYO-700M - conjunto de dados com 740 milhões de pares imagem-texto divulgado pela Kakao Brain

Leituras relacionadas

1 comentários