- Um conjunto de dados de treinamento em larga escala que inclui cerca de 740 milhões de pares imagem-texto e muitos outros atributos
- Coleta imagens presentes em documentos HTML e o atributo
alt (texto exibido quando a imagem não pode ser renderizada na tela no HTML)
- Espera-se que seja usado para treinar modelos de base em larga escala, complementando outros conjuntos de dados semelhantes
- O “COYO” já foi aplicado no desenvolvimento do modelo ultragrande de geração de imagens por IA
RQ-Transformer, divulgado anteriormente, e da artista de IA Karlo
- Detalhes do processo de coleta de dados poderão ser vistos em um artigo a ser publicado futuramente
1 comentários
COYO-700M: Dataset de pares imagem-texto
Kakao Brain divulga globalmente o ‘COYO’, um dataset de altíssimo nível