8 pontos por xguru 2022-09-01 | 1 comentários | Compartilhar no WhatsApp
  • Um conjunto de dados de treinamento em larga escala que inclui cerca de 740 milhões de pares imagem-texto e muitos outros atributos
  • Coleta imagens presentes em documentos HTML e o atributo alt (texto exibido quando a imagem não pode ser renderizada na tela no HTML)
  • Espera-se que seja usado para treinar modelos de base em larga escala, complementando outros conjuntos de dados semelhantes
  • O “COYO” já foi aplicado no desenvolvimento do modelo ultragrande de geração de imagens por IA RQ-Transformer, divulgado anteriormente, e da artista de IA Karlo
  • Detalhes do processo de coleta de dados poderão ser vistos em um artigo a ser publicado futuramente