2 pontos por GN⁺ 2025-02-06 | 1 comentários | Compartilhar no WhatsApp
  • As principais empresas de IA e instituições de pesquisa da Europa anunciaram o projeto OpenEuroLLM para desenvolver em conjunto a próxima geração de grandes modelos de linguagem (LLMs) de código aberto
  • O objetivo é oferecer alto desempenho e suporte multilíngue, construindo modelos transparentes e em conformidade que possam ser usados em serviços comerciais e públicos
  • Como um modelo open source transparente e em conformidade regulatória, o desenvolvimento segue o arcabouço regulatório europeu para democratizar o acesso a tecnologias de IA de alta qualidade e ajudar empresas europeias a competir no mercado global
  • Obteve a certificação STEP (Strategic Technologies for Europe Platform) e, com financiamento do programa Europa Digital da União Europeia, começou oficialmente em 1º de fevereiro de 2025

Principais pontos do projeto

  • Nome do projeto: OpenEuroLLM
  • Objetivos
    • Fortalecer e ampliar a competitividade em IA e a soberania digital na Europa por meio de LLMs open source
    • Demonstrar a importância da transparência, da abertura e da participação da comunidade no ecossistema tecnológico europeu
    • Ser desenvolvido dentro do sólido arcabouço regulatório europeu, preservando os valores europeus e a excelência técnica
    • Permitir uso livre nos setores comercial e público, além de possibilitar fine-tuning personalizado por indústria
    • Reforçar o ambiente multilíngue levando em conta a diversidade linguística e cultural da Europa, permitindo que empresas europeias desenvolvam produtos e serviços de alta qualidade na era da IA
  • Escopo de atuação
    • Com base em resultados já existentes, como repositórios de dados de alta qualidade e LLMs piloto, desenvolver conjuntamente novos modelos e softwares
    • Colaborar com comunidades open source e especialistas do setor, como LAION, open-sci e OpenML
    • Buscar uma base acessível a qualquer pessoa para uso e melhoria, por meio de desenvolvimento e avaliação transparentes dos modelos

Composição dos parceiros

  • Universidades e instituições de pesquisa
    • Charles University (República Tcheca, coordenadora), ALT-EDIC (França), Eindhoven University of Technology (Países Baixos), ELLIS Institute Tübingen (Alemanha), Fraunhofer IAIS (Alemanha), entre outras, com participação total de 11 instituições
    • Com forte capacidade de pesquisa, serão responsáveis por dados em larga escala, desenvolvimento de algoritmos e validação
  • Empresas
    • AMD Silo AI (Finlândia, co-líder), Aleph Alpha Research (Alemanha), ellamind (Alemanha), LightOn (França), Prompsit Language Engineering (Espanha), entre outras, com participação total de 5 empresas
    • Serão responsáveis por otimização de modelos em ambientes industriais, know-how de comercialização e estudos de casos de aplicação nos negócios
  • Centros EuroHPC
    • Barcelona Supercomputing Center (Espanha), Cineca Interuniversity Consortium (Itália), CSC - IT Center for Science (Finlândia), SURF (Países Baixos)
    • Serão responsáveis por apoiar treinamento e experimentação por meio do fornecimento de infraestrutura de computação de altíssimo desempenho

Valor do projeto e efeitos esperados

  • Modelo open source transparente e em conformidade
    • Segue as rígidas regulações e o sistema de valores da Europa, tornando públicos grandes modelos de linguagem de alto desempenho para que todos possam utilizá-los
    • Contribui para a competitividade global e a inovação em serviços de órgãos públicos e empresas
  • Suporte a multilinguismo e diversidade cultural
    • Reflete no modelo as diversas línguas e características culturais da Europa, criando uma base para ajudar a implementar serviços de alta qualidade
    • Cria um ambiente em que empresas europeias possam oferecer produtos estáveis e abrangentes com tecnologia própria
  • Fortalecimento do ecossistema de IA e da colaboração
    • Instituições de pesquisa, empresas e centros europeus de supercomputação combinam conjuntamente infraestrutura e expertise
    • Espera-se garantir melhoria contínua e escalabilidade por meio da comunidade open source e de parcerias estratégicas

1 comentários

 
GN⁺ 2025-02-06
Opiniões no Hacker News
  • Há opiniões céticas sobre um projeto com a participação de várias instituições. Existe a preocupação de que, embora haja muitos participantes, a colaboração será difícil porque cada um tem prioridades diferentes. Com base em experiências passadas, há quem ache que eles acabarão se concentrando em pesquisas individuais em vez de colaborar

  • Há a opinião de que, embora seja difícil para projetos europeus de IA competir com grandes laboratórios de pesquisa, isso pode ser uma oportunidade para impulsionar a IA por meio de modelos open source. Pode ser difícil para a Europa reduzir a distância em relação aos EUA e à China, mas isso pode servir como um catalisador para aumentar sua competitividade

  • Há opiniões de que o orçamento destinado ao projeto não é suficiente. Argumenta-se que o financiamento necessário para projetos europeus de IA deveria ser muito maior

  • Há a opinião de que o projeto oferecerá modelos de IA transparentes e em conformidade com as regulamentações, mas que, em termos de desempenho, ficará aquém das expectativas

  • Há a opinião de que os principais laboratórios e empresas de IA da Europa não participam do projeto porque a probabilidade de fracasso é alta

  • Há opiniões que destacam a importância do projeto e defendem que é essencial que a Europa construa uma infraestrutura de IA independente. Existe a expectativa de que o Open LLM elevará o padrão de sucesso de longo prazo da IA

  • Há a opinião de que o projeto já conta com bons dados e modelos existentes, e que também se podem esperar resultados comerciais. Empresas como Red Hat, Volvo e SAAB estão participando

  • Há a opinião de que as regulamentações europeias de privacidade, na prática, não estão fazendo grande diferença. Existe a expectativa de que a Europa resolva esse problema em breve