1 pontos por carnoxen 2023-08-23 | Ainda não há comentários. | Compartilhar no WhatsApp

A IA opera em duas etapas: treinamento, que ajusta parâmetros com os dados fornecidos, e inferência, que resolve problemas com base nos parâmetros gerados. Até então, a IA era usada praticamente só entre pesquisadores, mas com a chegada do ChatGPT agora até o público em geral já está familiarizado com a tecnologia.

O desempenho dessa IA é fortemente influenciado por hardwares como GPU e NPU. Entre as empresas que produzem esse tipo de hardware, a NVIDIA detém uma fatia esmagadora do mercado, especialmente no treinamento. Já na inferência, por ser uma área menos complexa que o treinamento, várias empresas estão surgindo para competir com a NVIDIA. Nesse cenário, a Rebellions lançou seu desafio.

A empresa, que valoriza talentos, foi fundada por quatro diretores com mestrado ou doutorado na área de IA. No início, projetava chips necessários para instituições financeiras e, depois, ampliou seu escopo até chegar ao projeto de chips de inferência para IA.

Os produtos criados pela empresa são os seguintes.

O ION, especializado no setor financeiro, foi o primeiro produto da empresa, algo possível graças ao CEO Park Seong-hyeon e ao CTO Oh Jin-wook, ambos com experiência em projeto de chips. Ele pode lidar ao mesmo tempo com inteiros e ponto flutuante, permite manipular livremente a ISA e oferece suporte a vários algoritmos relacionados a deep learning. Além disso, afirma-se que ele tem alta eficiência energética (TOPS/Watt) e possibilita a construção de servidores com latência ultrabaixa (Ultra Low Latency, ULL).

O ATOM, lançado em seguida, é um chip projetado para inferência de IA. Para oferecer inferência mais rápida, adicionou recursos que o ION não tinha, como memória e comunicação entre os núcleos dentro do chip (network on chip, NoC). Graças a isso, obteve vantagem significativa sobre a Qualcomm no desempenho do modelo BERT no MLPerf.

A empresa criou não apenas o hardware, mas também um compilador para chips de IA. Ele foi baseado no Apache TVM, que é open source, e incluiu recursos pensados para ambientes de nuvem.

Parece que a empresa definiu como clientes as operadoras de grandes data centers. Diferentemente de notebooks e smartphones, que têm muitas restrições, os data centers podem acomodar qualquer tipo de workload e permitem customizar sistemas com facilidade. Além disso, como os mercados de data centers e de inferência de IA estão crescendo, a empresa deve mirar esse segmento com ainda mais força.

Ainda não há notícias de contratos para o ION, mas o ATOM vem sendo fornecido continuamente à KT desde 2023. Além disso, como recebeu investimentos enormes da Kakao e do governo, dá a sensação de que poderá avançar ainda mais no futuro.

Ainda não há comentários.

Ainda não há comentários.