- Conteúdo apresentado por Ahmad Khan, head de estratégia de AI/ML da Snowflake
Monetização por meio do uso de dados "não estruturados"
- Mais de 80% da maioria dos dados corporativos são "dados não estruturados", como documentos do Word, imagens e arquivos de áudio/vídeo
- No entanto, a maioria das empresas quase não utiliza essas informações, o que significa que usam menos de 20% dos dados disponíveis ao tomar decisões de negócio
- Colocar esses dados não estruturados ao lado de grandes modelos de linguagem e criar chatbots de forma eficaz pode ajudar a interpretar e analisar essa enorme quantidade de informação hoje pouco aproveitada
- O potencial para criar modelos ajustados a setores específicos dessas empresas é ilimitado
Privacidade e segurança
- Está crescendo entre as empresas a preocupação de que seus próprios dados possam ser usados para treinar modelos que poderão ser utilizados por outras companhias, incluindo concorrentes
- Como resultado, as empresas muitas vezes se contentam com produtos inferiores que oferecem melhor segurança, o que cria um mercado para produtos mais seguros
- Por exemplo, o Llama 2 não é o modelo de linguagem de grande porte com melhor desempenho, mas os clientes ainda assim o escolhem no lugar de modelos com menos controle, como o Chat GPT
- Como muitas empresas têm a singularidade de seus dados como vantagem, elas querem evitar situações em que esses dados sejam expostos na internet pública
Garantir vantagem competitiva com uma experiência de usuário excepcional
- Como uma startup pode competir contra a escala das grandes empresas?
- A sugestão é focar em criar uma experiência de usuário prazerosa, incluindo a construção de interfaces atraentes
- Essa foi a abordagem adotada pela Snowflake
- Em especial, como a maior parte de seus próprios serviços não consegue competir com provedores de nuvem como a Amazon Web Services, a empresa se concentrou em criar uma experiência de usuário superior que justificasse seu preço mais alto
Foco no vertical
- Outra forma de Davi vencer Golias é focar em setores específicos, como manufatura, finanças, saúde e entretenimento, em vez de aplicações de uso geral
- O conselho é: "entenda o que as empresas desse setor estão procurando e depois ofereça serviços que atendam a essas necessidades"
- Por exemplo, é provável que o Google desenvolva um grande modelo de linguagem para a área médica, mas também é provável que não aprofunde o tema de forma especializada, o que abre oportunidade para empresas menores construírem esse modelo
A demanda por atribuição de dados está crescendo cada vez mais
- Há potencial para novos modelos que rastreiem materiais protegidos por direitos autorais e remunerem os criadores originais, incentivando-os a desenvolver mais conteúdo
- Khan cita vários casos em que modelos open source não podem ser usados por razões legais e dá como exemplo um estúdio de cinema que não quer usar modelos open source para geração de imagens
- Esse estúdio paga licenciamento e custos para usar um modelo treinado com dados da Getty Images
- No futuro, o mercado para modelos semelhantes que usem conjuntos de dados com atribuição tende a crescer cada vez mais
Ainda não há comentários.