A popularidade dos grandes modelos de IA continua a subir, com vários países a fazerem planos.
No mês passado, ocorreu uma "guerra animal" no campo da IA, provocada pelo Llama da Meta e pelo Falcon do Instituto de Inovação Tecnológica dos Emirados. Estes dois grandes modelos de linguagem competiram intensamente no ranking de LLMs de código aberto.
Llama é muito apreciado pelos desenvolvedores devido à sua natureza de código aberto. A empresa japonesa NEC desenvolveu rapidamente a versão em japonês do ChatGPT com base no Llama. Por outro lado, o Falcon alcançou o primeiro lugar no ranking após o lançamento da versão 40B em maio, e em setembro lançou a versão 180B, obtendo novamente uma classificação ainda mais alta.
Curiosamente, os desenvolvedores do Falcon não são uma empresa de tecnologia, mas sim uma instituição de pesquisa dos Emirados Árabes Unidos. O ministro da inteligência artificial dos Emirados Árabes Unidos foi posteriormente incluído na lista das 100 pessoas mais influentes na área de IA da revista Time.
Atualmente, o campo da IA entrou numa fase de intensa competição, com muitos países e empresas a desenvolverem versões locais do ChatGPT. Apenas na região do Golfo, a Arábia Saudita adquiriu mais de 3000 chips H100 para universidades locais, para o treinamento de LLM.
Esta situação de "batalha de grandes modelos" é bastante semelhante à onda de empreendedorismo na internet de anos atrás. A razão por trás disso está no artigo sobre o algoritmo Transformer publicado pelo Google em 2017, que se tornou a base de todos os grandes modelos atuais.
O Transformer resolveu o problema de eficiência das redes neurais ao processar textos longos, permitindo que a IA adquirisse a capacidade de compreender o contexto. Isso transformou grandes modelos de uma questão teórica em um problema de engenharia, reduzindo a barreira de entrada.
À medida que a comunidade de código aberto se torna cada vez mais ativa, o desempenho dos principais modelos pode tornar-se homogêneo. A vantagem competitiva futura será mais evidente na construção de ecossistemas ou na capacidade pura de raciocínio.
No entanto, o alto custo do poder computacional tornou-se um obstáculo para o desenvolvimento da indústria. Estima-se que os gastos das empresas de tecnologia em todo o mundo com infraestrutura para grandes modelos possam chegar a 200 mil milhões de dólares por ano, mas a receita correspondente é de apenas 75 mil milhões de dólares, o que representa uma enorme lacuna.
Atualmente, à exceção de algumas empresas, a maioria das empresas de IA ainda não encontrou um modelo de lucro confiável. Mesmo os gigantes da indústria, como a Microsoft e a Adobe, enfrentam desafios na precificação de produtos de IA.
No futuro, os fornecedores de grandes modelos puramente poderão enfrentar uma pressão ainda maior. O verdadeiro valor pode estar mais refletido em cenários de aplicação específicos baseados em IA, e não no próprio modelo.
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
9 Curtidas
Recompensa
9
5
Compartilhar
Comentário
0/400
SchroedingerGas
· 18h atrás
Os grandes modelos nacionais estão claramente a relaxar.
Ver originalResponder0
CrashHotline
· 18h atrás
A pista está a ser enrolada.
Ver originalResponder0
FUDwatcher
· 18h atrás
Aproveitando a posição enquanto os fundos se retiram
A batalha das centena de modelos no campo da IA aquece, países competem pela liderança do futuro.
A popularidade dos grandes modelos de IA continua a subir, com vários países a fazerem planos.
No mês passado, ocorreu uma "guerra animal" no campo da IA, provocada pelo Llama da Meta e pelo Falcon do Instituto de Inovação Tecnológica dos Emirados. Estes dois grandes modelos de linguagem competiram intensamente no ranking de LLMs de código aberto.
Llama é muito apreciado pelos desenvolvedores devido à sua natureza de código aberto. A empresa japonesa NEC desenvolveu rapidamente a versão em japonês do ChatGPT com base no Llama. Por outro lado, o Falcon alcançou o primeiro lugar no ranking após o lançamento da versão 40B em maio, e em setembro lançou a versão 180B, obtendo novamente uma classificação ainda mais alta.
Curiosamente, os desenvolvedores do Falcon não são uma empresa de tecnologia, mas sim uma instituição de pesquisa dos Emirados Árabes Unidos. O ministro da inteligência artificial dos Emirados Árabes Unidos foi posteriormente incluído na lista das 100 pessoas mais influentes na área de IA da revista Time.
Atualmente, o campo da IA entrou numa fase de intensa competição, com muitos países e empresas a desenvolverem versões locais do ChatGPT. Apenas na região do Golfo, a Arábia Saudita adquiriu mais de 3000 chips H100 para universidades locais, para o treinamento de LLM.
Esta situação de "batalha de grandes modelos" é bastante semelhante à onda de empreendedorismo na internet de anos atrás. A razão por trás disso está no artigo sobre o algoritmo Transformer publicado pelo Google em 2017, que se tornou a base de todos os grandes modelos atuais.
O Transformer resolveu o problema de eficiência das redes neurais ao processar textos longos, permitindo que a IA adquirisse a capacidade de compreender o contexto. Isso transformou grandes modelos de uma questão teórica em um problema de engenharia, reduzindo a barreira de entrada.
À medida que a comunidade de código aberto se torna cada vez mais ativa, o desempenho dos principais modelos pode tornar-se homogêneo. A vantagem competitiva futura será mais evidente na construção de ecossistemas ou na capacidade pura de raciocínio.
No entanto, o alto custo do poder computacional tornou-se um obstáculo para o desenvolvimento da indústria. Estima-se que os gastos das empresas de tecnologia em todo o mundo com infraestrutura para grandes modelos possam chegar a 200 mil milhões de dólares por ano, mas a receita correspondente é de apenas 75 mil milhões de dólares, o que representa uma enorme lacuna.
Atualmente, à exceção de algumas empresas, a maioria das empresas de IA ainda não encontrou um modelo de lucro confiável. Mesmo os gigantes da indústria, como a Microsoft e a Adobe, enfrentam desafios na precificação de produtos de IA.
No futuro, os fornecedores de grandes modelos puramente poderão enfrentar uma pressão ainda maior. O verdadeiro valor pode estar mais refletido em cenários de aplicação específicos baseados em IA, e não no próprio modelo.