La guerra de los cien modelos en el campo de la IA se intensifica, los países compiten por el dominio futuro.

robot
Generación de resúmenes en curso

La popularidad del campo de los grandes modelos de IA sigue en aumento, y los países están estableciendo posiciones.

El mes pasado, en el campo de la IA, se desató una "guerra animal" provocada por Llama de Meta y Falcon del Instituto de Innovación Tecnológica de los Emiratos Árabes Unidos. Estos dos grandes modelos de lenguaje compitieron ferozmente en el ranking de LLM de código abierto.

Llama es muy apreciado por los desarrolladores debido a su naturaleza de código abierto. La empresa japonesa NEC desarrolló rápidamente una versión en japonés de ChatGPT basada en Llama. Por otro lado, Falcon alcanzó la cima de la lista después de lanzar la versión de 40B en mayo, y en septiembre lanzó la versión de 180B logrando nuevamente un ranking más alto.

Es interesante que los desarrolladores de Falcon no sean una empresa tecnológica, sino una institución de investigación de los Emiratos Árabes Unidos. El Ministro de Inteligencia Artificial de los Emiratos Árabes Unidos fue posteriormente incluido en la lista de las 100 personas más influyentes en el campo de la IA de la revista Time.

El campo de la IA ha entrado en una etapa de competencia entre cientos de empresas, muchos países y empresas están desarrollando versiones locales de ChatGPT. Solo en la región del Golfo, Arabia Saudita ha adquirido más de 3000 chips H100 para universidades nacionales para el entrenamiento de LLM.

Esta situación de "la batalla de los cientos de modelos" es bastante similar al entusiasmo por el emprendimiento en Internet de aquellos años. La razón detrás de esto es el artículo sobre el algoritmo Transformer publicado por Google en 2017, que se ha convertido en la base de todos los grandes modelos actuales.

El Transformer resolvió el problema de eficiencia que tenían las redes neuronales al procesar textos largos, dotando a la IA de la capacidad de entender el contexto. Esto transformó los grandes modelos de un problema de investigación teórica a un problema de ingeniería, reduciendo la barrera de entrada.

A medida que la comunidad de código abierto se vuelve cada vez más activa, el rendimiento de los principales modelos podría converger. La ventaja competitiva en el futuro se manifestará más en la construcción de ecosistemas o en la pura capacidad de inferencia.

Sin embargo, el alto costo de la potencia de cálculo se ha convertido en un obstáculo para el desarrollo de la industria. Se estima que el gasto de las empresas tecnológicas a nivel mundial en infraestructura de modelos grandes podría alcanzar los 200 mil millones de dólares al año, mientras que los ingresos relacionados podrían ser de hasta 75 mil millones de dólares, lo que plantea una gran brecha.

Actualmente, a excepción de algunas pocas empresas, la mayoría de las empresas de IA aún no han encontrado un modelo de negocio confiable. Incluso los gigantes de la industria como Microsoft y Adobe enfrentan desafíos en la fijación de precios de productos de IA.

En el futuro, los proveedores de modelos grandes y simples pueden enfrentar una mayor presión. El verdadero valor puede reflejarse más en escenarios de aplicación específicos basados en IA, en lugar de en el modelo en sí.

Ver originales
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
  • Recompensa
  • 5
  • Compartir
Comentar
0/400
SchroedingerGasvip
· hace23h
El modelo grande nacional está claramente en modo de descanso.
Ver originalesResponder0
CrashHotlinevip
· hace23h
La pista se ha enrollado, ¿eh?
Ver originalesResponder0
FUDwatchervip
· hace23h
Ocupando la posición esperando la retirada de fondos
Ver originalesResponder0
ForumMiningMastervip
· hace23h
Una pila de tontos juguetes, nada más.
Ver originalesResponder0
UnluckyValidatorvip
· hace23h
Es una broma, ¿quién gana se lo come?
Ver originalesResponder0
  • Anclado
Opere con criptomonedas en cualquier momento y lugar
qrCode
Escanee para descargar la aplicación Gate
Comunidad
Español
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)