В области больших моделей ИИ интерес продолжает расти, страны активно занимаются разработкой.
В прошлом месяце в области ИИ произошла "война животных", вызванная Llama от Meta и Falcon от Исследовательского института технологических инноваций ОАЭ. Эти две большие языковые модели начали жестокую борьбу за первое место в рейтинге открытых LLM.
Llama пользуется большой популярностью среди разработчиков благодаря своей открытой природе. Японская компания NEC быстро разработала японскую версию ChatGPT на базе Llama. В то время как Falcon в мае выпустил 40B версию, заняв первое место в рейтингах, в сентябре он снова выпустил версию 180B и снова достиг более высокого рейтинга.
Интересно, что разработчиком Falcon является не технологическая компания, а исследовательская организация из Объединённых Арабских Эмиратов. Министр искусственного интеллекта ОАЭ затем был включён в список 100 самых влиятельных людей в области ИИ по версии журнала Time.
На данный момент область ИИ вступила в фазу активной конкуренции, многие страны и компании разрабатывают свои версии ChatGPT. Только в регионе Персидского залива Саудовская Аравия приобрела более 3000 чипов H100 для обучения LLM для местных университетов.
Ситуация с "битвой ста моделей" во многом напоминает всплеск интернет-предпринимательства, который произошел в прошлом. Причина этого кроется в статье, опубликованной Google в 2017 году о алгоритме Transformer, который стал основой для всех современных больших моделей.
Трансформер решил проблему эффективности нейронных сетей при обработке длинных текстов, позволяя ИИ понимать контекст. Он превратил большие модели из теоретической задачи в инженерную проблему, снизив порог входа.
С учетом того, что открытое сообщество становится все более активным, производительность различных моделей может стать схожей. В будущем конкурентное преимущество будет больше зависеть от экосистемы или чистой способности к рассуждению.
Тем не менее, высокая стоимость вычислительной мощности стала препятствием для развития отрасли. По оценкам, мировые технологические компании могут тратить до 200 миллиардов долларов США в год на инфраструктуру для крупных моделей, в то время как соответствующий доход составляет максимум 75 миллиардов долларов, что создает огромный разрыв.
На данный момент, кроме нескольких компаний, большинство AI-компаний еще не нашли надежные модели盈利. Даже такие гиганты отрасли, как Microsoft и Adobe, сталкиваются с проблемами ценового позиционирования своих AI-продуктов.
В будущем простые поставщики больших моделей могут столкнуться с большими压力. Настоящая ценность, возможно, больше проявляется в конкретных приложениях на основе ИИ, а не в самой модели.
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
Конкуренция между моделями в области ИИ усиливается: страны стремятся завоевать будущие позиции лидеров
В области больших моделей ИИ интерес продолжает расти, страны активно занимаются разработкой.
В прошлом месяце в области ИИ произошла "война животных", вызванная Llama от Meta и Falcon от Исследовательского института технологических инноваций ОАЭ. Эти две большие языковые модели начали жестокую борьбу за первое место в рейтинге открытых LLM.
Llama пользуется большой популярностью среди разработчиков благодаря своей открытой природе. Японская компания NEC быстро разработала японскую версию ChatGPT на базе Llama. В то время как Falcon в мае выпустил 40B версию, заняв первое место в рейтингах, в сентябре он снова выпустил версию 180B и снова достиг более высокого рейтинга.
Интересно, что разработчиком Falcon является не технологическая компания, а исследовательская организация из Объединённых Арабских Эмиратов. Министр искусственного интеллекта ОАЭ затем был включён в список 100 самых влиятельных людей в области ИИ по версии журнала Time.
На данный момент область ИИ вступила в фазу активной конкуренции, многие страны и компании разрабатывают свои версии ChatGPT. Только в регионе Персидского залива Саудовская Аравия приобрела более 3000 чипов H100 для обучения LLM для местных университетов.
Ситуация с "битвой ста моделей" во многом напоминает всплеск интернет-предпринимательства, который произошел в прошлом. Причина этого кроется в статье, опубликованной Google в 2017 году о алгоритме Transformer, который стал основой для всех современных больших моделей.
Трансформер решил проблему эффективности нейронных сетей при обработке длинных текстов, позволяя ИИ понимать контекст. Он превратил большие модели из теоретической задачи в инженерную проблему, снизив порог входа.
С учетом того, что открытое сообщество становится все более активным, производительность различных моделей может стать схожей. В будущем конкурентное преимущество будет больше зависеть от экосистемы или чистой способности к рассуждению.
Тем не менее, высокая стоимость вычислительной мощности стала препятствием для развития отрасли. По оценкам, мировые технологические компании могут тратить до 200 миллиардов долларов США в год на инфраструктуру для крупных моделей, в то время как соответствующий доход составляет максимум 75 миллиардов долларов, что создает огромный разрыв.
На данный момент, кроме нескольких компаний, большинство AI-компаний еще не нашли надежные модели盈利. Даже такие гиганты отрасли, как Microsoft и Adobe, сталкиваются с проблемами ценового позиционирования своих AI-продуктов.
В будущем простые поставщики больших моделей могут столкнуться с большими压力. Настоящая ценность, возможно, больше проявляется в конкретных приложениях на основе ИИ, а не в самой модели.