Популярність у сфері великих моделей ШІ продовжує зростати, країни активно займаються цим напрямком
Минулого місяця в галузі штучного інтелекту відбулася "війна тварин", спровокована Llama від Meta та Falcon від Інституту технологічних інновацій ОАЕ. Ці дві великі мовні моделі змагалися на відкритому LLM-рейтингу.
Llama користується великою популярністю серед розробників завдяки своїй відкритій природі. Японська компанія NEC швидко розробила японську версію ChatGPT на базі Llama. Тим часом Falcon, після виходу 40B версії у травні, зайняв перше місце в рейтингах, а у вересні випустив 180B версію, знову досягнувши ще вищого рангу.
Цікаво, що розробники Falcon не є технологічною компанією, а є дослідницькою установою з Об'єднаних Арабських Еміратів. Міністр штучного інтелекту ОАЕ потім був обраний до списку 100 найвпливовіших людей у сфері ШІ журналу Time.
Сьогодні сфера штучного інтелекту вступила в етап активної конкуренції, багато країн і компаній створюють свої локальні версії ChatGPT. Лише в регіоні Перської затоки Саудівська Аравія закупила понад 3000 чіпів H100 для навчання LLM для вітчизняних університетів.
Ситуація з "війною великих моделей" схожа на бум інтернет-стартапів кілька років тому. Причина цього полягає в публікації в 2017 році статті про алгоритм Transformer від Google, яка стала основою для всіх великих моделей, що існують сьогодні.
Transformer вирішив проблему ефективності, з якою стикалися нейронні мережі при обробці довгих текстів, надавши штучному інтелекту можливість розуміти контекст. Це перетворило великі моделі з теоретичних досліджень на інженерні завдання, знизивши вхідний бар'єр.
З ростом активності відкритих спільнот, продуктивність великих моделей може стати схожою. Майбутня конкурентоспроможність більше проявиться в екологічному будівництві або чистій здатності до міркування.
Проте, висока вартість обчислювальних потужностей стала перешкодою для розвитку галузі. За оцінками, щорічні витрати глобальних технологічних компаній на інфраструктуру великих моделей можуть досягати 200 мільярдів доларів, але пов'язані доходи складають лише до 75 мільярдів доларів, що створює величезний дефіцит.
Наразі, крім небагатьох компаній, більшість AI-компаній ще не знайшли надійної бізнес-моделі. Навіть такі гіганти галузі, як Microsoft та Adobe, стикаються з викликами в ціноутворенні на AI-продукти.
У майбутньому прості постачальники великих моделей можуть зіткнутися з більшим тиском. Справжня цінність, можливо, більше проявляється в конкретних сценаріях застосування на основі ШІ, а не в самій моделі.
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
9 лайків
Нагородити
9
5
Поділіться
Прокоментувати
0/400
SchroedingerGas
· 07-12 22:04
Внутрішні великі моделі явно просто лежать без діла.
Конкуренція між сотнями моделей в сфері штучного інтелекту загострюється, країни створюють стратегії для завоювання майбутньої влади.
Популярність у сфері великих моделей ШІ продовжує зростати, країни активно займаються цим напрямком
Минулого місяця в галузі штучного інтелекту відбулася "війна тварин", спровокована Llama від Meta та Falcon від Інституту технологічних інновацій ОАЕ. Ці дві великі мовні моделі змагалися на відкритому LLM-рейтингу.
Llama користується великою популярністю серед розробників завдяки своїй відкритій природі. Японська компанія NEC швидко розробила японську версію ChatGPT на базі Llama. Тим часом Falcon, після виходу 40B версії у травні, зайняв перше місце в рейтингах, а у вересні випустив 180B версію, знову досягнувши ще вищого рангу.
Цікаво, що розробники Falcon не є технологічною компанією, а є дослідницькою установою з Об'єднаних Арабських Еміратів. Міністр штучного інтелекту ОАЕ потім був обраний до списку 100 найвпливовіших людей у сфері ШІ журналу Time.
Сьогодні сфера штучного інтелекту вступила в етап активної конкуренції, багато країн і компаній створюють свої локальні версії ChatGPT. Лише в регіоні Перської затоки Саудівська Аравія закупила понад 3000 чіпів H100 для навчання LLM для вітчизняних університетів.
Ситуація з "війною великих моделей" схожа на бум інтернет-стартапів кілька років тому. Причина цього полягає в публікації в 2017 році статті про алгоритм Transformer від Google, яка стала основою для всіх великих моделей, що існують сьогодні.
Transformer вирішив проблему ефективності, з якою стикалися нейронні мережі при обробці довгих текстів, надавши штучному інтелекту можливість розуміти контекст. Це перетворило великі моделі з теоретичних досліджень на інженерні завдання, знизивши вхідний бар'єр.
З ростом активності відкритих спільнот, продуктивність великих моделей може стати схожою. Майбутня конкурентоспроможність більше проявиться в екологічному будівництві або чистій здатності до міркування.
Проте, висока вартість обчислювальних потужностей стала перешкодою для розвитку галузі. За оцінками, щорічні витрати глобальних технологічних компаній на інфраструктуру великих моделей можуть досягати 200 мільярдів доларів, але пов'язані доходи складають лише до 75 мільярдів доларів, що створює величезний дефіцит.
Наразі, крім небагатьох компаній, більшість AI-компаній ще не знайшли надійної бізнес-моделі. Навіть такі гіганти галузі, як Microsoft та Adobe, стикаються з викликами в ціноутворенні на AI-продукти.
У майбутньому прості постачальники великих моделей можуть зіткнутися з більшим тиском. Справжня цінність, можливо, більше проявляється в конкретних сценаріях застосування на основі ШІ, а не в самій моделі.