Новая война браузеров на основе ИИ: от поиска до умных агентов, переформатирование сетевых входов

ИИ преобразит браузеры: новые тенденции третьей войны браузеров

Третья война браузеров тихо разворачивается. С 90-х годов с Netscape и IE, до Firefox и Chrome, борьба браузеров всегда была ярким проявлением контроля платформы и смены технологических парадигм. Chrome завоевал господствующее положение благодаря скорости обновлений и взаимодействию с экосистемой, а Google создал замкнутый круг входа в информацию через двуглавую структуру поиска и браузера.

Но сегодня эта схема начинает колебаться. Появление крупных языковых моделей (LLM) позволяет все большему количеству пользователей выполнять задачи на странице результатов поиска с "нулевым кликом", что приводит к снижению традиционного поведения кликов на веб-страницах. В то же время слухи о том, что Apple может заменить поисковую систему по умолчанию в Safari, еще больше угрожают прибыли Alphabet, и на рынке уже проявляются признаки беспокойства по поводу "традиционного поиска".

Браузер сам по себе также сталкивается с переосмыслением своей роли. Он больше не просто инструмент для отображения веб-страниц, а является контейнером, который объединяет множество возможностей, таких как ввод данных, поведение пользователей и конфиденциальность идентификации. Хотя AI Agent и сильный, для выполнения сложных взаимодействий на странице, обращения к локальным данным о личности и управления элементами веб-страницы по-прежнему необходимо полагаться на доверительные границы и функциональные песочницы браузера. Браузер превращается из человеческого интерфейса в платформу для системных вызовов Agent.

Есть ли еще необходимость в браузерах? Мы считаем, что действительно способным нарушить существующий рынок браузеров станет не очередной "лучший Chrome", а новая структура взаимодействия: не просто презентация информации, а вызов задач. Будущие браузеры должны быть разработаны для AI-агентов - они должны не только читать, но и писать и выполнять. Проекты, такие как Browser Use, пытаются семантизировать структуру страниц, превращая визуальные интерфейсы в структурированный текст, который может быть вызван LLM, достигая сопоставления страниц с командами и значительно снижая затраты на взаимодействие.

Основные проекты начали экспериментировать: Perplexity создает родной браузер Comet, заменяя традиционные результаты поиска ИИ; Brave сочетает защиту конфиденциальности с локальным выводом, используя LLM для улучшения функций поиска и блокировки; а такие крипто-родные проекты, как Donut, нацелены на новые способы взаимодействия ИИ и активов на блокчейне. Общая черта этих проектов: попытка реконструировать входную часть браузера, а не улучшать его выходной слой.

Для предпринимателей возможности скрываются в треугольных отношениях между вводом, структурой и агентством. Браузер как интерфейс для вызова мира будущего означает, что тот, кто сможет предоставить структурированные, вызываемые и заслуживающие доверия "блоки возможностей", сможет стать частью нового поколения платформ. От SEO до AEO(Agent Engine Optimization), от трафика страниц до вызовов цепочек задач, форма и дизайн продукта находятся в процессе реконструкции. Третья война браузеров происходит на "вводе", а не на "демонстрации"; победителя определяет не тот, кто привлекает внимание пользователей, а тот, кто завоевывает доверие агента и получает доступ к вызовам.

История развития браузеров

В начале 90-х годов прошлого века Netscape Navigator открыл двери в цифровой мир для миллионов пользователей. Microsoft осознала важность браузеров и насильно включила Internet Explorer в операционную систему Windows, что подорвало рыночную доминирующую позицию Netscape.

В условиях кризиса инженеры Netscape решили открыть исходный код браузера, который позже стал основой проекта Mozilla и в конечном итоге получил название Firefox. Firefox достиг нескольких прорывов в пользовательском опыте, экосистеме плагинов, безопасности и других аспектах, что стало знаковым событием для победы духа открытого кода.

В то же время браузер Opera был представлен в 1994 году, в 2003 году была введена собственная разработка движка Presto, поддерживающего такие передовые технологии, как CSS и адаптивная верстка. В том же году Apple выпустила браузер Safari. В 2007 году IE7 был выпущен вместе с Windows Vista, но рыночные отзывы были средними. Доля рынка Firefox постепенно увеличилась до около 20%, а доминирование IE стало ослабевать.

Chrome появился на свет в 2008 году и быстро завоевал популярность благодаря частым обновлениям и единому опыту на всех платформах. В ноябре 2011 года Chrome впервые обошел Firefox; через шесть месяцев снова обошел IE, завершив переход от претендента к лидеру.

Войдя в 2020-е годы, доля рынка Chrome стабилизировалась примерно на уровне 65%. Поисковая система Google и браузер Chrome образуют двойную монопольную структуру: первая контролирует около 90% глобальных входов в поиск, а вторая охватывает большинство пользователей, входящих в сеть через "первое окно".

С ростом крупных языковых моделей (LLM) традиционный поиск испытывает давление. В 2024 году доля рынка Google в поисковых системах упала с 93% до 89%. Слухи о том, что Apple может запустить собственный AI поисковик, могут еще больше подорвать прибыль Alphabet.

От Navigator до Chrome, от идеалов открытого кода до коммерциализации рекламы, борьба браузеров всегда была войной технологий, платформ, контента и контроля. Кто контролирует вход, тот определяет будущее.

В глазах венчурных капиталистов третья война браузеров постепенно разворачивается, опираясь на новые потребности людей в поисковых системах в эпоху LLM и ИИ.

Устаревшая архитектура современных браузеров

Традиционная архитектура браузера включает:

  1. Входная точка клиентского фронтенда: завершение расшифровки TLS, выборка QoS и географическая маршрутизация.

  2. Понимание запроса: проведение проверки орфографии, расширение синонимов, анализ намерений.

  3. Вызов кандидатов: использование обратного индекса и векторного индекса для фильтрации первоначальных страниц-кандидатов.

  4. Многоуровневая сортировка: отфильтровка кандидатных страниц до примерно 1000 с помощью легких признаков.

  5. Глубокое обучение основной сортировки: использование технологий, таких как RankBrain и Neural Matching, для понимания семантики запросов.

  6. Глубокая перенастройка: использование модели BERT для более точной сортировки документов.

Это типичный рабочий процесс поисковой системы Google. Но в эпоху ИИ и больших данных у пользователей возникли новые требования к взаимодействию с браузером.

ИИ преобразит браузеры

Браузер как универсальный вход не только для чтения данных, пользователю также необходимо взаимодействовать с данными. Сам браузер является местом хранения отпечатков пользователей. Более сложные пользовательские действия и автоматизированные действия должны осуществляться через браузер.

Браузер является местом хранения персонализированного контента:

  • Большинство крупных моделей размещены в облаке, и сложно напрямую использовать локальные конфиденциальные данные.
  • Все данные отправляются третьей стороне модели, необходимо повторно получить разрешение пользователя.
  • Автоматическое заполнение кода подтверждения, вызов камеры и т.д. должно выполняться в песочнице браузера.
  • Контекст данных сильно зависит от браузера, включая вкладки, файлы cookie и т. д.

Глубокие изменения в формах взаимодействия

Пользовательское поведение в поисковых системах эволюционирует. Исследование 2024 года показало, что из каждых 1000 запросов в Google в США 63% относятся к поведению "нулевого клика". Пользователи привыкли получать информацию прямо со страницы результатов поиска.

AI-браузерам все еще необходимо исследовать подходящие формы взаимодействия, особенно в области чтения данных, поскольку текущая "галлюцинация" больших моделей все еще не устранена, и многие пользователи трудно полностью доверять автоматически сгенерированным содержательным резюме.

На самом деле, настоящим катализатором масштабных изменений в браузерах является уровень взаимодействия с данными. Пользователи все чаще склонны использовать естественный язык для описания сложных задач, и эти агентные задачи теперь берут на себя агенты ИИ.

Будущие браузеры должны быть спроектированы для полной автоматизации, учитывая:

  • Как совместить опыт чтения для человека с возможностью анализа AI-агентом
  • Как обслуживать пользователей и модели агентов на одной странице

Использование браузера

Browser Use построил поистине семантический уровень, создав архитектуру семантического распознавания для следующего поколения браузеров. Он декодирует традиционное "DOM=дерево узлов для человека" в "семантическое DOM=дерево инструкций для LLM", позволяя агентам точно кликать, заполнять и загружать без необходимости "смотреть координаты точек".

Этот маршрут заменяет визуальный OCR или координаты Selenium на "структурированный текст → вызов функции", что делает выполнение быстрее, экономит токены и снижает количество ошибок. TechCrunch назвал это "клеевым слоем, который позволяет ИИ действительно понимать веб-страницы".

Основные характеристики использования браузера:

  • Абстрагируйте интерактивные элементы в фрагменты JSON с метаданными, такими как роль, видимость и т.д.
  • Преобразовать всю страницу в плоский "список семантических узлов" для однократного чтения LLM
  • Получение высокоуровневых команд от LLM и их воспроизведение в реальном браузере

Как только этот стандарт будет принят W3C, это значительно решит проблемы ввода в браузерах.

ДУГА

Компания Browser(Arc, материнская компания), сосредоточила свои усилия на браузере DIA, ориентированном на ИИ. Однако ее прогнозы были неточными, и не удалось четко различить, что "взаимодействие" состоит из двух измерений: ввода и вывода.

На входной стороне ИИ может повысить эффективность директивного взаимодействия; но на выходной стороне это суждение явно несбалансировано, игнорируя ключевую роль браузера в представлении информации и персонализированном опыте. Браузер, будучи платформой, которая вмещает конфиденциальные данные и может универсально отображать разнообразные интерфейсы продуктов, имеет ограниченные возможности замещения на входном уровне, а сложность на выходной стороне еще больше затрудняет его разрушение.

Чтобы действительно потрясти Chrome, необходимо кардинально пересмотреть режим рендеринга браузера, чтобы он соответствовал требованиям взаимодействия под руководством AI Agent, особенно в дизайне архитектуры ввода. Browser Use сосредотачивается на структурных преобразованиях базовых механизмов браузера, продвигая "атомизацию" или "модульность", что приведет к появлению программируемости и комбинируемости, обладающей огромным разрушительным потенциалом.

Путаница

Perplexity - это AI поисковая система, известная своей рекомендательной системой, с последней оценкой в 14 миллиардов долларов. Ее основные характеристики - это实时总结页面, что дает ей преимущество в получении мгновенной информации. Perplexity выпустит нативный браузер Comet, глубоко интегрированный в поисковую систему.

Однако Perplexity всё ещё необходимо решить проблемы высоких затрат на поиск и низкой маржинальной прибыли пользователей. Google также активно проводит переоснащение ИИ, запуская новый опыт с вкладками браузера AI Model.

Лишь имитация поверхностных функций вряд ли сможет по-настоящему угрожать Google. Настоящей угрозой, способной установить новый порядок, станет глубокая переработка архитектуры браузера, а также глубокая интеграция LLM в ядро браузера, которая приведет к фундаментальным изменениям в способах взаимодействия.

Храбрый

Brave — это один из первых и самых успешных браузеров в криптоиндустрии, основанный на архитектуре Chromium. Он привлекает пользователей с помощью модели, основанной на конфиденциальности и заработке токенов за просмотр. Однако потребности в конфиденциальности по-прежнему в основном сосредоточены на определенной группе пользователей, что затрудняет его разрушение существующих гигантов.

Количество активных пользователей Brave в месяц достигло 82,7 миллиона, количество активных пользователей в день – 35,6 миллиона, доля рынка составляет примерно 1%-1,5%. Среднее количество поисковых запросов в месяц составляет около 1,34 миллиарда, что составляет примерно 0,3% от Google.

Браузер Brave планирует обновление с акцентом на конфиденциальность. Однако из-за ограниченного доступа к пользовательским данным и низкой настраиваемости больших моделей, это затрудняет быструю и точную итерацию продуктов. В преддверии эры Agentic Browser, Brave, возможно, сохранит стабильную долю на рынке среди определенной группы пользователей, ориентированных на конфиденциальность, но вряд ли станет основным игроком.

Донат

Крипто-стартап Donut получил 7 миллионов долларов в рамках предварительного финансирования. Его видение заключается в реализации интегрированной способности "исследование - принятие решений - нативное выполнение криптографических операций."

Основное внимание в этом направлении уделяется сочетанию автоматизированных путей выполнения, присущих криптовалютам. В будущем агенты могут заменить поисковые системы как основной источник трафика, и предприниматели будут конкурировать за доступ и конверсионный трафик, созданный выполнением агентов. В отрасли уже назвали эту тенденцию "AEO"(Ответ/Оптимизация Двигателя Агентов) или "ATF"(Выполнение Задач Агентов).

Советы для предпринимателей

Браузер по-прежнему остается крупнейшим не реконструированным "главным входом" в мир интернета. В мире около 2,1 миллиарда пользователей настольных ПК и более 4,3 миллиарда пользователей мобильных устройств, он является общим носителем для ввода данных, взаимодействия и хранения персонализированных отпечатков.

Для предпринимателей настоящим прорывом является не оптимизация на уровне "выхода страницы". Настоящая точка прорыва заключается в "стороне ввода" - как заставить ИИ-агента активно использовать продукты предпринимателей для выполнения конкретных задач. Это станет ключом к тому, сможет ли продукт встроиться в экосистему агентов, получить трафик и распределение ценности в будущем.

Поиск эпохи拼"нажмите"; агентская эпоха拼"вызов".

Предприниматели должны переосмыслить продукт как компонент API, чтобы агенты могли не только "понимать" его, но и "вызывать" его. Проектирование продукта должно учитывать три измерения:

  1. Стандартизация структуры интерфейса: продукт "доступен для вызова"?
  • Можно ли описать ключевые операции с помощью семантической структуры DOM или JSON-карт?
  • Предоставляется ли машина состояний, чтобы агент мог стабильно воспроизводить процесс поведения пользователя?
  • Поддерживает ли пользовательский интерфейс скриптовое восстановление?
  • Есть ли стабильный доступ к WebHook или API Endpoint?
  1. Идентификация и доступ: может ли агент "преодолеть барьеры доверия"?
  • Может ли он стать надежным посредником для выполнения сделок, вызова платежей или активов с помощью AI?
  • Для крипто-предпринимателей можно рассмотреть возможность создания "MCP(Многофункциональной платформы) для мира блокчейна".
  1. Понимание механизма трафика: будущее не в SEO, а в AEO/ATF
  • Продукты должны иметь четкую гранулярность задач: не "страница", а "единица вызываемой функции"
  • Начать оптимизацию агента (AEO) или адаптацию планирования задач (ATF)
  • Адаптация к различным LLM-рамкам
Посмотреть Оригинал
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
  • Награда
  • 6
  • Поделиться
комментарий
0/400
PensionDestroyervip
· 10ч назад
chrome в конце концов устарел
Посмотреть ОригиналОтветить0
YieldHuntervip
· 23ч назад
честно говоря, доминирование Chrome в данный момент буквально является понци... данные показывают снижение органических кликов
Посмотреть ОригиналОтветить0
GasFeeLovervip
· 23ч назад
Первый раунд крови начался~ Наконец-то дождался этого дня
Посмотреть ОригиналОтветить0
GasBanditvip
· 23ч назад
Как же все это реклама, таблетки от Гугла
Посмотреть ОригиналОтветить0
ForeverBuyingDipsvip
· 23ч назад
Кажется, похороны IE нужно провести заново.
Посмотреть ОригиналОтветить0
GateUser-00be86fcvip
· 23ч назад
Снова началась битва браузеров, кто понимает, тот понимает.
Посмотреть ОригиналОтветить0
  • Закрепить