La nouvelle guerre des navigateurs alimentée par l'IA : de la recherche à l'agent intelligent, remodeler l'entrée du web.

L'IA va remodeler le navigateur : nouvelles tendances de la troisième guerre des navigateurs

La troisième guerre des navigateurs se déroule discrètement. Depuis Netscape et IE dans les années 90, jusqu'à Firefox et Chrome, la lutte entre les navigateurs est toujours l'incarnation concentrée du contrôle de la plateforme et des changements de paradigme technologique. Chrome a acquis une position dominante grâce à sa rapidité de mise à jour et à l'interconnexion de son écosystème, tandis que Google, à travers une structure oligopolistique de recherche et de navigateur, a formé une boucle fermée d'accès à l'information.

Mais aujourd'hui, cette configuration est en train de vaciller. L'émergence des grands modèles de langage (LLM) permet à de plus en plus d'utilisateurs de réaliser des tâches sur la page de résultats de recherche avec des "zéro clic", et le comportement traditionnel de clic sur les pages web est en diminution. Parallèlement, les rumeurs selon lesquelles Apple pourrait remplacer le moteur de recherche par défaut dans Safari menacent encore davantage la base de profits d'Alphabet, et l'inquiétude du marché quant à la "légitimité de la recherche" commence à se manifester.

Le navigateur lui-même est également en train de se redéfinir. Il n'est pas seulement un outil d'affichage des pages web, mais aussi un conteneur d'une multitude de capacités telles que la saisie de données, le comportement des utilisateurs, et l'identité privée. Bien que l'Agent IA soit puissant, pour réaliser des interactions complexes sur les pages, accéder aux données d'identité locales, et contrôler les éléments web, il doit encore s'appuyer sur la confiance et le bac à sable fonctionnel du navigateur. Le navigateur passe d'une interface humaine à une plateforme d'appels système pour les Agents.

Les navigateurs ont-ils encore une raison d'être ? Nous pensons que ce qui pourrait vraiment briser le paysage actuel du marché des navigateurs n'est pas un "meilleur Chrome", mais une nouvelle structure d'interaction : ce n'est pas l'affichage d'informations, mais l'appel de tâches. Les navigateurs futurs doivent être conçus pour les agents AI - capables non seulement de lire, mais aussi d'écrire et d'exécuter. Des projets comme Browser Use tentent de sémantiser la structure des pages, transformant l'interface visuelle en texte structuré appelable par des LLM, permettant une cartographie des pages aux instructions, réduisant ainsi considérablement le coût d'interaction.

Les projets mainstream ont commencé à expérimenter : Perplexity construit un navigateur natif Comet, remplaçant les résultats de recherche traditionnels par de l'IA ; Brave combine la protection de la vie privée avec le raisonnement local, renforçant les fonctionnalités de recherche et de blocage avec LLM ; tandis que des projets natifs Crypto comme Donut visent à créer une nouvelle porte d'entrée pour l'interaction entre l'IA et les actifs en chaîne. La caractéristique commune de ces projets est : tenter de reconstruire l'interface d'entrée du navigateur, plutôt que d'embellir sa couche de sortie.

Pour les entrepreneurs, les opportunités se cachent dans la relation triangulaire entre l'entrée, la structure et l'agent. Le navigateur, en tant qu'interface d'appel du monde par les agents du futur, signifie que celui qui peut fournir des "blocs de capacités" structurés, appelables et dignes de confiance, peut devenir une partie intégrante de la nouvelle génération de plateformes. De SEO à AEO(Agent Engine Optimization), du trafic de page à l'appel de chaîne de tâches, la forme et la pensée de conception des produits sont en train de se reconstruire. La troisième guerre des navigateurs se déroule sur "l'entrée" plutôt que sur "l'affichage"; ce qui détermine le gagnant n'est plus qui attire l'attention des utilisateurs, mais qui gagne la confiance des agents et obtient l'entrée d'appel.

Historique du développement des navigateurs

Au début des années 90, Netscape Navigator a ouvert la porte du monde numérique à des millions d'utilisateurs. Microsoft a réalisé l'importance des navigateurs et a contraint l'intégration d'Internet Explorer dans le système Windows, ce qui a sapé la position dominante de Netscape sur le marché.

Face à la crise, les ingénieurs de Netscape ont choisi de rendre le code source du navigateur public, ce code est devenu la base du projet Mozilla, qui a finalement été nommé Firefox. Firefox a réalisé de nombreuses percées en matière d'expérience utilisateur, d'écosystème de plugins et de sécurité, marquant la victoire de l'esprit open source.

En parallèle, le navigateur Opera a été lancé en 1994, et en 2003, il a introduit son moteur Presto, prenant en charge des technologies de pointe telles que CSS et le design réactif. La même année, Apple a lancé le navigateur Safari. En 2007, IE7 a été introduit avec Windows Vista, mais les retours du marché ont été moyens. La part de marché de Firefox a continué d'augmenter pour atteindre environ 20%, tandis que la domination d'IE a progressivement diminué.

Chrome a été lancé en 2008, s'élevant rapidement grâce à un rythme de mise à jour fréquent et une expérience unifiée sur toutes les plateformes. En novembre 2011, Chrome a dépassé Firefox pour la première fois ; six mois plus tard, il a de nouveau dépassé IE, complétant la transition de challenger à dominateur.

Entrant dans les années 2020, la part de marché mondiale de Chrome se maintient à environ 65%. Le moteur de recherche Google et le navigateur Chrome forment une structure de double monopole, le premier contrôlant environ 90% des points d'entrée de recherche dans le monde, tandis que le second détient la majorité des "premières fenêtres" par lesquelles les utilisateurs accèdent à Internet.

Avec l'émergence des grands modèles de langage (LLM), la recherche traditionnelle est perturbée. En 2024, la part de marché de la recherche Google passe de 93 % à 89 %. Les rumeurs selon lesquelles Apple pourrait lancer son propre moteur de recherche AI pourraient encore plus ébranler le pilier des bénéfices d'Alphabet.

De Navigator à Chrome, de l'idéal open source à la commercialisation de la publicité, la bataille des navigateurs a toujours été une guerre sur la technologie, les plateformes, le contenu et le contrôle. Celui qui détient l'entrée définit l'avenir.

Aux yeux des VC, s'appuyant sur les nouvelles exigences des gens envers les moteurs de recherche à l'ère des LLM et de l'IA, la troisième guerre des navigateurs est en train de se déployer progressivement.

L'architecture obsolète des navigateurs modernes

L'architecture des navigateurs traditionnels comprend :

  1. Point d'entrée du front-end du client : terminaison TLS, échantillonnage QoS et routage géographique.

  2. Compréhension de la recherche : effectuer une correction orthographique, une expansion de synonymes et une analyse d'intention.

  3. Rappel des candidats : utiliser des index inversés et des index vectoriels pour filtrer les pages candidates initiales.

  4. Tri par niveaux : Filtrer les pages candidates à environ 1000 articles grâce à des caractéristiques légères.

  5. Apprentissage profond de tri principal : utiliser des techniques telles que RankBrain et Neural Matching pour comprendre la sémantique des requêtes.

  6. Réarrangement profond : utiliser le modèle BERT pour un classement plus précis des documents.

C'est un flux de travail typique du moteur de recherche Google. Mais à l'ère actuelle de l'IA et des big data, les utilisateurs ont de nouveaux besoins en matière d'interaction avec les navigateurs.

L'IA va transformer les navigateurs

Le navigateur, en tant qu'entrée universelle, n'est pas seulement utilisé pour lire des données, les utilisateurs doivent également interagir avec les données. Le navigateur lui-même est un endroit où sont stockées les empreintes digitales des utilisateurs. Des comportements utilisateurs plus complexes et des comportements automatisés doivent être portés par le navigateur.

Le navigateur est un lieu de stockage de contenu personnalisé :

  • La plupart des grands modèles sont hébergés dans le cloud, ce qui rend difficile l'appel direct aux données sensibles locales.
  • Toutes les données doivent être envoyées à un modèle tiers, une nouvelle autorisation de l'utilisateur est requise.
  • Le remplissage automatique du code de vérification, l'activation de la caméra, etc., doivent être réalisés dans le bac à sable du navigateur.
  • Le contexte des données dépend fortement du navigateur, y compris des onglets, des cookies, etc.

Transformation profonde des formes d'interaction

Le comportement de recherche des utilisateurs est en évolution. Une étude de 2024 montre qu'aux États-Unis, 63 % des 1000 recherches Google sont des comportements de "zéro clic". Les utilisateurs ont l'habitude d'obtenir des informations directement à partir de la page de résultats de recherche.

Le navigateur AI doit encore explorer des formes d'interaction appropriées, en particulier en ce qui concerne la lecture des données, car le "problème d'hallucination" des grands modèles n'est toujours pas résolu, et de nombreux utilisateurs ont du mal à faire entièrement confiance aux résumés de contenu générés automatiquement.

Ce qui pourrait réellement déclencher une grande transformation des navigateurs, c'est la couche d'interaction des données. Les utilisateurs sont de plus en plus enclins à décrire des tâches complexes en langage naturel, et ces tâches agentiques sont en train d'être prises en charge par des agents IA.

Le navigateur du futur doit être conçu pour une automatisation totale, en tenant compte de :

  • Comment concilier l'expérience de lecture humaine et la lisibilité par des agents IA
  • Comment servir les utilisateurs et les modèles d'agents sur la même page

Utilisation du navigateur

Browser Use a construit une véritable couche sémantique, créant une architecture de reconnaissance sémantique pour la prochaine génération de navigateurs. Il a redécodé le "DOM=arbre de nœuds visible par l'homme" en "sémantique DOM=arbre d'instructions visible par LLM", permettant aux agents de cliquer, remplir et télécharger avec précision sans avoir besoin de "coordonnées de points de vue".

Cette approche remplace l'OCR visuel ou Selenium par "texte structuré → appel de fonction", exécutant plus rapidement, consommant moins de tokens et générant moins d'erreurs. TechCrunch l'appelle "la couche de colle qui permet à l'IA de vraiment comprendre les pages web".

Les principales caractéristiques de l'utilisation du navigateur :

  • Abstraire les éléments interactifs en fragments JSON, accompagnés de métadonnées telles que le rôle, la visibilité, etc.
  • Convertir la page entière en "liste de nœuds sémantiques" aplatie pour une lecture unique par le LLM.
  • Recevoir les instructions de haut niveau du LLM et les lire dans un vrai navigateur

Une fois que cette norme sera introduite au W3C, elle pourra résoudre en grande partie les problèmes d'entrée dans les navigateurs.

ARC

La société Browser(Arc, société mère de), se concentre sur le navigateur orienté vers l'IA, DIA. Cependant, ses prévisions sont erronées et ne parviennent pas à distinguer clairement que "l'interaction" est composée de deux dimensions : l'entrée et la sortie.

Du côté des entrées, l'IA peut améliorer l'efficacité des interactions basées sur des commandes ; mais du côté des sorties, ce jugement est clairement déséquilibré, négligeant le rôle central du navigateur dans la présentation de l'information et l'expérience personnalisée. En tant que plateforme capable d'héberger des données privées tout en rendant des interfaces de produits diversifiés, le navigateur a des alternatives limitées au niveau d'entrée, et la complexité du côté des sorties rend son renversement d'autant plus difficile.

Pour véritablement rivaliser avec Chrome, il est nécessaire de repenser fondamentalement le mode de rendu du navigateur afin de l'adapter aux besoins d'interaction dominés par les agents IA, en particulier la conception de l'architecture côté saisie. L'utilisation du navigateur se concentre sur la transformation structurelle des mécanismes sous-jacents du navigateur, en promouvant "l'atome" ou "la modularité", dont la programmabilité et la combinabilité dérivées apporteront un potentiel de disruption extrêmement puissant.

Perplexité

Perplexity est un moteur de recherche AI connu pour son système de recommandations, avec une valorisation récente de 14 milliards de dollars. Ses principales caractéristiques sont le résumé en temps réel des pages, ce qui lui confère un avantage dans l'obtention d'informations instantanées. Perplexity va lancer le navigateur natif Comet, profondément intégré dans le moteur de réponses.

Cependant, Perplexity doit encore résoudre le problème des coûts de recherche élevés et des faibles marges bénéficiaires des utilisateurs marginaux. Google est également en train de se réinventer grâce à l'IA, en lançant une nouvelle expérience d'onglet de navigateur AI Model.

Il est difficile de menacer réellement Google en se contentant d'imiter des fonctionnalités superficielles. Ce qui pourrait vraiment établir un nouvel ordre, c'est de reconstruire l'architecture du navigateur depuis le bas, d'intégrer profondément les LLM dans le noyau du navigateur et de réaliser une transformation fondamentale dans les modes d'interaction.

Brave

Brave est l'un des premiers et des plus réussis navigateurs de l'industrie de la cryptographie, basé sur l'architecture Chromium. Il attire les utilisateurs grâce à son modèle de gain de tokens basé sur la confidentialité et la navigation. Cependant, la demande de confidentialité reste principalement concentrée sur un groupe d'utilisateurs spécifique, ce qui rend difficile de renverser les géants existants.

Le nombre d'utilisateurs actifs mensuels de Brave atteint 82,7 millions, avec 35,6 millions d'utilisateurs actifs quotidiens, et une part de marché d'environ 1 % à 1,5 %. Le volume moyen de recherches mensuelles est d'environ 1,34 milliard, soit environ 0,3 % de Google.

Le projet Brave va évoluer vers un navigateur AI axé sur la confidentialité. Cependant, en raison de la limitation dans l'acquisition de données utilisateur et d'un faible niveau de personnalisation des modèles, cela nuit à une itération rapide et précise des produits. À l'aube de l'ère du navigateur Agentic, Brave pourrait maintenir une part stable parmi les groupes d'utilisateurs axés sur la confidentialité, mais il sera difficile de devenir un acteur majeur.

Donut

Le projet crypto émergent Donut a levé 7 millions de dollars lors d'un financement de pré-amorçage. Sa vision est d'atteindre une capacité intégrée d'"exploration - décision - exécution natif de la cryptographie".

Cette direction se concentre sur la combinaison des chemins d'exécution automatisés natifs de la cryptographie. À l'avenir, les Agents devraient remplacer les moteurs de recherche en tant que principale porte d'entrée du trafic, les entrepreneurs se disputant le trafic d'accès et de conversion généré par l'exécution des Agents. Cette tendance est déjà appelée "AEO"(Answer/Agent Engine Optimization) ou "ATF"(Agentic Task Fulfilment).

Conseils aux entrepreneurs

Le navigateur reste le plus grand "point d'entrée" non reconstruit du monde Internet. Il y a environ 2,1 milliards d'utilisateurs de bureau dans le monde et plus de 4,3 milliards sur mobile, il est le support commun pour l'entrée de données, les comportements d'interaction et le stockage d'empreintes digitales personnalisées.

Pour les entrepreneurs, le véritable potentiel de rupture ne réside pas dans l'optimisation du niveau "sortie de page". Le véritable point de rupture se trouve du côté "entrée" - comment permettre à l'Agent IA d'appeler activement le produit de l'entrepreneur pour accomplir des tâches spécifiques. Cela sera la clé pour savoir si les produits futurs pourront s'intégrer dans l'écosystème des Agents, obtenir du trafic et bénéficier d'une répartition de la valeur.

Recherche à l'ère de "cliquer"; Agence à l'ère de "appeler".

Les entrepreneurs devraient réimager leurs produits en tant que composants API, permettant aux agents non seulement de "comprendre" ceux-ci, mais aussi de "les appeler". La conception des produits doit prendre en compte trois dimensions :

  1. Normalisation de la structure de l'interface : le produit est-il "appelable" ?
  • Les opérations clés peuvent-elles être décrites par une structure DOM sémantique ou un mappage JSON?
  • Fournit-il une machine à états permettant à l'Agent de reproduire de manière stable les flux de comportement des utilisateurs ?
  • L'interaction utilisateur prend-elle en charge la restauration par script ?
  • Disposez-vous d'un WebHook ou d'un point de terminaison API avec un accès stable ?
  1. Identité et passage : peut-on aider l'Agent à "franchir les barrières de confiance" ?
  • Peut-il devenir un agent IA pour effectuer des transactions, appeler des paiements ou servir de couche intermédiaire fiable pour les actifs ?
  • Pour les entrepreneurs en crypto, envisagez de construire la "MCP(Multi Capability Platform) du monde de la blockchain".
  1. Compréhension supplémentaire du mécanisme de trafic : l'avenir n'est pas le SEO, mais l'AEO/ATF.
  • Les produits doivent avoir une granularité de tâche claire : ce n'est pas une "page", mais une "unité de capacité appelable".
  • Commencer à optimiser l'agent (AEO) ou adapter la planification des tâches (ATF)
  • Adaptation aux ajustements sous différents cadres LLM
Voir l'original
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
  • Récompense
  • 6
  • Partager
Commentaire
0/400
PensionDestroyervip
· Il y a 7h
chrome est finalement devenu vieux
Voir l'originalRépondre0
YieldHuntervip
· Il y a 20h
honnêtement, la dominance de chrome est littéralement un ponzi en ce moment... les données montrent une diminution des clics organiques
Voir l'originalRépondre0
GasFeeLovervip
· Il y a 20h
La première ronde de sang a commencé~ Enfin, ce jour est arrivé.
Voir l'originalRépondre0
GasBanditvip
· Il y a 20h
Pourquoi tout est une recherche de publicité, Google pilule
Voir l'originalRépondre0
ForeverBuyingDipsvip
· Il y a 20h
Il semble qu'il faille recommencer les funérailles d'IE.
Voir l'originalRépondre0
GateUser-00be86fcvip
· Il y a 20h
La guerre des navigateurs est de retour. Ceux qui comprennent, comprennent.
Voir l'originalRépondre0
  • Épingler
Trader les cryptos partout et à tout moment
qrCode
Scan pour télécharger Gate app
Communauté
Français (Afrique)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)