A nova guerra dos navegadores impulsionada por IA: da pesquisa ao agente inteligente, remodelando a entrada na rede

A IA irá reformular os navegadores: novas tendências na terceira guerra dos navegadores

A terceira guerra dos navegadores está se desenrolando silenciosamente. Desde os anos 90 com Netscape e IE, até Firefox e Chrome, a disputa entre navegadores sempre foi uma representação concentrada do controle da plataforma e da mudança de paradigmas tecnológicos. O Chrome conquistou a posição dominante graças à sua velocidade de atualização e à interconexão do ecossistema, enquanto o Google, através da estrutura de duopólio de busca e navegador, formou um ciclo fechado de entrada de informações.

Mas hoje, esse padrão está começando a mudar. A ascensão de modelos de linguagem de grande porte (LLM) está fazendo com que cada vez mais usuários completem tarefas na página de resultados de busca com "zero cliques", reduzindo o comportamento tradicional de clicar em páginas da web. Ao mesmo tempo, rumores sobre a possibilidade da Apple substituir o mecanismo de busca padrão no Safari ameaçam ainda mais a base de lucros da Alphabet, e o mercado já começa a mostrar sinais de inquietação em relação à "ortodoxia da busca".

O navegador está também a enfrentar uma reconfiguração do seu papel. Não é apenas uma ferramenta para exibir páginas da web, mas sim um recipiente que reúne várias capacidades, como entrada de dados, comportamento do usuário e identidade em termos de privacidade. Embora o AI Agent seja poderoso, para realizar interações complexas em páginas, chamar dados de identidade locais e controlar elementos da página, ainda precisa da confiança e das funcionalidades do navegador. O navegador está a transformar-se de uma interface humana para uma plataforma de chamadas de sistema para Agentes.

Ainda há necessidade de navegadores? Acreditamos que o que realmente pode quebrar o atual mercado de navegadores não é outro "Chrome melhor", mas uma nova estrutura de interação: não a exibição de informações, mas a convocação de tarefas. O navegador do futuro deve ser projetado para Agentes de IA - que não apenas possam ler, mas também escrever e executar. Projetos como Browser Use estão tentando semantizar a estrutura das páginas, transformando a interface visual em texto estruturado que pode ser chamado por LLM, realizando a mapeação de página para instrução e reduzindo drasticamente o custo de interação.

Os projetos principais começaram a experimentar: Perplexity constrói o navegador nativo Comet, substituindo os resultados de busca tradicionais por IA; Brave combina proteção de privacidade com raciocínio local, utilizando LLM para melhorar as funções de busca e bloqueio; enquanto projetos nativos de Crypto como Donut visam novas entradas para a interação entre IA e ativos em cadeia. A característica comum desses projetos é: tentar reestruturar a entrada do navegador, em vez de embelezar sua camada de saída.

Para os empreendedores, as oportunidades estão escondidas na relação triangular entre entrada, estrutura e agência. O navegador, como a interface para a chamada do mundo no futuro, significa que quem puder fornecer "blocos de capacidade" estruturados, chamáveis e confiáveis, pode se tornar parte da nova geração de plataformas. Da SEO à AEO(, Engine de Agentes), do tráfego de páginas à chamada de cadeias de tarefas, a forma e o pensamento de design do produto estão se reestruturando. A terceira guerra dos navegadores ocorre na "entrada" e não na "exibição"; o que decide a vitória não é mais quem chama a atenção dos usuários, mas quem ganha a confiança do Agente e obtém a entrada para a chamada.

História do desenvolvimento dos navegadores

No início da década de 90, o Netscape Navigator abriu as portas do mundo digital para milhões de usuários. A Microsoft percebeu a importância dos navegadores e forçou a inclusão do Internet Explorer no sistema Windows, desestabilizando a posição dominante do Netscape no mercado.

Em meio a dificuldades, os engenheiros da Netscape decidiram tornar o código-fonte do navegador público, e esse código mais tarde se tornou a base do projeto Mozilla, que acabou sendo nomeado Firefox. O Firefox alcançou vários avanços em experiência do usuário, ecossistema de plugins, segurança, entre outros, marcando a vitória do espírito de código aberto.

Enquanto isso, o navegador Opera foi lançado em 1994, e em 2003 introduziu o motor Presto desenvolvido internamente, suportando tecnologias de ponta como CSS e layouts responsivos. No mesmo ano, a Apple lançou o navegador Safari. Em 2007, o IE7 foi lançado com o Windows Vista, mas a resposta do mercado foi morna. A quota de mercado do Firefox aumentou constantemente para cerca de 20%, enquanto a dominância do IE começou a enfraquecer.

O Chrome foi lançado em 2008 e rapidamente se destacou graças à sua frequência de atualizações e à experiência unificada em todas as plataformas. Em novembro de 2011, o Chrome superou o Firefox pela primeira vez; seis meses depois, ultrapassou o IE, completando a transição de desafiador a dominador.

Entrando na década de 2020, a quota de mercado global do Chrome estabiliza-se em cerca de 65%. O motor de busca do Google e o navegador Chrome formam uma estrutura de duopólio, com o primeiro a controlar cerca de noventa por cento das entradas de busca globais, enquanto o segundo detém a maioria das entradas dos utilizadores na "primeira janela" da internet.

Com a ascensão dos grandes modelos de linguagem (LLM), as buscas tradicionais estão a ser afetadas. Em 2024, a quota de mercado de buscas do Google caiu de 93% para 89%. Os rumores sobre a Apple poder lançar o seu próprio motor de busca AI podem abalar ainda mais o pilar de lucros da Alphabet.

Da Navigator ao Chrome, da ideologia de código aberto à comercialização de anúncios, a disputa dos navegadores sempre foi uma guerra sobre tecnologia, plataformas, conteúdo e controle. Quem controla a entrada, define o futuro.

Na visão dos VC, apoiando-se nas novas necessidades das pessoas em relação aos motores de busca na era do LLM e da IA, a terceira guerra dos navegadores está gradualmente se desenrolando.

A arquitetura antiga dos navegadores modernos

A arquitetura tradicional do navegador inclui:

  1. Entrada da interface do cliente: conclusão da descriptografia TLS, amostragem QoS e roteamento geográfico.

  2. Compreensão da consulta: realizar correção ortográfica, expansão de sinônimos, análise de intenção.

  3. Recuperação de Candidatos: utilização de índices invertidos e índices de vetor para filtrar as páginas candidatas iniciais.

  4. Ordenação em múltiplos níveis: Filtrando as páginas candidatas para cerca de 1000 através de características leves.

  5. Ordenação Principal em Aprendizado Profundo: Utilizar técnicas como RankBrain e Neural Matching para entender a semântica das consultas.

  6. Reorganização Profunda: usar o modelo BERT para classificar documentos de forma mais refinada.

Este é o fluxo de trabalho típico do motor de busca Google. Mas na atual era da IA e dos grandes dados, os usuários têm novas necessidades de interação com o navegador.

A IA vai remodelar o navegador

O navegador como entrada universal, não só é utilizado para ler dados, mas os usuários também precisam interagir com os dados. O navegador em si é o local onde as impressões digitais dos usuários são armazenadas. Comportamentos de usuários mais complexos e ações automatizadas devem ser realizados através do navegador.

O navegador é um local de armazenamento de conteúdo personalizado:

  • A maioria dos grandes modelos está hospedada na nuvem, dificultando a chamada direta a dados sensíveis locais.
  • Enviar todos os dados para um modelo de terceiros, é necessário obter novamente a autorização do usuário.
  • O preenchimento automático do código de verificação, a utilização da câmara, etc., deve ser feito dentro da sandbox do navegador.
  • O contexto dos dados depende fortemente do navegador, incluindo abas, cookies, etc.

A profunda transformação das formas de interação

O comportamento de busca dos usuários está a evoluir. Um estudo de 2024 mostra que, em cada 1000 pesquisas no Google nos EUA, 63% pertencem a comportamentos de "zero cliques". Os usuários habitualmente obtêm informações diretamente da página de resultados de pesquisa.

O navegador de IA ainda precisa explorar formas de interação adequadas, especialmente na leitura de dados, pois o "problema da alucinação" dos grandes modelos ainda não foi erradicado, tornando difícil para muitos usuários confiarem totalmente nos resumos de conteúdo gerados automaticamente.

O que realmente pode desencadear uma grande mudança nos navegadores é a camada de interação de dados. Os usuários estão cada vez mais inclinados a usar linguagem natural para descrever tarefas complexas, e essas Tarefas Agenticas estão sendo assumidas por Agentes de IA.

O navegador do futuro deve ser projetado para a automação total, considerando:

  • Como equilibrar a experiência de leitura humana com a interpretabilidade do Agente de IA
  • Como servir usuários e modelos de agentes na mesma página

Uso do Navegador

O Browser Use construiu uma camada semântica no verdadeiro sentido da palavra, criando uma arquitetura de reconhecimento semântico para a próxima geração de navegadores. Ele redecodifica a tradicional "DOM=árvore de nós visível para humanos" em "DOM semântico=árvore de instruções visível para LLM", permitindo que o agente clique, preencha e faça upload com precisão sem precisar de "coordenadas de visualização".

Esta rota substitui o "texto estruturado → chamada de função" por OCR visual ou Selenium coordenado, executando mais rapidamente, consumindo menos tokens e cometendo menos erros. O TechCrunch chama isso de "a camada de cola que realmente permite que a IA entenda as páginas da web."

Principais características do uso do navegador:

  • Abstrair elementos interativos em fragmentos JSON, acompanhados de metadados como personagens, visibilidade, etc.
  • Converter toda a página em uma "lista de nós semânticos" achatada, para que o LLM possa ler de uma só vez.
  • Receber instruções de alto nível da saída do LLM, reproduzir no navegador real

Uma vez que este conjunto de padrões seja introduzido no W3C, poderá resolver em grande medida os problemas de entrada nos navegadores.

ARC

A Empresa do Navegador(A empresa-mãe da Arc)foca no navegador DIA voltado para IA. No entanto, suas previsões estão defasadas, não conseguindo distinguir claramente que a "interação" é composta por duas dimensões: input e output.

No lado da entrada, a IA pode aumentar a eficiência da interação por comandos; mas no lado da saída, esse julgamento está claramente desequilibrado, ignorando o papel central dos navegadores na apresentação de informações e na experiência personalizada. O navegador, como uma plataforma que abriga dados privados e pode renderizar interfaces de produtos diversificadas, tem uma substituição limitada no nível de entrada, e a complexidade do lado da saída torna ainda mais difícil sua desruptura.

Para realmente abalar o Chrome, é necessário uma reestruturação fundamental do modo de renderização do navegador, tornando-o adaptável às necessidades de interação sob a liderança de Agentes de IA, especialmente no design da estrutura do lado de entrada. O uso do navegador foca na transformação estrutural dos mecanismos subjacentes do navegador, promovendo a "atomização" ou "modularização", a programabilidade e a combinabilidade resultantes terão um potencial de disrupção extremamente poderoso.

Perplexidade

Perplexity é um motor de busca de IA conhecido pelo seu sistema de recomendação, com uma avaliação mais recente de 14 mil milhões de dólares. As suas principais características incluem a síntese em tempo real de páginas, destacando-se na obtenção de informações instantâneas. A Perplexity irá lançar o navegador nativo Comet, profundamente integrado no motor de respostas.

No entanto, a Perplexity ainda precisa resolver o problema dos altos custos de pesquisa e da baixa margem de lucro dos usuários marginais. O Google também está a realizar uma reestruturação com IA, lançando uma nova experiência de guia do navegador com o AI Model.

Apenas imitar funções superficiais dificilmente ameaça verdadeiramente o Google. O que realmente pode estabelecer uma nova ordem será a reestruturação da arquitetura do navegador a partir do zero, incorporando LLM profundamente no núcleo do navegador, realizando uma mudança fundamental na forma de interação.

Brave

Brave é o navegador mais antigo e bem-sucedido da indústria Crypto, baseado na arquitetura Chromium. Ele atrai usuários com um modelo de ganhos em Tokens baseado em privacidade e navegação. No entanto, a demanda por privacidade ainda está principalmente concentrada em grupos específicos de usuários, tornando difícil derrubar os gigantes existentes.

Os utilizadores ativos mensais do Brave alcançaram 82,7 milhões, com 35,6 milhões de utilizadores ativos diários, e uma quota de mercado de aproximadamente 1%-1,5%. O volume médio mensal de pesquisas é de cerca de 1,34 mil milhões, aproximadamente 0,3% do Google.

O Brave planeia atualizar para um navegador de IA com foco na privacidade. No entanto, limitado pela escassez de dados dos usuários e pelo baixo nível de personalização do modelo, isso dificulta a iteração rápida e precisa do produto. Na próxima era do Browser Agentic, o Brave pode manter uma quota estável entre os grupos de usuários que valorizam a privacidade, mas será difícil tornar-se um jogador principal.

Donut

O projeto inicial de criptomoedas Donut obteve 7 milhões de dólares em financiamento pré-seed. Sua visão é alcançar uma capacidade integrada de "exploração - decisão - execução nativa em criptomoeda".

A chave nesta direção é combinar o caminho de execução automática nativo da criptomoeda. No futuro, espera-se que os Agentes substituam os motores de busca como principais entradas de tráfego, e os empreendedores lutarão pelo tráfego de acesso e conversão gerado pela execução do Agente. A indústria já chamou essa tendência de "AEO"(Answer/Agent Engine Optimization) ou "ATF"(Agentic Task Fulfilment).

Conselhos para Empreendedores

O navegador continua a ser a maior "porta de entrada" não reconstruída do mundo da internet. Existem cerca de 2,1 bilhões de usuários de desktop em todo o mundo e mais de 4,3 bilhões de usuários móveis, sendo ele o meio comum para entrada de dados, interações e armazenamento de impressões digitais personalizadas.

Para os empreendedores, o verdadeiro potencial disruptivo não está na otimização do "output" da página. O verdadeiro ponto de ruptura está no "lado de input" - como fazer com que o AI Agent chame ativamente o produto do empreendedor para completar tarefas específicas. Isso se tornará a chave para saber se os produtos conseguirão se integrar no ecossistema Agent, obtendo fluxo e distribuição de valor.

Era de pesquisa escreve "clicar"; Era de代理 escreve "chamar".

Os empreendedores devem reimaginar o produto como componentes de API, permitindo que os agentes não apenas "leiam" isso, mas também "chamem" isso. O design do produto deve considerar três dimensões:

  1. Estrutura de interface padronizada: O produto é "chamável"?
  • As operações-chave podem ser descritas através de uma estrutura DOM semântica ou mapeamento JSON?
  • É fornecida uma máquina de estados, permitindo que o Agente reproduza de forma estável o fluxo de comportamento do usuário?
  • A interação do usuário suporta a restauração por script?
  • Possui um WebHook ou Endpoint API de acesso estável?
  1. Identidade e Acesso: Pode ajudar o Agente a "ultrapassar a barreira de confiança"?
  • Pode tornar-se um agente de IA para completar transações, invocar pagamentos ou ser uma camada intermediária confiável para ativos?
  • Para empreendedores de Crypto, pode-se considerar a construção da "MCP(Multi Capability Platform) do Mundo Blockchain".
  1. Compreensão do mecanismo de fluxo: o futuro não é SEO, é AEO/ATF
  • O produto deve ter uma granularidade de tarefa clara: não é "página", mas sim "unidade de capacidade chamável"
  • Começar a otimização do Agent ( AEO ) ou a adaptação do agendamento de tarefas ( ATF )
  • Adaptar a sintonização a diferentes estruturas LLM
Ver original
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
  • Recompensa
  • 6
  • Compartilhar
Comentário
0/400
PensionDestroyervip
· 7h atrás
o chrome acabou por envelhecer
Ver originalResponder0
YieldHuntervip
· 20h atrás
para ser sincero, a dominância do chrome é literalmente um ponzi agora... os dados mostram uma queda nos cliques orgânicos
Ver originalResponder0
GasFeeLovervip
· 20h atrás
A primeira rodada de sangue começou~ Finalmente chegamos a este dia
Ver originalResponder0
GasBanditvip
· 20h atrás
Como é que só há anúncios de pesquisa, pílulas do Google.
Ver originalResponder0
ForeverBuyingDipsvip
· 20h atrás
Sinto que o funeral do IE precisa ser refeito.
Ver originalResponder0
GateUser-00be86fcvip
· 20h atrás
A guerra dos navegadores voltou. Quem entende, entende.
Ver originalResponder0
  • Marcar
Faça trade de criptomoedas em qualquer lugar e a qualquer hora
qrCode
Escaneie o código para baixar o app da Gate
Comunidade
Português (Brasil)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)