La nueva guerra de navegadores impulsada por la IA: de la búsqueda a los agentes inteligentes, remodelando la entrada a la red.

La IA transformará los navegadores: nuevas tendencias en la tercera guerra de los navegadores

La tercera guerra de los navegadores está ocurriendo silenciosamente. Desde Netscape e IE en los años 90, hasta Firefox y Chrome, la lucha entre navegadores ha sido una manifestación concentrada del control de plataformas y el cambio en los paradigmas tecnológicos. Chrome ha ganado el estatus de líder gracias a su velocidad de actualización y la interconexión de su ecosistema, y Google ha formado un ciclo cerrado de entrada de información a través de su estructura de duopolio entre búsqueda y navegador.

Pero hoy en día, este patrón está comenzando a tambalearse. El auge de los grandes modelos de lenguaje (LLM) está haciendo que cada vez más usuarios completen tareas en la página de resultados de búsqueda con "cero clics", lo que está reduciendo el comportamiento tradicional de clics en páginas web. Al mismo tiempo, los rumores sobre que Apple podría reemplazar el motor de búsqueda predeterminado en Safari amenazan aún más la base de ganancias de Alphabet, y el mercado ha comenzado a mostrar inquietud sobre la "ortodoxia de la búsqueda".

El navegador en sí mismo también se enfrenta a una reconfiguración de su papel. No solo es una herramienta para mostrar páginas web, sino también un contenedor que reúne múltiples capacidades como la entrada de datos, el comportamiento del usuario y la identidad de la privacidad. Aunque el Agente de IA es poderoso, para completar interacciones complejas en la página, invocar datos de identidad locales y controlar elementos de la web, todavía necesita aprovechar los límites de confianza y el sandbox de funciones del navegador. El navegador está pasando de ser una interfaz humana a convertirse en una plataforma de llamadas del sistema para Agentes.

¿Todavía es necesario un navegador? Creemos que lo que realmente podría romper el actual panorama del mercado de navegadores no es otro "Chrome mejor", sino una nueva estructura de interacción: no la presentación de información, sino la invocación de tareas. El navegador del futuro debe estar diseñado para AI Agents - no solo puede leer, sino también escribir y ejecutar. Proyectos como Browser Use están intentando semantizar la estructura de la página, convirtiendo la interfaz visual en texto estructurado que puede ser invocado por LLM, logrando una mapeo de página a instrucciones, lo que reduce drásticamente el costo de interacción.

Los proyectos principales han comenzado a experimentar: Perplexity construye un navegador nativo llamado Comet, utilizando IA para reemplazar los resultados de búsqueda tradicionales; Brave combina la protección de la privacidad con el razonamiento local, mejorando las funciones de búsqueda y bloqueo con LLM; mientras que proyectos nativos de Crypto como Donut apuntan a nuevas entradas para la interacción entre IA y activos en cadena. La característica común de estos proyectos es: intentan reconstruir el extremo de entrada del navegador, en lugar de embellecer su capa de salida.

Para los emprendedores, las oportunidades se esconden en la relación triangular entre la entrada, la estructura y el agente. El navegador, como la interfaz que invoca al mundo en el futuro, significa que quien pueda proporcionar "bloques de capacidad" que sean estructurados, invocables y confiables, podrá convertirse en parte de la nueva generación de plataformas. Desde SEO hasta AEO( Agente Engine Optimization), desde el tráfico de la página hasta la invocación de cadenas de tareas, la forma del producto y el pensamiento de diseño se están reestructurando. La tercera guerra de los navegadores se lleva a cabo en la "entrada" y no en la "presentación"; lo que decide el ganador ya no es quién capta la atención del usuario, sino quién gana la confianza del Agente y obtiene la entrada a la invocación.

Breve historia del desarrollo de los navegadores

A principios de la década de 1990, Netscape Navigator abrió la puerta al mundo digital para millones de usuarios. Microsoft, reconociendo la importancia del navegador, forzó la inclusión de Internet Explorer en el sistema Windows, desmantelando la posición de dominio en el mercado de Netscape.

En medio de la adversidad, los ingenieros de Netscape decidieron hacer público el código fuente del navegador, que más tarde se convirtió en la base del proyecto Mozilla, y fue finalmente nombrado Firefox. Firefox logró varios avances en la experiencia del usuario, el ecosistema de complementos, la seguridad, entre otros, marcando la victoria del espíritu de código abierto.

Mientras tanto, el navegador Opera fue lanzado en 1994, y en 2003 introdujo su motor Presto desarrollado internamente, que soporta tecnologías de vanguardia como CSS y diseño adaptable. Ese mismo año, Apple lanzó el navegador Safari. En 2007, IE7 se lanzó con Windows Vista, pero la respuesta del mercado fue tibia. La cuota de mercado de Firefox aumentó de manera constante hasta aproximadamente el 20%, mientras que el dominio de IE comenzó a debilitarse.

Chrome se lanzó en 2008 y rápidamente se destacó gracias a su ritmo de actualizaciones frecuentes y una experiencia unificada en todas las plataformas. En noviembre de 2011, Chrome superó por primera vez a Firefox; seis meses después, volvió a superar a IE, completando la transición de ser un retador a convertirse en un dominador.

Al entrar en la década de 2020, la cuota de mercado de Chrome se mantiene estable en aproximadamente el 65%. El motor de búsqueda de Google y el navegador Chrome forman una estructura de doble monopolio, donde el primero controla alrededor del 90% de las entradas de búsqueda a nivel mundial, y el segundo tiene la mayoría de los usuarios accediendo a la red a través de su "primera ventana".

Con el auge de los modelos de lenguaje de gran escala (LLM), la búsqueda tradicional se ha visto afectada. En 2024, la cuota de mercado de búsqueda de Google cayó del 93% al 89%. Los rumores sobre que Apple podría lanzar su propio motor de búsqueda de IA podrían afectar aún más el pilar de beneficios de Alphabet.

Desde Navigator hasta Chrome, desde el ideal del código abierto hasta la comercialización de la publicidad, la competencia de navegadores siempre ha sido una guerra sobre tecnología, plataformas, contenido y control. Quien controla la entrada, define el futuro.

En la visión de los VC, apoyándose en la nueva demanda de las personas hacia los motores de búsqueda en la era de LLM y AI, la tercera guerra de los navegadores se está desarrollando gradualmente.

La arquitectura obsoleta de los navegadores modernos

La arquitectura tradicional de los navegadores incluye:

  1. Entrada del cliente en el frontend: completar la descifrado TLS, muestreo QoS y enrutamiento geográfico.

  2. Comprensión de la consulta: realizar corrección ortográfica, expansión de sinónimos y análisis de intenciones.

  3. Recuperación de candidatos: utilizar índices inversos e índices vectoriales para filtrar las páginas candidatas iniciales.

  4. Ordenación múltiple: Filtrar las páginas candidatas a aproximadamente 1000 a través de características ligeras.

  5. Aprendizaje profundo de clasificación principal: utilizar técnicas como RankBrain y Neural Matching para comprender la semántica de las consultas.

  6. Reordenamiento profundo: utilizar el modelo BERT para clasificar los documentos de manera más precisa.

Este es el flujo de trabajo típico del motor de búsqueda de Google. Pero en la actual era de la IA y los grandes datos, los usuarios han generado nuevas demandas en la interacción del navegador.

La IA transformará los navegadores

El navegador como entrada universal no solo se utiliza para leer datos, sino que los usuarios también necesitan interactuar con los datos. El navegador en sí es el lugar donde se almacenan las huellas dactilares del usuario. Comportamientos de usuario más complejos y comportamientos automatizados deben llevarse a cabo a través del navegador.

El navegador es un lugar de almacenamiento de contenido personalizado:

  • La mayoría de los modelos grandes se alojan en la nube, lo que dificulta la llamada directa a los datos sensibles locales.
  • Todos los datos deben ser enviados a un modelo de terceros, se necesita obtener nuevamente la autorización del usuario.
  • El llenado automático del código de verificación, la activación de la cámara, etc., debe completarse dentro del sandbox del navegador.
  • El contexto de los datos depende en gran medida del navegador, incluidos las pestañas, las cookies, etc.

Transformación profunda de las formas de interacción

El comportamiento de búsqueda de los usuarios está evolucionando. La investigación de 2024 muestra que, de cada 1000 consultas en Google en EE. UU., el 63% pertenece al comportamiento de "cero clics". Los usuarios tienden a obtener información directamente de la página de resultados de búsqueda.

El navegador de IA aún necesita explorar formas de interacción adecuadas, especialmente en lo que respecta a la lectura de datos, ya que el "problema de alucinación" de los grandes modelos aún no se ha erradicado, lo que dificulta que muchos usuarios confíen completamente en los resúmenes de contenido generados automáticamente.

Lo que realmente podría desencadenar una transformación masiva en los navegadores es la capa de interacción de datos. Los usuarios tienden cada vez más a usar el lenguaje natural para describir tareas complejas, y estas tareas Agénticas están siendo asumidas por Agentes de IA.

Los navegadores del futuro deben ser diseñados para la automatización total, considerando:

  • ¿Cómo equilibrar la experiencia de lectura humana con la interpretabilidad del agente AI?
  • Cómo servir a los usuarios y modelos de agentes en la misma página

Uso del Navegador

Browser Use ha construido una capa semántica en el verdadero sentido de la palabra, para construir una arquitectura de reconocimiento semántico para la próxima generación de navegadores. Re-decifra el tradicional "DOM=árbol de nodos para humanos" en "DOM semántico=árbol de instrucciones para LLM", permitiendo que el agente haga clic, complete y suba de manera precisa sin necesidad de "coordenadas de puntos de vista".

Esta ruta reemplaza el "texto estructurado → llamada a función" por OCR visual o coordenadas de Selenium, ejecutando más rápido, consumiendo menos tokens y cometiendo menos errores. TechCrunch lo llama "la capa de pegamento que permite a la IA entender realmente las páginas web".

Principales características de Browser Use:

  • Abstract the interactive elements into JSON fragments, accompanied by metadata such as roles, visibility, etc.
  • Convertir toda la página en una "lista de nodos semánticos" aplanada, para que LLM la lea de una vez.
  • Recibir instrucciones de alto nivel de la salida de LLM y reproducirlas en un navegador real

Una vez que este conjunto de estándares sea introducido en el W3C, podrá resolver en gran medida los problemas de entrada en los navegadores.

ARC

La empresa Browser(Arc, la empresa matriz), se centra en el navegador DIA orientado a la IA. Sin embargo, su previsión es imprecisa y no logra distinguir claramente que la "interacción" está compuesta por dos dimensiones: entrada y salida.

En el lado de entrada, la IA puede mejorar la eficiencia de la interacción basada en comandos; sin embargo, en el lado de salida, este juicio está claramente desbalanceado, ignorando el papel central del navegador en la presentación de información y en la experiencia personalizada. El navegador, como plataforma que alberga datos privados y puede renderizar de manera universal interfaces de productos diversos, tiene limitaciones en el nivel de entrada, y la complejidad del lado de salida dificulta aún más su posible sustitución.

Lo que realmente puede sacudir a Chrome debe reformular fundamentalmente el modo de renderizado del navegador, adaptándolo a las necesidades de interacción bajo la dominación de AI Agent, especialmente en el diseño de la arquitectura del lado de entrada. Browser Use se centra en la transformación estructural de los mecanismos subyacentes del navegador, promoviendo la "atomización" o "modularización", cuya programabilidad y combinabilidad derivadas traerán un potencial disruptivo de gran alcance.

Perplejidad

Perplexity es un motor de búsqueda de IA conocido por su sistema de recomendaciones, con una valoración reciente de 14 mil millones de dólares. Su principal característica es el resumen en tiempo real de las páginas, lo que le da una ventaja en la obtención de información instantánea. Perplexity lanzará el navegador nativo Comet, que estará profundamente integrado en su motor de respuestas.

Sin embargo, Perplexity aún necesita resolver el alto costo de búsqueda y el bajo margen de beneficio de los usuarios marginales. Google también está trabajando activamente en la reestructuración de la IA, lanzando una nueva experiencia de pestaña del navegador AI Model.

Imitar únicamente las funciones superficiales difícilmente representa una verdadera amenaza para Google. Lo que realmente podría establecer un nuevo orden sería reestructurar la arquitectura del navegador desde la base, integrando LLM profundamente en el núcleo del navegador, logrando un cambio radical en la forma de interacción.

Valiente

Brave es el navegador más antiguo y exitoso de la industria Crypto, basado en la arquitectura Chromium. Su modelo de ganancias de Tokens a través de la privacidad y la navegación atrae a los usuarios. Sin embargo, la demanda de privacidad aún se centra principalmente en grupos de usuarios específicos, lo que dificulta desafiar a los gigantes existentes.

Los usuarios activos mensuales de Brave alcanzaron los 82.7 millones, con 35.6 millones de usuarios activos diarios, y una cuota de mercado de aproximadamente 1%-1.5%. Su volumen de búsquedas mensuales es de aproximadamente 1.34 mil millones de consultas, lo que representa alrededor del 0.3% de Google.

El plan de Brave es actualizarse a un navegador AI centrado en la privacidad. Sin embargo, debido a la limitada obtención de datos de los usuarios y un bajo grado de personalización de los modelos grandes, esto dificulta la rápida y precisa iteración del producto. En la próxima era del Navegador Agentic, Brave podría mantener una participación estable en un grupo específico de usuarios que valoran la privacidad, pero será difícil convertirse en un jugador principal.

Donut

El proyecto cripto emergente Donut ha recibido 7 millones de dólares en financiamiento Pre-seed. Su visión es lograr una capacidad integrada de "exploración - decisión - ejecución nativa de criptomonedas".

La clave en esta dirección radica en combinar la ruta de ejecución automática nativa de la criptografía. En el futuro, se espera que los Agentes reemplacen a los motores de búsqueda como la principal entrada de tráfico, y los emprendedores competirán por el tráfico de visitas y conversiones que trae la ejecución del Agente. La industria ya ha denominado a esta tendencia "AEO"(Respuesta/Optimización del Motor de Agente) o "ATF"(Cumplimiento de Tareas Agénticas).

Consejos para emprendedores

El navegador sigue siendo la "entrada principal" más grande del mundo de Internet que no ha sido reestructurada. Hay aproximadamente 2.1 mil millones de usuarios de escritorio en todo el mundo y más de 4.3 mil millones en dispositivos móviles, es el vehículo común para la entrada de datos, las interacciones y el almacenamiento de huellas dactilares personalizadas.

Para los emprendedores, lo que realmente tiene potencial disruptivo no es la optimización en el nivel de "salida de página". El verdadero punto de ruptura está en el "lado de entrada" - cómo hacer que el Agente de IA llame activamente al producto del emprendedor para completar tareas específicas. Esto se convertirá en la clave para que los futuros productos puedan integrarse en el ecosistema de Agentes, obteniendo tráfico y distribución de valor.

Buscar la era con "clic"; la era de los agentes con "invocación".

Los emprendedores deben reimaginar el producto como componentes de API, permitiendo que los agentes no solo puedan "entenderlo", sino también "llamarlo". El diseño del producto debe considerar tres dimensiones:

  1. Estandarización de la estructura de la interfaz: ¿el producto es "llamable"?
  • ¿Se pueden describir las operaciones clave a través de estructuras DOM semánticas o mapeos JSON?
  • ¿Se proporciona una máquina de estados para que el Agente pueda reproducir de manera estable el flujo de comportamiento del usuario?
  • ¿La interacción del usuario admite la restauración mediante scripts?
  • ¿Se dispone de un WebHook o Endpoint API de acceso estable?
  1. Identidad y acceso: ¿puede ayudar al Agente a "superar la barrera de confianza"?
  • ¿Puede convertirse en un agente de IA para completar transacciones, invocar pagos o ser una capa intermedia confiable para activos?
  • Para los emprendedores de Crypto, se puede considerar construir la "MCP(Plataforma de Múltiples Capacidades) del Mundo Blockchain".
  1. Comprensión del mecanismo de tráfico: el futuro no es SEO, es AEO/ATF
  • El producto debe tener una granularidad de tarea clara: no es "página", sino "unidad de capacidad invocable".
  • Comenzar a optimizar Agent ( AEO ) o adaptar la programación de tareas ( ATF )
  • Adaptación a la sintonización bajo diferentes marcos de LLM
Ver originales
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
  • Recompensa
  • 6
  • Compartir
Comentar
0/400
PensionDestroyervip
· hace7h
chrome al final se ha vuelto viejo
Ver originalesResponder0
YieldHuntervip
· hace20h
la verdad, el dominio de chrome es literalmente un ponzi rn... los datos muestran una disminución en los clics orgánicos
Ver originalesResponder0
GasFeeLovervip
· hace20h
¡La primera ronda de sangre ha comenzado~ Finalmente ha llegado este día!
Ver originalesResponder0
GasBanditvip
· hace20h
¿Por qué siempre son anuncios de búsqueda? Pastillas de Google.
Ver originalesResponder0
ForeverBuyingDipsvip
· hace20h
Siento que el funeral de IE tiene que hacerse de nuevo.
Ver originalesResponder0
GateUser-00be86fcvip
· hace20h
La guerra de los navegadores ha vuelto. Los que entienden, entienden.
Ver originalesResponder0
  • Anclado
Opere con criptomonedas en cualquier momento y lugar
qrCode
Escanee para descargar la aplicación Gate
Comunidad
Español
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)