AI驱动浏览器新战争:从搜索到智能代理 重塑网络入口

AI将重塑浏览器:第三次浏览器战争的新趋势

第三次浏览器战争正在悄然展开。从上世纪90年代的Netscape、IE,再到Firefox与Chrome,浏览器之争一直是平台控制权与技术范式变迁的集中体现。Chrome凭借更新速度与生态联动夺得霸主地位,谷歌通过搜索与浏览器的双寡头结构,形成了信息入口的闭环。

但如今,这一格局正在动摇。大型语言模型(LLM)的崛起,使越来越多用户在搜索结果页"零点击"完成任务,传统网页点击行为正在减少。同时,有关苹果可能在Safari中替换默认搜索引擎的传闻,进一步威胁Alphabet的利润根基,市场对"搜索正统"的不安已显露端倪。

浏览器本身也正面临角色重塑。它不仅是展示网页的工具,更是数据输入、用户行为、隐私身份等多种能力的集合容器。AI Agent虽强,但若要完成复杂的页面交互、调用本地身份数据、控制网页元素,仍需借助浏览器的信任边界和功能沙盒。浏览器正从人类界面,变成Agent的系统调用平台。

浏览器是否还有存在的必要?我们认为真正可能打破当前浏览器市场格局的,不是另一个"更好的Chrome",而是一种新的交互结构:不是信息的展示,而是任务的调用。未来浏览器要为AI Agent设计 - 不仅能读,还能写和执行。Browser Use等项目正尝试将页面结构语义化,把可视化界面变成LLM可调用的结构化文本,实现页面到指令的映射,极大降低交互成本。

主流项目已开始试水:Perplexity构建原生浏览器Comet,用AI代替传统搜索结果;Brave把隐私保护与本地推理结合,用LLM增强搜索与屏蔽功能;而Donut等Crypto原生项目,则瞄准AI与链上资产交互的新入口。这些项目共同特征是:试图重构浏览器的输入端,而非美化其输出层。

对创业者而言,机遇藏在输入、结构与代理的三角关系中。浏览器作为未来Agent调用世界的接口,意味着谁能提供可结构化、可调用、可信任的"能力块",谁就能成为新一代平台的组成部分。从SEO到AEO(Agent Engine Optimization),从页面流量到任务链调用,产品形态与设计思维都在重构。第三次的浏览器战争,发生在"输入"而非"展示";决定胜负的,不再是谁抓住用户的眼球,而是谁赢得了Agent的信任,获得调用的入口。

浏览器发展简史

上世纪90年代初,Netscape Navigator为数以百万计用户打开了通往数字世界的大门。微软意识到浏览器的重要性,将Internet Explorer强行捆绑进Windows系统,瓦解了Netscape的市场主导地位。

困境中,Netscape工程师选择将浏览器源代码公开,这段代码后来成为Mozilla项目基础,最终定名为Firefox。Firefox在用户体验、插件生态、安全性等方面实现多项突破,标志着开源精神的胜利。

与此同时,Opera浏览器于1994年问世,2003年引入自研Presto引擎,支持CSS、自适应布局等前沿技术。同年,苹果推出Safari浏览器。2007年,IE7随Windows Vista推出,但市场反馈平平。Firefox市场份额稳步提升至约20%,IE统治逐渐松动。

Chrome于2008年问世,凭借频繁更新节奏与全平台统一体验迅速崛起。2011年11月,Chrome首次超越Firefox;六个月后又反超IE,完成从挑战者到主宰者的转变。

进入2020年代,Chrome全球市场份额稳定在约65%。Google搜索引擎与Chrome浏览器形成双重垄断结构,前者控制全球约九成搜索入口,后者掌握大多数用户进入网络的"第一窗口"。

随着大型语言模型(LLM)崛起,传统搜索受到冲击。2024年,Google搜索市场份额自93%跌至89%。有关苹果可能推出自有AI搜索引擎的传闻,更可能撼动Alphabet利润支柱。

从Navigator到Chrome,从开源理想到广告商业化,浏览器之争始终是关于技术、平台、内容与控制权的战争。谁掌握入口,谁就定义未来。

在VC眼中,依托LLM和AI时代人们对搜索引擎的新需求,第三次浏览器战争正在逐步展开。

现代浏览器的老旧架构

传统浏览器架构包括:

  1. 客户端前端入口:完成TLS解密、QoS采样和地理路由。

  2. 查询理解:进行拼写校正、同义词扩展、意图解析。

  3. 候选召回:使用倒排索引和向量索引筛选初步候选页面。

  4. 多级排序:通过轻特征将候选页面筛选至约1000篇。

  5. 深度学习主排序:使用RankBrain和Neural Matching等技术理解查询语义。

  6. 深度重排:使用BERT模型对文档进行更精细排序。

这是典型的Google搜索引擎工作流程。但在当前AI和大数据时代,用户对浏览器交互产生了新需求。

AI将重塑浏览器

浏览器作为通用入口,不仅用于读取数据,用户还需与数据交互。浏览器本身是存储用户指纹的场所。更复杂的用户行为和自动化行为,必须以浏览器为载体。

浏览器是个性化内容的存储场所:

  • 多数大型模型托管云端,难直接调用本机敏感数据。
  • 将全部数据送往第三方模型,需重新获得用户授权。
  • 自动填写验证码、调用摄像头等,必须在浏览器沙盒内完成。
  • 数据上下文高度依赖浏览器,包括标签页、Cookie等。

交互形式的深刻变革

用户搜索行为正在演化。2024年研究显示,美国每1000次Google查询中,63%属于"零点击"行为。用户习惯直接从搜索结果页获取信息。

AI浏览器仍需探索恰当交互形态,特别是在数据读取方面,因当前大模型"幻觉问题"仍未根除,许多用户难以完全信任自动生成内容摘要。

真正可能触发浏览器大规模变革的,是数据交互层。用户越来越倾向使用自然语言描述复杂任务,这些Agentic Tasks正被AI Agent接管。

未来浏览器必须为全自动化设计,考虑:

  • 如何兼顾人类阅读体验与AI Agent可解析性
  • 如何在同一页面上服务用户和代理模型

Browser Use

Browser Use构建了真正意义上的语义层,为下一代浏览器构建语义识别架构。它把传统"DOM=给人看的节点树"重新解码成"语义DOM=给LLM看的指令树",让代理无需"看片点坐标"就能精准点击、填写与上传。

这条路线以"结构化文本→函数调用"取代视觉OCR或坐标Selenium,执行更快、token更省、出错更少。TechCrunch称之为"让AI真正读懂网页的胶水层"。

Browser Use的主要特点:

  • 把可交互元素抽象成JSON片段,附带角色、可见性等元数据
  • 将整页转译成扁平化"语义节点清单",供LLM一次性读取
  • 接收LLM输出的高层指令,回放到真浏览器

一旦这套标准被引入W3C,可很大程度解决浏览器输入问题。

ARC

The Browser Company(Arc母公司)将重心放在面向AI的浏览器DIA上。但其预测存在偏差,未能清晰区分"交互"由输入与输出两个维度构成。

在输入侧,AI可提升指令式交互效率;但输出侧,该判断明显失衡,忽视了浏览器在信息呈现与个性化体验中的核心作用。浏览器作为容纳私密数据又能通用渲染多样化产品界面的平台,在输入层替代性有限,输出侧复杂性更使其难以被颠覆。

真正能撼动Chrome的,必须对浏览器渲染模式进行根本性重塑,使其适配AI Agent主导下的交互需求,尤其是输入侧架构设计。Browser Use关注浏览器底层机制的结构性变革,推进"原子化"或"模块化",由此衍生的可编程性与组合性将带来极具破坏力的颠覆潜力。

Perplexity

Perplexity是以推荐系统著称的AI搜索引擎,最新估值140亿美元。其主要特点是实时总结页面,在获取即时信息方面占优势。Perplexity将发布原生浏览器Comet,深度嵌入答案引擎。

然而,Perplexity仍需解决高搜索成本和边际用户低利润率问题。Google也在积极进行AI重塑,推出新的浏览器标签页体验AI Model。

仅凭表层功能模仿难以真正威胁Google。真正可能建立新秩序的,将是从底层重构浏览器架构、将LLM深度嵌入浏览器内核,在交互方式上实现根本性变革。

Brave

Brave是Crypto行业最早也最成功的浏览器,基于Chromium架构。其依靠隐私和浏览赚取Tokens模式吸引用户。但隐私需求仍主要集中于特定用户群体,难以颠覆现有巨头。

Brave月活跃用户达8270万,日活跃用户3560万,市场份额约1%-1.5%。其月均搜索查询量约13.4亿次,约为Google的0.3%。

Brave计划升级为隐私优先的AI浏览器。但受限于获取用户数据较少,大模型可定制化程度较低,不利于快速精准产品迭代。在即将到来的Agentic Browser时代,Brave或将在特定注重隐私用户群中保有稳定份额,但难成为主要玩家。

Donut

Crypto初创项目Donut获700万美元Pre-seed融资。其愿景在于实现"探索-决策-加密原生执行"的一体化能力。

这一方向核心在于结合加密原生的自动化执行路径。未来Agent有望取代搜索引擎成为主要流量入口,创业者将争夺Agent执行带来的访问和转化流量。业界已将这一趋势称为"AEO"(Answer/Agent Engine Optimization)或"ATF"(Agentic Task Fulfilment)。

给创业者的建议

Browser本身依旧是互联网世界最大的未被重构的"总入口"。全球桌面用户约21亿、移动端超43亿,它是数据输入、交互行为、个性化指纹存储的共同载体。

对创业者而言,真正具备颠覆潜力的并非"页面输出"层面优化。真正突破口在于"输入侧" - 如何使AI Agent主动调用创业者产品完成具体任务。这将成为未来产品能否嵌入Agent生态、获得流量与价值分配的关键。

搜索时代拼"点击";代理时代拼"调用"。

创业者应将产品重新想象成API组件,让智能体不仅能"读懂"它,更能"调用"它。产品设计需考虑三个维度:

  1. 接口结构标准化:产品是否"可调用"?
  • 关键操作是否可通过语义化DOM结构或JSON映射描述?
  • 是否提供状态机,使Agent能稳定复现用户行为流程?
  • 用户交互是否支持脚本化还原?
  • 是否具备稳定访问的WebHook或API Endpoint?
  1. 身份与通行:能否帮Agent"越过信任障壁"?
  • 能否成为AI代理完成交易、调用支付或资产的可信中间层?
  • 对Crypto创业者,可考虑构建"区块链世界的MCP(Multi Capability Platform)"。
  1. 流量机制再理解:未来不是SEO,是AEO/ATF
  • 产品要有清晰任务颗粒度:不是"页面",而是"可调用能力单元"
  • 开始做Agent优化(AEO)或任务调度适配(ATF)
  • 适配不同LLM框架下的调
此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
  • 赞赏
  • 6
  • 分享
评论
0/400
养老金毁灭者vip
· 9小时前
chrome终究还是老了
回复0
YieldHuntervip
· 22小时前
老实说,Chrome的主导地位现在简直就是一个庞氏骗局……数据表明自然点击量在下降
查看原文回复0
GasFeeLovervip
· 22小时前
第一轮血开始了~ 终于等到这一天
回复0
Gas Banditvip
· 22小时前
咋个都是搜广告 谷歌药丸
回复0
永远在抄底vip
· 23小时前
感觉IE的葬礼得重办一遍了
回复0
GateUser-00be86fcvip
· 23小时前
浏览器之战又来了 懂的人都懂
回复0
交易,随时随地
qrCode
扫码下载 Gate APP
社群列表
简体中文
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)