This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
AI駆動のブラウザ新戦争:検索からスマートエージェントへ ネットの入口を再構築する
AIがブラウザを再構築する: 第三のブラウザ戦争の新たなトレンド
第三次ブラウザ戦争が静かに展開しています。1990年代のNetscapeやIE、そしてFirefoxとChromeに至るまで、ブラウザの争いはプラットフォームの制御権と技術のパラダイムシフトを集中して示しています。Chromeは更新速度とエコシステムの連携により覇権を獲得し、Googleは検索とブラウザの二重寡頭構造によって情報の入り口のクローズド・ループを形成しています。
しかし、現在、この構図は揺らいでいます。大規模言語モデル(LLM)の台頭により、ますます多くのユーザーが検索結果ページで「ゼロクリック」でタスクを完了し、従来のウェブページクリック行動が減少しています。同時に、AppleがSafariでデフォルトの検索エンジンを置き換える可能性に関する噂が、Alphabetの利益基盤にさらに脅威を与え、「検索の正統性」に対する市場の不安がすでに表れています。
ブラウザ自体も役割の再構築に直面しています。それは単にウェブページを表示するツールではなく、データ入力、ユーザー行動、プライバシーアイデンティティなどのさまざまな機能の集合体です。AIエージェントは強力ですが、複雑なページインタラクションを実行したり、ローカルのアイデンティティデータを呼び出したり、ウェブページの要素を制御したりするには、ブラウザの信頼の境界と機能のサンドボックスを利用する必要があります。ブラウザは人間のインターフェースから、エージェントのシステムコールプラットフォームに変わりつつあります。
ブラウザはまだ存在する必要があるのか?私たちは、現在のブラウザ市場の構図を打破する可能性があるのは、別の「より良いChrome」ではなく、新しいインタラクション構造であると考えています。それは情報の表示ではなく、タスクの呼び出しです。未来のブラウザはAIエージェントのために設計される必要があります - 読むことができるだけでなく、書くことも実行することもできるのです。Browser Useなどのプロジェクトは、ページ構造をセマンティックにし、視覚的なインターフェースをLLMが呼び出すことができる構造化されたテキストに変えることを試みており、ページから命令へのマッピングを実現し、インタラクションコストを大幅に削減します。
主流プロジェクトが試験的に水面に出始めました: PerplexityはネイティブブラウザCometを構築し、AIを使って従来の検索結果を置き換えています; Braveはプライバシー保護とローカル推論を組み合わせ、LLMを用いて検索とブロック機能を強化しています; そして、DonutなどのCryptoネイティブプロジェクトは、AIとチェーン上の資産のインタラクションの新たな入り口を狙っています。これらのプロジェクトの共通の特徴は、出力層を美化するのではなく、ブラウザの入力端を再構築しようとしている点です。
起業家にとって、機会は入力、構造、エージェントの三角関係の中に隠されています。ブラウザは未来のエージェントが世界を呼び出すインターフェースとして、誰が構造化され、呼び出し可能で信頼できる「能力ブロック」を提供できるかによって、新しいプラットフォームの構成要素になれることを意味します。SEOからAEO(エージェントエンジン最適化)まで、ページトラフィックからタスクチェーンの呼び出しに至るまで、製品の形態とデザイン思考が再構築されています。第三次ブラウザ戦争は「入力」において発生し、「表示」ではありません。勝敗を決めるのは、もはや誰がユーザーの目を引くかではなく、誰がエージェントの信頼を獲得し、呼び出しの入り口を得るかです。
ブラウザの発展の簡単な歴史
1990年代初頭、Netscape Navigatorは数百万のユーザーにデジタル世界への扉を開きました。マイクロソフトはブラウザの重要性に気付き、Internet ExplorerをWindowsシステムに強制的にバンドルし、Netscapeの市場支配的地位を崩しました。
困難な状況の中で、Netscapeのエンジニアはブラウザのソースコードを公開することを選びました。このコードは後にMozillaプロジェクトの基礎となり、最終的にFirefoxと名付けられました。Firefoxはユーザーエクスペリエンス、プラグインエコシステム、安全性などの面で多くの突破口を実現し、オープンソース精神の勝利を象徴しています。
一方、Operaブラウザは1994年に登場し、2003年には独自に開発したPrestoエンジンを導入し、CSSやレスポンシブデザインなどの最先端技術をサポートしました。同年、AppleはSafariブラウザを発表しました。2007年には、IE7がWindows Vistaと共に登場しましたが、市場の反応は平凡でした。Firefoxの市場シェアは約20%まで着実に増加し、IEの支配力は徐々に緩んでいきました。
Chromeは2008年に登場し、頻繁なアップデートと全プラットフォームでの統一された体験により急速に成長しました。2011年11月、Chromeは初めてFirefoxを超え、6か月後にはIEを再逆転し、挑戦者から支配者への変革を遂げました。
2020年代に入ると、Chromeの世界市場シェアは約65%で安定しています。Google検索エンジンとChromeブラウザは二重独占構造を形成しており、前者は世界の約90%の検索入口を制御し、後者は大多数のユーザーがネットにアクセスする「第一の窓口」を掌握しています。
大型言語モデル(LLM)の台頭に伴い、従来の検索が影響を受けています。2024年、Googleの検索市場シェアは93%から89%に低下しました。Appleが独自のAI検索エンジンを発表する可能性に関する噂は、Alphabetの利益の柱を揺るがす可能性があります。
NavigatorからChromeへ、オープンソースの理想から広告の商業化へ、ブラウザ戦争は常に技術、プラットフォーム、コンテンツ、そしてコントロールの戦争でした。入口を握る者が未来を定義するのです。
VCの目には、LLMとAIの時代における人々の検索エンジンへの新たなニーズに依存して、第三次ブラウザ戦争が徐々に展開されている。
現代ブラウザの古いアーキテクチャ
従来のブラウザアーキテクチャには、
クライアントフロントエンドエントリ: TLSの復号化、QoSサンプリング、地理ルーティングを完了します。
クエリ理解: スペルチェック、同義語拡張、意図解析を行います。
候補の再取得: 倒転インデックスとベクトルインデックスを使用して初期候補ページをフィルタリングします。
マルチレベルソート: 軽量特徴を使用して候補ページを約1000件に絞り込みます。
ディープラーニングの主要なランキング: RankBrainやNeural Matchingなどの技術を使用して、クエリの意味を理解します。
深度再配置: BERTモデルを使用して文書をより詳細に排序します。
これは典型的なGoogle検索エンジンの作業フローです。しかし、現在のAIとビッグデータの時代において、ユーザーはブラウザのインタラクションに新しいニーズを持っています。
AIがブラウザを再構築する
ブラウザは汎用の入り口として、データの読み取りだけでなく、ユーザーがデータと対話するためにも使用されます。ブラウザ自体はユーザーのフィンガープリンツを保存する場所です。より複雑なユーザーの行動や自動化された行動は、ブラウザを媒体として行われなければなりません。
ブラウザはパーソナライズされたコンテンツの保存場所です:
インタラクション形式の深刻な変革
ユーザーの検索行動は進化しています。2024年の研究によると、アメリカでは1000回のGoogle検索のうち、63%が「ゼロクリック」行動に該当します。ユーザーは検索結果ページから直接情報を取得することに慣れています。
AIブラウザは、特にデータ読み取りの観点から、適切なインタラクション形式を探求する必要があります。現在の大規模モデルの「幻覚問題」がまだ解決されていないため、多くのユーザーは自動生成されたコンテンツの要約を完全には信頼できません。
ブラウザの大規模な変革を引き起こす可能性があるのは、データインタラクション層です。ユーザーはますます複雑なタスクを自然言語で表現することを好み、これらのエージェンティックタスクはAIエージェントによって引き継がれています。
未来のブラウザは完全自動化設計を考慮する必要があります:
ブラウザの使用
Browser Useは真の意味でのセマンティックレイヤーを構築し、次世代ブラウザのためのセマンティック認識アーキテクチャを作成しました。それは従来の「DOM=人が見るノードツリー」を「セマンティックDOM=LLMが見る指令ツリー」として再デコードし、代理人が「視点の座標」を必要とせずに正確にクリック、入力、およびアップロードできるようにします。
このルートは「構造化テキスト→関数呼び出し」で視覚OCRや座標Seleniumを置き換え、より迅速に実行し、トークンを節約し、エラーも少なくなります。TechCrunchはこれを「AIが本当にウェブページを理解するための接着剤層」と呼んでいます。
ブラウザの使用の主な機能:
この標準がW3Cに導入されると、ブラウザの入力問題を大きく解決できる。
アーク
ブラウザ会社(Arcの親会社)は、AI向けブラウザDIAに焦点を当てています。しかし、その予測には偏りがあり、「インタラクション」が入力と出力の2つの次元で構成されることを明確に区別できていません。
入力側では、AIは命令型インタラクションの効率を向上させることができますが、出力側では、その判断が明らかに不均衡であり、情報の提示とパーソナライズされた体験におけるブラウザの核心的な役割を無視しています。ブラウザはプライベートデータを保持し、さまざまな製品インターフェースを一般的にレンダリングできるプラットフォームとして、入力層では代替性が限られ、出力側の複雑性がそれを覆すことをさらに難しくしています。
Chromeを真に揺るがすためには、ブラウザのレンダリングモードを根本的に再構築し、AIエージェント主導のインタラクションニーズに適応させる必要があります。特に入力側のアーキテクチャ設計が重要です。Browser Useはブラウザの基盤メカニズムにおける構造的変革に注目し、"原子化"または"モジュール化"を推進します。これにより生まれるプログラム可能性と組み合わせ性は、極めて破壊的な革新の潜在力をもたらします。
パープレキシティ
Perplexityは推薦システムで知られるAI検索エンジンで、最新の評価は140億ドルです。その主な特徴はリアルタイムでページを要約することで、即時情報を取得する点で優位性を持っています。PerplexityはネイティブブラウザCometを発表し、回答エンジンに深く組み込む予定です。
しかし、Perplexityはまだ高い検索コストと限界ユーザーの低い利益率の問題を解決する必要があります。GoogleもAIの再構築を積極的に進めており、新しいブラウザタブ体験AIモデルを発表しました。
表面的機能だけではGoogleに本当に脅威を与えることは難しい。新しい秩序を確立する可能性があるのは、ブラウザのアーキテクチャを根本的に再構築し、LLMをブラウザのコアに深く埋め込むことによって、インタラクションの方法に根本的な変革をもたらすことである。
ブレイブ
BraveはCrypto業界で最も早く、最も成功したブラウザで、Chromiumアーキテクチャに基づいています。プライバシーとブラウジングによってトークンを獲得するモデルでユーザーを引き付けています。しかし、プライバシーの要求は依然として特定のユーザー層に集中しており、既存の巨人を覆すのは難しいです。
Braveの月間アクティブユーザーは8270万人、日間アクティブユーザーは3560万人で、市場シェアは約1%-1.5%です。月間平均検索クエリ数は約13.4億回で、Googleの約0.3%に相当します。
Braveはプライバシー優先のAIブラウザにアップグレードする計画です。しかし、ユーザーデータの取得が少なく、大規模モデルのカスタマイズ性が低いため、迅速かつ正確な製品の反復が難しくなっています。今後のエージェンティックブラウザ時代において、Braveは特定のプライバシーを重視するユーザー層の中で安定したシェアを維持する可能性がありますが、主要なプレイヤーになるのは難しいでしょう。
ドーナツ
暗号通貨スタートアップのDonutが700万ドルのプレシード資金調達を受けました。そのビジョンは「探索-決定-暗号ネイティブ実行」の統合能力を実現することです。
この方向性の核心は、暗号ネイティブな自動実行パスを組み合わせることにあります。将来的には、エージェントが検索エンジンに代わって主要なトラフィックの入り口になることが期待されており、起業家たちはエージェントの実行によってもたらされる訪問と転換のトラフィックを争うことになります。業界ではこの傾向を「AEO」(Answer/Agent Engine Optimization)または「ATF」(Agentic Task Fulfilment)と呼んでいます。
起業家へのアドバイス
ブラウザ自体は依然としてインターネット世界で最大の再構築されていない「総入口」です。世界のデスクトップユーザーは約21億人、モバイル端末は超43億人であり、それはデータ入力、インタラクション行動、個性化されたフィンガープリンティングの共通の媒体です。
起業家にとって、真に破壊的な潜在能力を持つのは「ページ出力」レベルの最適化ではありません。本当の突破口は「入力側」にあります - どのようにAIエージェントが起業家の製品を積極的に呼び出して具体的なタスクを完了させるかです。これは、将来の製品がエージェントエコシステムに組み込まれ、トラフィックと価値の分配を得ることができるかどうかの鍵となるでしょう。
検索時代の「クリック」;代理時代の「呼び出し」。
起業家は製品をAPIコンポーネントとして再想像し、エージェントがそれを「理解する」だけでなく、「呼び出す」ことができるようにするべきです。製品設計は三つの次元を考慮する必要があります: