حرب المتصفحات الجديدة المدفوعة بالذكاء الاصطناعي: من البحث إلى الوكلاء الذكيين إعادة تشكيل بوابة الشبكة

ستعيد الذكاء الاصطناعي تشكيل المتصفحات: اتجاهات جديدة في الحرب الثالثة للمتصفحات

الحرب الثالثة للمتصفحات بدأت في التوسع بهدوء. من Netscape و IE في التسعينيات إلى Firefox و Chrome، كانت المنافسة بين المتصفحات دائمًا تجسيدًا مركزيًا لسيطرة المنصات وتغيرات نمط التكنولوجيا. تمكن Chrome من الحصول على هيمنة السوق بفضل سرعة التحديث والتكامل البيئي، وقامت Google من خلال الهيكل الثنائي بين محرك البحث والمتصفح بتشكيل حلقة مغلقة لدخول المعلومات.

لكن اليوم، هذا النمط بدأ يتزعزع. صعود نماذج اللغة الكبيرة (LLM) جعل المزيد والمزيد من المستخدمين يكملون المهام في صفحة نتائج البحث "بدون نقرات"، مما أدى إلى انخفاض سلوك النقر التقليدي على الويب. في الوقت نفسه، الشائعات حول احتمال أن تستبدل أبل محرك البحث الافتراضي في سفاري تهدد أساس أرباح Alphabet، وقد بدأت تظهر علامات القلق في السوق بشأن "سلطة البحث".

تواجه المتصفحات نفسها إعادة تشكيل للأدوار. فهي ليست مجرد أداة لعرض صفحات الويب، بل هي حاوية تجمع مجموعة من القدرات مثل إدخال البيانات، سلوك المستخدم، والخصوصية. على الرغم من قوة وكيل الذكاء الاصطناعي، إلا أنه لإجراء تفاعلات معقدة على الصفحات، واستدعاء بيانات الهوية المحلية، والتحكم في عناصر الويب، لا يزال من الضروري الاستفادة من حدود الثقة ووحدات التحكم الخاصة بالمتصفح. يتحول المتصفح من واجهة إنسانية إلى منصة استدعاء نظام للوكيل.

هل لا يزال هناك ضرورة لوجود المتصفح؟ نحن نعتقد أن ما يمكن أن يكسر بالفعل هيكل سوق المتصفحات الحالي ليس "كروم" آخر "أفضل"، بل هي بنية تفاعلية جديدة: ليست عرض المعلومات، بل استدعاء المهام. يجب أن تُصمم المتصفحات المستقبلية لوكلاء الذكاء الاصطناعي - لا يمكنها فقط القراءة، بل الكتابة والتنفيذ أيضًا. تحاول مشاريع مثل Browser Use جعل هيكل الصفحة دلاليًا، وتحويل الواجهة المرئية إلى نص هيكلي يمكن لوحدات LLM استدعاؤه، مما يحقق مطابقة بين الصفحة والتعليمات، ويقلل بشكل كبير من تكلفة التفاعل.

بدأت المشاريع الرائجة في تجربة جديدة: قامت Perplexity ببناء متصفح أصلي يسمى Comet، ليستخدم الذكاء الاصطناعي بدلًا من نتائج البحث التقليدية؛ ودمجت Brave بين حماية الخصوصية والتفكير المحلي، باستخدام LLM لتعزيز وظائف البحث والحجب؛ بينما تستهدف مشاريع مثل Donut وغيرها من المشاريع الأصلية في مجال التشفير، مدخلاً جديدًا للتفاعل بين الذكاء الاصطناعي والأصول على السلسلة. وتتمثل الميزة المشتركة لهذه المشاريع في: محاولة إعادة بناء واجهة إدخال المتصفح، بدلاً من تحسين طبقة الإخراج.

بالنسبة لرواد الأعمال، تكمن الفرص في العلاقة الثلاثية بين الإدخال، الهيكل، والوكلاء. يعد المتصفح كواجهة لاستدعاء العالم في المستقبل، مما يعني أن من يستطيع تقديم "كتل القدرة" القابلة للتنظيم، والقابلة للاستدعاء، والموثوقة، هو من يمكنه أن يصبح جزءًا من الجيل الجديد من المنصات. من SEO إلى AEO( تحسين محرك الوكلاء)، من تدفق الصفحات إلى استدعاء سلسلة المهام، يتم إعادة تشكيل أشكال المنتجات وأفكار التصميم. تحدث الحرب الثالثة للمتصفحات في "الإدخال" وليس "العرض"؛ لم يعد من يلتقط انتباه المستخدم هو من يحدد الفائز، بل من يكسب ثقة الوكيل ويحصل على مدخل الاستدعاء.

تاريخ تطور المتصفح

في أوائل التسعينيات من القرن الماضي، فتح متصفح Netscape Navigator أبواب العالم الرقمي لملايين المستخدمين. أدركت مايكروسوفت أهمية المتصفح، وقامت بإلزام دمج Internet Explorer في نظام Windows، مما أدى إلى تدمير الهيمنة السوقية لـ Netscape.

في ظل الأزمة، اختار مهندسو Netscape أن يجعلوا شفرة مصدر المتصفح علنية، وقد أصبحت هذه الشفرة لاحقًا أساس مشروع Mozilla، الذي تم تسميته في النهاية Firefox. حقق Firefox العديد من الاختراقات في تجربة المستخدم، وبيئة الإضافات، والأمان، مما يمثل انتصارًا لروح المصدر المفتوح.

في الوقت نفسه، تم إطلاق متصفح أوبرا في عام 1994، وأدخل محرك Presto الذي تم تطويره داخليًا في عام 2003، مما يدعم تقنيات متقدمة مثل CSS والتصميم المتجاوب. في نفس العام، أطلقت أبل متصفح سفاري. في عام 2007، تم إطلاق IE7 مع نظام Windows Vista، لكن ردود الفعل في السوق كانت متوسطة. كانت حصة فايرفوكس في السوق ترتفع بثبات لتصل إلى حوالي 20%، بينما بدأت هيمنة IE تتراجع.

ظهر متصفح كروم في عام 2008، وبرز بسرعة بفضل وتيرة التحديثات المتكررة وتجربة موحدة عبر جميع المنصات. في نوفمبر 2011، تجاوز كروم فايرفوكس لأول مرة؛ بعد ستة أشهر، تفوق مرة أخرى على إنترنت إكسبلورر، مكتملًا التحول من منافس إلى متسيد.

دخلت العقد 2020، واستقر حصة سوق Chrome العالمية عند حوالي 65%. تشكل محرك بحث Google ومتصفح Chrome هيكل احتكار مزدوج، حيث يتحكم الأول في حوالي 90% من مدخلات البحث العالمية، بينما يتحكم الثاني في "النافذة الأولى" التي يدخل من خلالها معظم المستخدمين إلى الشبكة.

مع ظهور نماذج اللغة الكبيرة (LLM)، تعرضت محركات البحث التقليدية لضغوط. في عام 2024، تراجع حصة سوق بحث Google من 93% إلى 89%. الشائعات حول احتمال إطلاق آبل لمحرك بحث AI خاص بها قد تهز العمود الفقري لأرباح Alphabet.

من Navigator إلى Chrome، ومن المثل العليا مفتوحة المصدر إلى الترويج التجاري، كانت المنافسة بين المتصفحات دائمًا حربًا حول التكنولوجيا، والمنصة، والمحتوى، والسيطرة. من يمتلك المدخل، هو من يحدد المستقبل.

في نظر رأس المال الاستثماري، ومع الاعتماد على LLM وAI، تتكشف الحرب الثالثة على المتصفحات تدريجياً بسبب الطلب الجديد للناس على محركات البحث.

بنية المتصفحات الحديثة القديمة

تتضمن بنية المتصفح التقليدية:

  1. واجهة دخول العميل: إكمال فك تشفير TLS، أخذ عينات QoS والتوجيه الجغرافي.

  2. فهم الاستعلام: إجراء تصحيح الإملاء، توسيع المرادفات، تحليل النوايا.

  3. استرجاع المرشحين: استخدام الفهارس العكسية وفهارس المتجهات لتصفية الصفحات المرشحة الأولية.

  4. الترتيب المتعدد المستويات: من خلال الميزات الخفيفة، يتم تصفية الصفحات المرشحة إلى حوالي 1000 صفحة.

  5. الترتيب الرئيسي للتعلم العميق: استخدام تقنيات مثل RankBrain و Neural Matching لفهم دلالة الاستعلام.

  6. إعادة ترتيب عميقة: استخدام نموذج BERT لترتيب الوثائق بشكل أكثر دقة.

هذه هي العملية النموذجية لمحرك بحث جوجل. ولكن في عصر الذكاء الاصطناعي والبيانات الضخمة الحالي، لدى المستخدمين احتياجات جديدة للتفاعل مع المتصفح.

ستعيد الذكاء الاصطناعي تشكيل المتصفح

تعتبر المتصفح كمدخل عام، وليس فقط لقراءة البيانات، بل يحتاج المستخدم أيضًا للتفاعل مع البيانات. المتصفح نفسه هو المكان الذي يتم فيه تخزين بصمة المستخدم. يجب أن تتم السلوكيات الأكثر تعقيدًا وسلوكيات الأتمتة عبر المتصفح.

المتصفح هو مكان لتخزين المحتوى المخصص:

  • معظم النماذج الكبيرة تستضيف في السحابة، مما يجعل من الصعب استدعاء البيانات الحساسة المحلية مباشرة.
  • يجب إرسال جميع البيانات إلى نموذج طرف ثالث، ويجب الحصول على إذن المستخدم مرة أخرى.
  • يجب إكمال ملء رمز التحقق تلقائيًا، واستخدام الكاميرا، وما إلى ذلك، داخل صندوق الرمل بالمتصفح.
  • يعتمد سياق البيانات بشكل كبير على المتصفح، بما في ذلك علامات التبويب، وملفات تعريف الارتباط، وغيرها.

التغيير العميق في أشكال التفاعل

سلوك بحث المستخدمين يتطور. أظهرت الأبحاث في عام 2024 أنه في كل 1000 استعلام على Google في الولايات المتحدة، 63% منها ينتمي إلى سلوك "عدم النقر". اعتاد المستخدمون على الحصول على المعلومات مباشرة من صفحة نتائج البحث.

لا يزال يتعين استكشاف أشكال التفاعل المناسبة لمتصفح الذكاء الاصطناعي، خاصةً في مجالات قراءة البيانات، نظرًا لأن "مشكلة الهلوسة" في النماذج الكبيرة الحالية لم يتم القضاء عليها بعد، مما يجعل العديد من المستخدمين يجدون صعوبة في الثقة تمامًا في الملخصات التي يتم إنشاؤها تلقائيًا.

إن الطبقة التفاعلية للبيانات هي التي قد تؤدي حقًا إلى تغييرات جذرية في المتصفح. يميل المستخدمون بشكل متزايد إلى استخدام لغة طبيعية لوصف المهام المعقدة، وهذه المهام الوكيلة تتولى السيطرة عليها وكلاء الذكاء الاصطناعي.

يجب أن يكون المتصفح المستقبلي مصممًا بالكامل للتشغيل التلقائي، مع مراعاة:

  • كيف نوازن بين تجربة قراءة الإنسان وقابلية تحليل وكيل الذكاء الاصطناعي
  • كيف تخدم المستخدمين ونموذج الوكيل على نفس الصفحة

استخدام المتصفح

بنى Browser Use طبقة دلالية بمعنى الكلمة، لبناء هيكلية التعرف على الدلالات للجيل القادم من المتصفحات. لقد أعاد فك تشفير "DOM=شجرة العقد المرئية" إلى "DOM الدلالي=شجرة التعليمات المرئية لـ LLM"، مما يسمح للوكيل بالنقر بدقة، والتعبئة، والتحميل دون الحاجة إلى "تنسيق نقاط العرض".

تستبدل هذه المسار "النص الهيكلي → استدعاء الدوال" OCR البصري أو Selenium الإحداثي، مما يجعل التنفيذ أسرع، واستخدام التوكن أقل، وأخطاء أقل. ووصفت TechCrunch ذلك بأنه "الغراء الذي يجعل الذكاء الاصطناعي يفهم الويب حقًا."

الخصائص الرئيسية لاستخدام المتصفح:

  • تجريد العناصر التفاعلية إلى قطع JSON، مع بيانات وصفية مثل الدور، والرؤية، وما إلى ذلك.
  • تحويل الصفحة بأكملها إلى "قائمة العقد الدلالية المسطحة" لقراءة LLM دفعة واحدة
  • استلام الأوامر العليا الناتجة عن LLM، وإعادة تشغيلها في المتصفح الحقيقي

بمجرد إدخال هذه المعايير في W3C، يمكن أن تحل بشكل كبير مشاكل إدخال المتصفح.

ARC

شركة المتصفح ( الأم ) تركز على متصفح DIA الموجه نحو الذكاء الاصطناعي. ومع ذلك، فإن توقعاتها تحتوي على انحراف، حيث فشلت في التمييز بوضوح بين "التفاعل" الذي يتكون من بعدي الإدخال والإخراج.

في جانب الإدخال، يمكن للذكاء الاصطناعي تعزيز كفاءة التفاعل القائم على الأوامر؛ لكن في جانب الإخراج، يبدو أن هذا الحكم غير متوازن، حيث يتجاهل الدور الأساسي للمتصفح في تقديم المعلومات وتجربة المستخدم الشخصية. يُعتبر المتصفح منصة تتضمن بيانات خاصة ويمكنها عرض واجهات منتجات متنوعة، لذا فإن بدائله محدودة في جانب الإدخال، بينما تعقيد جانب الإخراج يجعل من الصعب استبداله.

لإحداث تغيير حقيقي في Chrome، يجب أن يتم إعادة تشكيل وضع عرض المتصفح بشكل جذري ليتناسب مع متطلبات التفاعل تحت سيطرة وكلاء الذكاء الاصطناعي، وخاصةً تصميم هيكل الإدخال. تركز "استخدام المتصفح" على التغييرات الهيكلية في الآليات الأساسية للمتصفح، مما يدفع نحو "التفكيك" أو "الوحدات"، وستجلب القابلية للبرمجة والتركيب الناتجة عن ذلك إمكانيات تخريبية هائلة.

الارتباك

Perplexity هو محرك بحث AI مشهور بنظام التوصيات، وتبلغ قيمته الحالية 14 مليار دولار. تتمثل ميزته الرئيسية في تلخيص الصفحات في الوقت الفعلي، مما يمنحه ميزة في الحصول على المعلومات الفورية. ستطلق Perplexity متصفحًا أصليًا يسمى Comet، متكاملًا بشكل عميق في محرك الإجابات.

ومع ذلك، لا يزال يتعين على Perplexity معالجة مشكلة ارتفاع تكاليف البحث وانخفاض هامش الربح من المستخدمين. كما أن Google تعمل بنشاط على إعادة تشكيل الذكاء الاصطناعي، حيث أطلقت تجربة جديدة لصفحات التصفح باستخدام نموذج الذكاء الاصطناعي.

من الصعب على المقلدين فقط من خلال الوظائف السطحية تهديد Google حقًا. ما يمكن أن يؤسس النظام الجديد حقًا هو إعادة بناء بنية المتصفح من الأسفل، ودمج LLM بعمق في نواة المتصفح، وتحقيق تغييرات جذرية في طريقة التفاعل.

شجاع

Brave هو أحد أوائل وأكثر المتصفحات نجاحًا في صناعة Crypto، ويعتمد على هيكل Chromium. ويجذب المستخدمين من خلال نموذج كسب Tokens من خلال الخصوصية والتصفح. ومع ذلك، لا تزال احتياجات الخصوصية تتركز في الغالب على مجموعة معينة من المستخدمين، مما يجعل من الصعب الإطاحة بالعمالقة الحاليين.

بلغ عدد المستخدمين النشطين شهريًا في Brave 82.7 مليونًا، والمستخدمين النشطين يوميًا 35.6 مليونًا، وحصة السوق حوالي 1%-1.5%. يصل متوسط عدد استعلامات البحث الشهرية إلى حوالي 1.34 مليار استعلام، أي حوالي 0.3% من Google.

تخطط برايف لتحويل متصفحها إلى متصفح AI يركز على الخصوصية. ولكن بسبب قلة البيانات التي يمكن الحصول عليها من المستخدمين، ومستوى التخصيص المنخفض للنماذج الكبيرة، فإن هذا يعيق التطوير السريع والدقيق للمنتجات. في عصر متصفح Agentic القادم، من المحتمل أن تحتفظ برايف بحصة مستقرة بين فئة معينة من المستخدمين الذين يركزون على الخصوصية، لكنها ستواجه صعوبة في أن تصبح لاعباً رئيسياً.

دونات

حصل مشروع Donut الناشئ في مجال التشفير على تمويل بقيمة 7 مليون دولار في جولة ما قبل البذور. رؤيته تهدف إلى تحقيق قدرة متكاملة على "الاستكشاف-اتخاذ القرار-التنفيذ الأصلي للتشفير".

تتمثل جوهر هذا الاتجاه في دمج مسارات التنفيذ الآلي الأصلية للعملات المشفرة. من المتوقع أن تحل الوكلاء في المستقبل محل محركات البحث لتصبح المدخل الرئيسي لحركة المرور، حيث سيتنافس رواد الأعمال على الزيارات وتحويل حركة المرور الناتجة عن تنفيذ الوكلاء. وقد أطلق على هذا الاتجاه في الصناعة اسم "AEO"(تحسين محرك الوكيل/الإجابة) أو "ATF"(الوفاء بالمهام الوكيل).

نصائح لرواد الأعمال

لا يزال المتصفح هو "البوابة الرئيسية" الأكثر أهمية والتي لم يتم إعادة هيكلتها في عالم الإنترنت. هناك حوالي 2.1 مليار مستخدم على سطح المكتب و أكثر من 4.3 مليار مستخدم على الأجهزة المحمولة، وهو يحمل البيانات الإدخال، والتفاعلات، وتخزين بصمات الأصابع الشخصية.

بالنسبة لرجال الأعمال، فإن ما يمتلك القدرة الحقيقية على إحداث ثورة ليس تحسين "مستوى إخراج الصفحات". النقطة الحاسمة تكمن في "جانب الإدخال" - كيفية جعل وكيل الذكاء الاصطناعي يستدعي منتجات رواد الأعمال لإنجاز مهام محددة. سيكون هذا هو المفتاح لنجاح المنتجات في الاندماج في نظام وكلاء الذكاء الاصطناعي، والحصول على تدفق القيمة والتوزيع.

البحث عن عصر拼"انقر";代理时代拼"استدعاء".

يجب على رواد الأعمال إعادة تصور المنتج كمكونات API، بحيث لا يتمكن الوكيل من "فهمه" فقط، بل أيضًا من "استدعائه". يجب أن يأخذ تصميم المنتج في الاعتبار ثلاثة أبعاد:

  1. معيارية هيكل الواجهة: هل المنتج "قابل للاستدعاء"؟
  • هل يمكن وصف العمليات الأساسية من خلال هيكل DOM الدلالي أو خريطة JSON؟
  • هل توفر آلة حالة تتيح للوكيل إعادة إنتاج تدفق سلوك المستخدم بثبات؟
  • هل تدعم تفاعلات المستخدم الاستعادة النصية؟
  • هل لديك WebHook أو نقطة نهاية API يمكن الوصول إليها بشكل ثابت؟
  1. الهوية والتنقل: هل يمكن أن يساعد الوكيل على "تجاوز حواجز الثقة"؟
  • هل يمكن أن تصبح وكيل ذكاء اصطناعي لإتمام المعاملات، واستدعاء الدفع أو الأصول كطبقة وسيطة موثوقة؟
  • لمؤسسي العملات المشفرة، يمكن النظر في بناء "منصة متعددة القدرات MCP( لعالم blockchain)".
  1. فهم آلية التدفق مرة أخرى: المستقبل ليس SEO، بل هو AEO/ATF
  • يجب أن يكون للمنتج وضوح في حجم المهام: ليس "صفحة"، بل "وحدة قدرة يمكن استدعاؤها"
  • بدء تحسين الوكيل (AEO) أو تكيف جدولة المهام (ATF)
  • التكيف مع إعدادات مختلفة لإطار LLM
شاهد النسخة الأصلية
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
  • أعجبني
  • 6
  • مشاركة
تعليق
0/400
PensionDestroyervip
· منذ 7 س
chrome في النهاية أصبح قديمًا
شاهد النسخة الأصليةرد0
YieldHuntervip
· منذ 20 س
للأمانة، هيمنة كروم هي حرفياً مخطط بونزي حالياً... البيانات تظهر تراجع النقرات العضوية.
شاهد النسخة الأصليةرد0
GasFeeLovervip
· منذ 20 س
بدأت الجولة الأولى من الدم~ أخيرًا انتظرنا هذا اليوم
شاهد النسخة الأصليةرد0
GasBanditvip
· منذ 20 س
لماذا كل شيء هو إعلانات البحث؟ حبة جوجل
شاهد النسخة الأصليةرد0
ForeverBuyingDipsvip
· منذ 20 س
يبدو أن جنازة IE بحاجة إلى إعادة تنظيم مرة أخرى
شاهد النسخة الأصليةرد0
GateUser-00be86fcvip
· منذ 20 س
حرب المتصفحات عادت من جديد، من يفهم يعرف.
شاهد النسخة الأصليةرد0
  • تثبيت