أصبحت مشاريع الويب 3 التي تركز على مفهوم الذكاء الاصطناعي أهدافًا لجذب الاستثمارات في السوقين الأول والثاني.
تظهر فرص Web3 في صناعة الذكاء الاصطناعي في: استخدام الحوافز الموزعة لتنسيق العرض المحتمل في ذيل طويل - عبر البيانات والتخزين والحوسبة؛ في الوقت نفسه، بناء نموذج مفتوح المصدر وسوق لامركزي لوكلاء الذكاء الاصطناعي.
تستخدم الذكاء الاصطناعي في صناعة Web3 بشكل رئيسي في التمويل على السلسلة (المدفوعات المشفرة، التداول، تحليل البيانات) ودعم التطوير.
يظهر فائدة AI + Web3 في التكامل بينهما: من المتوقع أن يتصدى Web3 لتركز AI، ومن المتوقع أن يساعد AI Web3 في توسيع نطاقه.
في العامين الماضيين، تطور الذكاء الاصطناعي وكأنه تم الضغط على زر التسريع، هذه الفعالية الناتجة عن Chatgpt لم تفتح فقط عالماً جديداً للذكاء الاصطناعي التوليدي، بل أثارت أيضاً تياراً قوياً في Web3 على الجانب الآخر.
بدعم من مفهوم الذكاء الاصطناعي، كان هناك انتعاش ملحوظ في تمويل سوق العملات المشفرة المتباطئ. تظهر الإحصائيات أنه فقط في النصف الأول من عام 2024، تم تمويل 64 مشروعًا في Web3 + AI، حيث حقق نظام التشغيل المبني على الذكاء الاصطناعي Zyber365 أكبر مبلغ تمويل في الجولة A وهو 100 مليون دولار.
سوق الثانوي أكثر ازدهارًا، تظهر بيانات تجميع التشفير أنه في غضون أكثر من عام بقليل، وصلت القيمة السوقية الإجمالية لمجال الذكاء الاصطناعي إلى 48.5 مليار دولار، وحجم التداول خلال 24 ساعة يقترب من 8.6 مليار دولار؛ الفوائد الناتجة عن التقدم في التقنيات الرئيسية للذكاء الاصطناعي واضحة، بعد إصدار نموذج تحويل النص إلى فيديو Sora من OpenAI، ارتفع متوسط سعر قطاع الذكاء الاصطناعي بنسبة 151٪؛ كما أن تأثير الذكاء الاصطناعي يمتد أيضًا إلى أحد قطاعات جذب الأموال في العملات المشفرة، وهو Meme: مفهوم العملة الميمية الأول للذكاء الاصطناعي - GOAT حقق شهرة سريعة وحصل على تقييم يبلغ 1.4 مليار دولار، مما أدى إلى إثارة حمى ميم الذكاء الاصطناعي بنجاح.
تزداد الأبحاث والمواضيع المتعلقة بـ AI+Web3 سخونة، من AI+Depin إلى AI Memecoin وصولاً إلى AI Agent و AI DAO الحالية، فإن مشاعر FOMO لم تعد تتماشى مع سرعة تبديل السرد الجديد.
AI+Web3، هذه التركيبة من المصطلحات المليئة بالمال الساخن، والفرص، والأحلام المستقبلية، لا مفر من اعتبارها زواجاً مُرتباً من قبل رأس المال، يبدو أنه من الصعب علينا التمييز تحت هذه العباءة الفاخرة، هل هي ساحة المضاربين، أم أنها ليلة انفجار الفجر؟
للإجابة على هذا السؤال، فإن أحد الأفكار الأساسية التي تهم الطرفين هو: هل سيكون الوضع أفضل مع وجود الآخر؟ هل يمكن الاستفادة من نمط الآخر؟ في هذه المقالة، نحاول أيضًا أن نقف على أكتاف السابقين لفحص هذا النمط: كيف يمكن أن تلعب Web3 دورًا في مختلف جوانب تكنولوجيا AI، وماذا يمكن أن تجلب AI لWeb3 من حيوية جديدة؟
الجزء 1 ما هي الفرص المتاحة في Web3 تحت مجموعة الذكاء الاصطناعي؟
قبل الخوض في هذا الموضوع، نحتاج إلى فهم مجموعة التقنيات لنموذج الذكاء الاصطناعي الكبير:
استخدم لغة أكثر بساطة لوصف العملية بأكملها: "النموذج الكبير" يشبه دماغ الإنسان، في المرحلة المبكرة، ينتمي هذا الدماغ إلى طفل حديث الولادة، يحتاج إلى مراقبة واستيعاب كميات هائلة من المعلومات من العالم من حوله لفهم هذا العالم، وهذه هي مرحلة "جمع" البيانات؛ نظرًا لأن الكمبيوتر لا يمتلك حواس الإنسان مثل الرؤية والسمع، يجب تحويل المعلومات الضخمة غير المعلّمة من العالم الخارجي إلى تنسيق معلومات يمكن للكمبيوتر فهمه واستخدامه من خلال "المعالجة المسبقة" قبل التدريب.
بعد إدخال البيانات، يقوم الذكاء الاصطناعي ببناء نموذج قادر على الفهم والتنبؤ من خلال "التدريب"، ويمكن اعتباره عملية تدريجية لفهم وتعلم الطفل عن العالم الخارجي. تعتبر معلمات النموذج مثل القدرة اللغوية التي يتم تعديلها باستمرار خلال عملية تعلم الطفل. عندما يبدأ المحتوى التعليمي في التخصص، أو يتم الحصول على ردود فعل من التفاعل مع الآخرين وإجراء التصحيحات، يدخل في مرحلة "التعديل الدقيق" للنموذج الكبير.
عندما يكبر الأطفال تدريجياً ويتعلمون كيف يتحدثون، يمكنهم فهم المعاني والتعبير عن مشاعرهم وأفكارهم في محادثات جديدة. هذه المرحلة مشابهة لـ "الاستدلال" في نماذج الذكاء الاصطناعي الكبيرة، حيث يمكن للنموذج التنبؤ وتحليل المدخلات الجديدة من اللغة والنصوص. يعبر الأطفال من خلال القدرة اللغوية عن مشاعرهم، ويصفون الأشياء، ويحلّون مجموعة متنوعة من المشكلات، وهذا مشابه أيضاً لكيفية استخدام نماذج الذكاء الاصطناعي الكبيرة في مرحلة الاستدلال بعد إتمام التدريب، حيث تُطبق على أنواع معينة من المهام مثل تصنيف الصور والتعرف على الصوت.
ووكيل الذكاء الاصطناعي يقترب أكثر من الشكل التالي للنموذج الكبير - القدرة على تنفيذ المهام بشكل مستقل والسعي لتحقيق أهداف معقدة، ليس فقط لديه قدرة على التفكير، بل يمكنه أيضًا التذكر والتخطيط، ويمكنه استخدام الأدوات للتفاعل مع العالم.
في الوقت الحالي، وبالنظر إلى نقاط الألم المتعلقة بالذكاء الاصطناعي في مختلف الطبقات، بدأت Web3 في تشكيل نظام بيئي متعدد الطبقات ومترابط، يغطي جميع مراحل عملية نماذج الذكاء الاصطناعي.
واحد، الطبقة الأساسية: قوة الحوسبة والبيانات مثل Airbnb
قوة الحوسبة
حالياً، يعتبر أحد أعلى التكاليف في الذكاء الاصطناعي هو القوة الحاسوبية والطاقة المطلوبة لتدريب النماذج ونماذج الاستدلال.
مثال على ذلك هو أن LLAMA3 من Meta يحتاج إلى 16000 وحدة معالجة رسومات H100GPU من إنتاج NVIDIA (وهي وحدة معالجة رسومات متطورة مصممة خصيصًا لأعباء العمل في الذكاء الاصطناعي والحوسبة عالية الأداء). يستغرق التدريب 30 يومًا. سعر النسخة 80GB يتراوح بين 30000 إلى 40000 دولار، مما يتطلب استثمارًا في الأجهزة الحاسوبية (GPU + شرائح الشبكة) يتراوح بين 4-7 مليارات دولار، وفي نفس الوقت، يتطلب التدريب الشهري استهلاك 1.6 مليار كيلوواط ساعة، وتصل نفقات الطاقة الشهرية إلى حوالي 20 مليون دولار.
تعتبر فك ضغط قوة الذكاء الاصطناعي أحد المجالات التي تلاقت فيها Web3 مع الذكاء الاصطناعي في البداية - DePin (شبكة البنية التحتية المادية اللامركزية). حاليًا، تعرض مواقع إحصائيات البيانات أكثر من 1400 مشروع، من بينها مشاريع تمثيلية لمشاركة قوة GPU مثل io.net و Aethir و Akash و Render Network وغيرها.
المنطق الرئيسي هو: يسمح النظام للأفراد أو الكيانات الذين يمتلكون موارد GPU غير المستخدمة بالمساهمة بقدراتهم الحاسوبية بطريقة لامركزية دون الحاجة إلى إذن، من خلال سوق عبر الإنترنت للمشترين والبائعين مشابهة لـ Uber أو Airbnb، مما يزيد من استخدام موارد GPU غير المستغلة بشكل كافٍ، وبالتالي يحصل المستخدمون النهائيون على موارد حاسوبية فعالة بتكلفة أقل؛ في الوقت نفسه، تضمن آلية الرهن أنه في حالة حدوث انتهاكات لآلية مراقبة الجودة أو انقطاع الشبكة، فإن مقدمي الموارد سيتعرضون للعقوبات المناسبة.
تتميز بما يلي:
تجميع موارد GPU غير المستخدمة: الموردون هم بشكل رئيسي مراكز البيانات المستقلة الصغيرة والمتوسطة من الطرف الثالث، وموارد حسابية زائدة من مشغلي مناجم التشفير، والأجهزة المستخدمة في التعدين التي تعتمد على آلية الإجماع PoS، مثل أجهزة تعدين FileCoin و ETH. هناك أيضًا مشاريع تسعى إلى بدء تشغيل أجهزة ذات عتبات دخول أقل، مثل exolab التي تستخدم أجهزة MacBook و iPhone و iPad المحلية لإنشاء شبكة حسابية لتشغيل استدلال النماذج الكبيرة.
مواجهة سوق القوى الحاسوبية للذكاء الاصطناعي طويل الذيل:
أ. «من الناحية التقنية» فإن سوق القدرة الحاسوبية اللامركزية أكثر ملاءمة لخطوات الاستدلال. يعتمد التدريب بشكل أكبر على قدرة معالجة البيانات التي توفرها وحدات معالجة الرسومات (GPU) ذات الحجم الكبير جداً، بينما يعتبر أداء وحدات معالجة الرسومات في الاستدلال أقل نسبياً، مثل Aethir الذي يركز على أعمال العرض ذات الكمون المنخفض وتطبيقات الاستدلال بالذكاء الاصطناعي.
b. من حيث جانب الطلب، لن تقوم الأطراف ذات القوة الحاسوبية المتوسطة بتدريب نماذج كبيرة خاصة بها، بل ستختار فقط تحسين وتعديل النماذج الكبيرة القليلة الرائدة، وهذه السيناريوهات تتناسب بشكل طبيعي مع موارد القوة الحاسوبية غير المستخدمة الموزعة.
الملكية اللامركزية: المعنى التكنولوجي للبلوك تشين هو أن مالكي الموارد يحتفظون دائمًا بالتحكم في مواردهم، ويقومون بتعديلها بمرونة وفقًا للاحتياجات، وفي الوقت نفسه يحققون الأرباح.
بيانات
البيانات هي أساس الذكاء الاصطناعي. إذا لم تكن هناك بيانات، فإن الحساب يصبح بلا جدوى مثل الطحالب العائمة، وعلاقة البيانات بالنموذج تشبه المثل الشائع "مدخلات سيئة، مخرجات سيئة"، حيث تحدد كمية البيانات وجودة المدخلات جودة مخرجات النموذج النهائي. بالنسبة لتدريب نماذج الذكاء الاصطناعي الحالية، تحدد البيانات قدرة النموذج اللغوية، وقدرته على الفهم، وحتى القيم الإنسانية والتعبيرات الإنسانية. حاليًا، تركز معضلة احتياجات بيانات الذكاء الاصطناعي بشكل رئيسي على أربع مجالات رئيسية:
جوع البيانات: تعتمد نماذج الذكاء الاصطناعي على إدخال كميات هائلة من البيانات للتدريب. تشير المعلومات العامة إلى أن OpenAI قامت بتدريب GPT-4 بكمية من المعلمات تصل إلى تريليونات.
جودة البيانات: مع دمج الذكاء الاصطناعي مع مختلف الصناعات، تطرح الفعالية الزمنية للبيانات، وتنوع البيانات، واحترافية البيانات القطاعية، ومصادر البيانات الناشئة مثل إدخال مشاعر وسائل التواصل الاجتماعي متطلبات جديدة لجودتها.
قضايا الخصوصية والامتثال: بدأت الدول والشركات المختلفة في الوقت الحالي في إدراك أهمية مجموعات البيانات عالية الجودة، وتقوم بفرض قيود على جمع البيانات.
تكاليف معالجة البيانات مرتفعة: حجم البيانات كبير، وعملية المعالجة معقدة. تشير المعلومات العامة إلى أن أكثر من 30% من تكاليف البحث والتطوير لشركات الذكاء الاصطناعي تُستخدم لجمع البيانات الأساسية ومعالجتها.
حالياً، يتمثل حل web3 في أربعة جوانب:
1، جمع البيانات: البيانات الحقيقية التي يمكن الحصول عليها مجانًا أصبحت تتناقص بسرعة، حيث تزداد نفقات شركات الذكاء الاصطناعي المدفوعة للبيانات عامًا بعد عام. ولكن في الوقت نفسه، فإن هذه النفقات لم تعود بالفائدة على المساهمين الحقيقيين في البيانات، حيث تستفيد المنصات بالكامل من قيمة البيانات التي تخلقها، مثل Reddit التي حققت إيرادات تصل إلى 203 مليون دولار من خلال اتفاقيات ترخيص البيانات مع شركات الذكاء الاصطناعي.
تمكين المستخدمين الذين يسهمون فعلاً من المشاركة في خلق القيمة الناتجة عن البيانات، وكذلك الحصول على بيانات أكثر خصوصية وقيمة من المستخدمين بطريقة منخفضة التكلفة من خلال الشبكات الموزعة وآليات التحفيز، هو رؤية Web3.
Grass هي طبقة بيانات وشبكة لامركزية، يمكن للمستخدمين من خلالها تشغيل عقد Grass، والمساهمة بعرض النطاق الترددي الفائض ومرور البيانات لالتقاط البيانات الحية من جميع أنحاء الإنترنت، والحصول على مكافآت رمزية؛
Vana قد أدخلت مفهوم فريد من نوعه لبركة سيولة البيانات (DLP)، حيث يمكن للمستخدمين رفع بياناتهم الخاصة (مثل سجلات الشراء، عادات التصفح، أنشطة وسائل التواصل الاجتماعي، إلخ) إلى DLP معين، واختيار ما إذا كانوا يرغبون في منح إذن لاستخدام هذه البيانات لطرف ثالث معين؛
في PublicAI، يمكن للمستخدمين استخدام #AI 或#Web3 كوسم تصنيفي على X و@PublicAI لجمع البيانات.
معالجة البيانات: في عملية معالجة بيانات الذكاء الاصطناعي، نظرًا لأن البيانات المجمعة غالبًا ما تكون مشوشة وتحتوي على أخطاء، يجب تنظيفها وتحويلها إلى تنسيق قابل للاستخدام قبل تدريب النموذج، مما ينطوي على مهام متكررة تتعلق بالتوحيد والتصفية ومعالجة القيم المفقودة. هذه المرحلة هي واحدة من القليل من المراحل اليدوية في صناعة الذكاء الاصطناعي، وقد ظهرت منها صناعة مصنفي البيانات. مع زيادة متطلبات جودة البيانات من النماذج، ارتفع أيضًا مستوى الدخول لمصنفي البيانات، وهذه المهمة تناسب بشكل طبيعي آلية التحفيز اللامركزية في Web3.
في الوقت الحالي، تتطلع Grass و OpenLayer إلى الانضمام إلى هذه المرحلة الرئيسية من توضيح البيانات.
قدمت Synesis مفهوم "Train2earn"، مما يبرز جودة البيانات، حيث يمكن للمستخدمين الحصول على مكافآت من خلال تقديم بيانات موسومة، تعليقات أو أشكال أخرى من المدخلات.
مشروع توضيح البيانات Sapien يقوم بتحويل مهام التمييز إلى لعبة، ويسمح للمستخدمين بتخزين النقاط لكسب المزيد من النقاط.
3، خصوصية البيانات والأمان: من الضروري توضيح أن خصوصية البيانات والأمان هما مفهومين مختلفين. تتعلق خصوصية البيانات بمعالجة البيانات الحساسة، بينما تحمي أمان البيانات معلومات البيانات من الوصول غير المصرح به، والتدمير، والسرقة. ومن ثم، فإن مزايا تقنيات الخصوصية في Web3 وسيناريوهات تطبيقها المحتملة تتجلى في جانبين: (1) تدريب البيانات الحساسة؛ (2) التعاون في البيانات: يمكن لمالكي البيانات المتعددين المشاركة معًا في تدريب الذكاء الاصطناعي دون الحاجة إلى مشاركة بياناتهم الأصلية.
تشمل تقنيات الخصوصية الشائعة حاليًا في Web3 ما يلي:
بيئة تنفيذ موثوقة ( TEE )، مثل بروتوكول سوبر؛
التشفير المتجانس الكامل (FHE)، مثل BasedAI، Fhenix.io أو Inco Network؛
تقنية المعرفة الصفرية (zk)، مثل بروتوكول Reclaim الذي يستخدم تقنية zkTLS، تولد إثباتات المعرفة الصفرية لحركة مرور HTTPS، مما يسمح للمستخدمين باستيراد الأنشطة والسمعة وبيانات الهوية من مواقع خارجية بأمان دون الكشف عن معلومات حساسة.
ومع ذلك، لا يزال هذا المجال في مرحلة مبكرة، حيث لا تزال معظم المشاريع قيد الاستكشاف، وأحد التحديات الحالية هو ارتفاع تكاليف الحساب، ومن الأمثلة على ذلك:
إطار zkML EZKL يحتاج إلى حوالي 80 دقيقة
شاهد النسخة الأصلية
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
تسجيلات الإعجاب 15
أعجبني
15
6
مشاركة
تعليق
0/400
HodlKumamon
· منذ 8 س
تتحدث البيانات~ لقد تجاوزت نسبة 40% من حماس السوق عتبة القلق الشديد.
شاهد النسخة الأصليةرد0
GateUser-bd883c58
· منذ 8 س
赶紧 ادخل مركز囤点 AI عملة
شاهد النسخة الأصليةرد0
GasFeeBarbecue
· منذ 8 س
من الواضح جداً أنه في وقت ما ستقوم الذكاء الاصطناعي بإضافته داخل السلسلة.
شاهد النسخة الأصليةرد0
SchroedingerAirdrop
· منذ 8 س
هل هذا كل شيء؟ مفهوم الذكاء الاصطناعي قد تم استغلاله بشكل مفرط.
شاهد النسخة الأصليةرد0
MidnightTrader
· منذ 8 س
آه، يبدو أن الأمر سينتهي بمجرد الانتهاء من تداول المفهوم.
دمج الذكاء الاصطناعي مع Web3: تطبيقات وتقنيات اللامركزية في جميع مراحل الذكاء الاصطناعي والفرص المتاحة
AI+Web3: الأبراج والساحات
TL; د
أصبحت مشاريع الويب 3 التي تركز على مفهوم الذكاء الاصطناعي أهدافًا لجذب الاستثمارات في السوقين الأول والثاني.
تظهر فرص Web3 في صناعة الذكاء الاصطناعي في: استخدام الحوافز الموزعة لتنسيق العرض المحتمل في ذيل طويل - عبر البيانات والتخزين والحوسبة؛ في الوقت نفسه، بناء نموذج مفتوح المصدر وسوق لامركزي لوكلاء الذكاء الاصطناعي.
تستخدم الذكاء الاصطناعي في صناعة Web3 بشكل رئيسي في التمويل على السلسلة (المدفوعات المشفرة، التداول، تحليل البيانات) ودعم التطوير.
يظهر فائدة AI + Web3 في التكامل بينهما: من المتوقع أن يتصدى Web3 لتركز AI، ومن المتوقع أن يساعد AI Web3 في توسيع نطاقه.
! الذكاء الاصطناعي+Web3: الأبراج والساحات
المقدمة
في العامين الماضيين، تطور الذكاء الاصطناعي وكأنه تم الضغط على زر التسريع، هذه الفعالية الناتجة عن Chatgpt لم تفتح فقط عالماً جديداً للذكاء الاصطناعي التوليدي، بل أثارت أيضاً تياراً قوياً في Web3 على الجانب الآخر.
بدعم من مفهوم الذكاء الاصطناعي، كان هناك انتعاش ملحوظ في تمويل سوق العملات المشفرة المتباطئ. تظهر الإحصائيات أنه فقط في النصف الأول من عام 2024، تم تمويل 64 مشروعًا في Web3 + AI، حيث حقق نظام التشغيل المبني على الذكاء الاصطناعي Zyber365 أكبر مبلغ تمويل في الجولة A وهو 100 مليون دولار.
سوق الثانوي أكثر ازدهارًا، تظهر بيانات تجميع التشفير أنه في غضون أكثر من عام بقليل، وصلت القيمة السوقية الإجمالية لمجال الذكاء الاصطناعي إلى 48.5 مليار دولار، وحجم التداول خلال 24 ساعة يقترب من 8.6 مليار دولار؛ الفوائد الناتجة عن التقدم في التقنيات الرئيسية للذكاء الاصطناعي واضحة، بعد إصدار نموذج تحويل النص إلى فيديو Sora من OpenAI، ارتفع متوسط سعر قطاع الذكاء الاصطناعي بنسبة 151٪؛ كما أن تأثير الذكاء الاصطناعي يمتد أيضًا إلى أحد قطاعات جذب الأموال في العملات المشفرة، وهو Meme: مفهوم العملة الميمية الأول للذكاء الاصطناعي - GOAT حقق شهرة سريعة وحصل على تقييم يبلغ 1.4 مليار دولار، مما أدى إلى إثارة حمى ميم الذكاء الاصطناعي بنجاح.
تزداد الأبحاث والمواضيع المتعلقة بـ AI+Web3 سخونة، من AI+Depin إلى AI Memecoin وصولاً إلى AI Agent و AI DAO الحالية، فإن مشاعر FOMO لم تعد تتماشى مع سرعة تبديل السرد الجديد.
AI+Web3، هذه التركيبة من المصطلحات المليئة بالمال الساخن، والفرص، والأحلام المستقبلية، لا مفر من اعتبارها زواجاً مُرتباً من قبل رأس المال، يبدو أنه من الصعب علينا التمييز تحت هذه العباءة الفاخرة، هل هي ساحة المضاربين، أم أنها ليلة انفجار الفجر؟
للإجابة على هذا السؤال، فإن أحد الأفكار الأساسية التي تهم الطرفين هو: هل سيكون الوضع أفضل مع وجود الآخر؟ هل يمكن الاستفادة من نمط الآخر؟ في هذه المقالة، نحاول أيضًا أن نقف على أكتاف السابقين لفحص هذا النمط: كيف يمكن أن تلعب Web3 دورًا في مختلف جوانب تكنولوجيا AI، وماذا يمكن أن تجلب AI لWeb3 من حيوية جديدة؟
الجزء 1 ما هي الفرص المتاحة في Web3 تحت مجموعة الذكاء الاصطناعي؟
قبل الخوض في هذا الموضوع، نحتاج إلى فهم مجموعة التقنيات لنموذج الذكاء الاصطناعي الكبير:
استخدم لغة أكثر بساطة لوصف العملية بأكملها: "النموذج الكبير" يشبه دماغ الإنسان، في المرحلة المبكرة، ينتمي هذا الدماغ إلى طفل حديث الولادة، يحتاج إلى مراقبة واستيعاب كميات هائلة من المعلومات من العالم من حوله لفهم هذا العالم، وهذه هي مرحلة "جمع" البيانات؛ نظرًا لأن الكمبيوتر لا يمتلك حواس الإنسان مثل الرؤية والسمع، يجب تحويل المعلومات الضخمة غير المعلّمة من العالم الخارجي إلى تنسيق معلومات يمكن للكمبيوتر فهمه واستخدامه من خلال "المعالجة المسبقة" قبل التدريب.
بعد إدخال البيانات، يقوم الذكاء الاصطناعي ببناء نموذج قادر على الفهم والتنبؤ من خلال "التدريب"، ويمكن اعتباره عملية تدريجية لفهم وتعلم الطفل عن العالم الخارجي. تعتبر معلمات النموذج مثل القدرة اللغوية التي يتم تعديلها باستمرار خلال عملية تعلم الطفل. عندما يبدأ المحتوى التعليمي في التخصص، أو يتم الحصول على ردود فعل من التفاعل مع الآخرين وإجراء التصحيحات، يدخل في مرحلة "التعديل الدقيق" للنموذج الكبير.
عندما يكبر الأطفال تدريجياً ويتعلمون كيف يتحدثون، يمكنهم فهم المعاني والتعبير عن مشاعرهم وأفكارهم في محادثات جديدة. هذه المرحلة مشابهة لـ "الاستدلال" في نماذج الذكاء الاصطناعي الكبيرة، حيث يمكن للنموذج التنبؤ وتحليل المدخلات الجديدة من اللغة والنصوص. يعبر الأطفال من خلال القدرة اللغوية عن مشاعرهم، ويصفون الأشياء، ويحلّون مجموعة متنوعة من المشكلات، وهذا مشابه أيضاً لكيفية استخدام نماذج الذكاء الاصطناعي الكبيرة في مرحلة الاستدلال بعد إتمام التدريب، حيث تُطبق على أنواع معينة من المهام مثل تصنيف الصور والتعرف على الصوت.
ووكيل الذكاء الاصطناعي يقترب أكثر من الشكل التالي للنموذج الكبير - القدرة على تنفيذ المهام بشكل مستقل والسعي لتحقيق أهداف معقدة، ليس فقط لديه قدرة على التفكير، بل يمكنه أيضًا التذكر والتخطيط، ويمكنه استخدام الأدوات للتفاعل مع العالم.
في الوقت الحالي، وبالنظر إلى نقاط الألم المتعلقة بالذكاء الاصطناعي في مختلف الطبقات، بدأت Web3 في تشكيل نظام بيئي متعدد الطبقات ومترابط، يغطي جميع مراحل عملية نماذج الذكاء الاصطناعي.
! الذكاء الاصطناعي+Web3: الأبراج والمربعات
واحد، الطبقة الأساسية: قوة الحوسبة والبيانات مثل Airbnb
قوة الحوسبة
حالياً، يعتبر أحد أعلى التكاليف في الذكاء الاصطناعي هو القوة الحاسوبية والطاقة المطلوبة لتدريب النماذج ونماذج الاستدلال.
مثال على ذلك هو أن LLAMA3 من Meta يحتاج إلى 16000 وحدة معالجة رسومات H100GPU من إنتاج NVIDIA (وهي وحدة معالجة رسومات متطورة مصممة خصيصًا لأعباء العمل في الذكاء الاصطناعي والحوسبة عالية الأداء). يستغرق التدريب 30 يومًا. سعر النسخة 80GB يتراوح بين 30000 إلى 40000 دولار، مما يتطلب استثمارًا في الأجهزة الحاسوبية (GPU + شرائح الشبكة) يتراوح بين 4-7 مليارات دولار، وفي نفس الوقت، يتطلب التدريب الشهري استهلاك 1.6 مليار كيلوواط ساعة، وتصل نفقات الطاقة الشهرية إلى حوالي 20 مليون دولار.
تعتبر فك ضغط قوة الذكاء الاصطناعي أحد المجالات التي تلاقت فيها Web3 مع الذكاء الاصطناعي في البداية - DePin (شبكة البنية التحتية المادية اللامركزية). حاليًا، تعرض مواقع إحصائيات البيانات أكثر من 1400 مشروع، من بينها مشاريع تمثيلية لمشاركة قوة GPU مثل io.net و Aethir و Akash و Render Network وغيرها.
المنطق الرئيسي هو: يسمح النظام للأفراد أو الكيانات الذين يمتلكون موارد GPU غير المستخدمة بالمساهمة بقدراتهم الحاسوبية بطريقة لامركزية دون الحاجة إلى إذن، من خلال سوق عبر الإنترنت للمشترين والبائعين مشابهة لـ Uber أو Airbnb، مما يزيد من استخدام موارد GPU غير المستغلة بشكل كافٍ، وبالتالي يحصل المستخدمون النهائيون على موارد حاسوبية فعالة بتكلفة أقل؛ في الوقت نفسه، تضمن آلية الرهن أنه في حالة حدوث انتهاكات لآلية مراقبة الجودة أو انقطاع الشبكة، فإن مقدمي الموارد سيتعرضون للعقوبات المناسبة.
تتميز بما يلي:
تجميع موارد GPU غير المستخدمة: الموردون هم بشكل رئيسي مراكز البيانات المستقلة الصغيرة والمتوسطة من الطرف الثالث، وموارد حسابية زائدة من مشغلي مناجم التشفير، والأجهزة المستخدمة في التعدين التي تعتمد على آلية الإجماع PoS، مثل أجهزة تعدين FileCoin و ETH. هناك أيضًا مشاريع تسعى إلى بدء تشغيل أجهزة ذات عتبات دخول أقل، مثل exolab التي تستخدم أجهزة MacBook و iPhone و iPad المحلية لإنشاء شبكة حسابية لتشغيل استدلال النماذج الكبيرة.
مواجهة سوق القوى الحاسوبية للذكاء الاصطناعي طويل الذيل:
أ. «من الناحية التقنية» فإن سوق القدرة الحاسوبية اللامركزية أكثر ملاءمة لخطوات الاستدلال. يعتمد التدريب بشكل أكبر على قدرة معالجة البيانات التي توفرها وحدات معالجة الرسومات (GPU) ذات الحجم الكبير جداً، بينما يعتبر أداء وحدات معالجة الرسومات في الاستدلال أقل نسبياً، مثل Aethir الذي يركز على أعمال العرض ذات الكمون المنخفض وتطبيقات الاستدلال بالذكاء الاصطناعي.
b. من حيث جانب الطلب، لن تقوم الأطراف ذات القوة الحاسوبية المتوسطة بتدريب نماذج كبيرة خاصة بها، بل ستختار فقط تحسين وتعديل النماذج الكبيرة القليلة الرائدة، وهذه السيناريوهات تتناسب بشكل طبيعي مع موارد القوة الحاسوبية غير المستخدمة الموزعة.
بيانات
البيانات هي أساس الذكاء الاصطناعي. إذا لم تكن هناك بيانات، فإن الحساب يصبح بلا جدوى مثل الطحالب العائمة، وعلاقة البيانات بالنموذج تشبه المثل الشائع "مدخلات سيئة، مخرجات سيئة"، حيث تحدد كمية البيانات وجودة المدخلات جودة مخرجات النموذج النهائي. بالنسبة لتدريب نماذج الذكاء الاصطناعي الحالية، تحدد البيانات قدرة النموذج اللغوية، وقدرته على الفهم، وحتى القيم الإنسانية والتعبيرات الإنسانية. حاليًا، تركز معضلة احتياجات بيانات الذكاء الاصطناعي بشكل رئيسي على أربع مجالات رئيسية:
جوع البيانات: تعتمد نماذج الذكاء الاصطناعي على إدخال كميات هائلة من البيانات للتدريب. تشير المعلومات العامة إلى أن OpenAI قامت بتدريب GPT-4 بكمية من المعلمات تصل إلى تريليونات.
جودة البيانات: مع دمج الذكاء الاصطناعي مع مختلف الصناعات، تطرح الفعالية الزمنية للبيانات، وتنوع البيانات، واحترافية البيانات القطاعية، ومصادر البيانات الناشئة مثل إدخال مشاعر وسائل التواصل الاجتماعي متطلبات جديدة لجودتها.
قضايا الخصوصية والامتثال: بدأت الدول والشركات المختلفة في الوقت الحالي في إدراك أهمية مجموعات البيانات عالية الجودة، وتقوم بفرض قيود على جمع البيانات.
تكاليف معالجة البيانات مرتفعة: حجم البيانات كبير، وعملية المعالجة معقدة. تشير المعلومات العامة إلى أن أكثر من 30% من تكاليف البحث والتطوير لشركات الذكاء الاصطناعي تُستخدم لجمع البيانات الأساسية ومعالجتها.
حالياً، يتمثل حل web3 في أربعة جوانب:
1، جمع البيانات: البيانات الحقيقية التي يمكن الحصول عليها مجانًا أصبحت تتناقص بسرعة، حيث تزداد نفقات شركات الذكاء الاصطناعي المدفوعة للبيانات عامًا بعد عام. ولكن في الوقت نفسه، فإن هذه النفقات لم تعود بالفائدة على المساهمين الحقيقيين في البيانات، حيث تستفيد المنصات بالكامل من قيمة البيانات التي تخلقها، مثل Reddit التي حققت إيرادات تصل إلى 203 مليون دولار من خلال اتفاقيات ترخيص البيانات مع شركات الذكاء الاصطناعي.
تمكين المستخدمين الذين يسهمون فعلاً من المشاركة في خلق القيمة الناتجة عن البيانات، وكذلك الحصول على بيانات أكثر خصوصية وقيمة من المستخدمين بطريقة منخفضة التكلفة من خلال الشبكات الموزعة وآليات التحفيز، هو رؤية Web3.
Grass هي طبقة بيانات وشبكة لامركزية، يمكن للمستخدمين من خلالها تشغيل عقد Grass، والمساهمة بعرض النطاق الترددي الفائض ومرور البيانات لالتقاط البيانات الحية من جميع أنحاء الإنترنت، والحصول على مكافآت رمزية؛
Vana قد أدخلت مفهوم فريد من نوعه لبركة سيولة البيانات (DLP)، حيث يمكن للمستخدمين رفع بياناتهم الخاصة (مثل سجلات الشراء، عادات التصفح، أنشطة وسائل التواصل الاجتماعي، إلخ) إلى DLP معين، واختيار ما إذا كانوا يرغبون في منح إذن لاستخدام هذه البيانات لطرف ثالث معين؛
في PublicAI، يمكن للمستخدمين استخدام #AI 或#Web3 كوسم تصنيفي على X و@PublicAI لجمع البيانات.
في الوقت الحالي، تتطلع Grass و OpenLayer إلى الانضمام إلى هذه المرحلة الرئيسية من توضيح البيانات.
قدمت Synesis مفهوم "Train2earn"، مما يبرز جودة البيانات، حيث يمكن للمستخدمين الحصول على مكافآت من خلال تقديم بيانات موسومة، تعليقات أو أشكال أخرى من المدخلات.
مشروع توضيح البيانات Sapien يقوم بتحويل مهام التمييز إلى لعبة، ويسمح للمستخدمين بتخزين النقاط لكسب المزيد من النقاط.
3، خصوصية البيانات والأمان: من الضروري توضيح أن خصوصية البيانات والأمان هما مفهومين مختلفين. تتعلق خصوصية البيانات بمعالجة البيانات الحساسة، بينما تحمي أمان البيانات معلومات البيانات من الوصول غير المصرح به، والتدمير، والسرقة. ومن ثم، فإن مزايا تقنيات الخصوصية في Web3 وسيناريوهات تطبيقها المحتملة تتجلى في جانبين: (1) تدريب البيانات الحساسة؛ (2) التعاون في البيانات: يمكن لمالكي البيانات المتعددين المشاركة معًا في تدريب الذكاء الاصطناعي دون الحاجة إلى مشاركة بياناتهم الأصلية.
تشمل تقنيات الخصوصية الشائعة حاليًا في Web3 ما يلي:
بيئة تنفيذ موثوقة ( TEE )، مثل بروتوكول سوبر؛
التشفير المتجانس الكامل (FHE)، مثل BasedAI، Fhenix.io أو Inco Network؛
تقنية المعرفة الصفرية (zk)، مثل بروتوكول Reclaim الذي يستخدم تقنية zkTLS، تولد إثباتات المعرفة الصفرية لحركة مرور HTTPS، مما يسمح للمستخدمين باستيراد الأنشطة والسمعة وبيانات الهوية من مواقع خارجية بأمان دون الكشف عن معلومات حساسة.
ومع ذلك، لا يزال هذا المجال في مرحلة مبكرة، حيث لا تزال معظم المشاريع قيد الاستكشاف، وأحد التحديات الحالية هو ارتفاع تكاليف الحساب، ومن الأمثلة على ذلك: