من blockchain إلى LLM ، تفسير متعمق لتطور وتحديات تكنولوجيا فهرسة البيانات

منذ أن قرر ساتوشي ناكاموتو تضمين رسالة في كتلة التكوين ، خضع هيكل البيانات لسلسلة البيتكوين لسلسلة من التغييرات.

بدأت دراسة تطوير blockchain بعمق في عام 2022 ، وكان أول كتاب قرأته هو "Mastering Ethereum". هذا الكتاب ممتاز وقد زودني بالكثير من الفهم المتعمق لأساسيات Ethereum و Blockchain. ومع ذلك ، من منظور اليوم ، أصبحت بعض تقنيات التطوير في الكتاب قديمة إلى حد ما. تتضمن الخطوات الأولية تشغيل عقدة على جهاز كمبيوتر محمول شخصي ، حتى بالنسبة لتطبيق dApp للمحفظة ، والتي تتطلب تنزيل عقدة ضوئية من تلقاء نفسها. يعكس هذا نمط سلوك المطورين والمتسللين الأوائل في النظام الإيكولوجي لتطوير blockchain بين عامي 2015 و 2018.

في عام 2017 ، لم يكن لدينا أي مزودي خدمة عقدة. من منظور العرض والطلب ، تتمثل وظيفتها الرئيسية في إجراء المعاملات بسبب نشاط المستخدم المحدود. هذا يعني أن الحفاظ على عقدة كاملة أو استضافتها بنفسك لا يمثل عبئًا كبيرًا ، حيث لا توجد العديد من طلبات RPC لمعالجة الطلبات ونقلها بشكل متكرر. معظم المستخدمين الأوائل لـ Ethereum هم خبراء في التكنولوجيا. يتمتع هؤلاء المستخدمون الأوائل بفهم عميق لتطوير blockchain ويستخدمون للحفاظ على عقد Ethereum مباشرةً ، وإنشاء المعاملات ، وإدارة الحسابات من خلال سطر الأوامر أو بيئة التطوير المتكاملة.

لذلك ، يمكننا أن نلاحظ أن المشاريع المبكرة عادة ما يكون لها واجهة مستخدم / UX نظيفة للغاية. بعض هذه المشاريع ليس لها واجهة أمامية ، ونشاط المستخدم منخفض إلى حد ما. يتم تحديد خصائص هذه المشاريع بشكل أساسي من خلال عاملين: سلوك المستخدم وهيكل بيانات السلسلة.

** صعود موفري العقدة **

مع انضمام المزيد والمزيد من المستخدمين الذين ليس لديهم خلفية برمجية إلى شبكة blockchain ، تغيرت أيضًا البنية التقنية للتطبيقات اللامركزية. لقد تغير الوضع الأصلي لعقد الاستضافة من قبل المستخدمين تدريجيًا إلى عقد استضافة بواسطة أطراف المشروع

! [من blockchain إلى LLM ، تفسير متعمق لتطور وتحديات تقنية فهرسة البيانات] (https://img-cdn.gateio.im/resized-social/moments-69a80767fe-b883209529-dd1a6f-1c6801)

يميل الأشخاص إلى اختيار خدمات استضافة العقد ، ويرجع ذلك أساسًا إلى أن النمو السريع للبيانات على السلسلة يجعل تكلفة عقد الاستضافة الشخصية تزداد تدريجياً بمرور الوقت.

! [من blockchain إلى LLM ، تفسير متعمق لتطور وتحديات تقنية فهرسة البيانات] (https://img-cdn.gateio.im/resized-social/moments-69a80767fe-d41a5bbdfe-dd1a6f-1c6801)

ومع ذلك ، لا تزال عقد الاستضافة الذاتية من قبل فرق المشروع تمثل تحديًا لمطوري المشاريع الصغيرة ، مما يتطلب الاستثمار المستمر في الصيانة وتكاليف الأجهزة. لذلك ، عادة ما يتم تكليف عملية استضافة العقدة المعقدة هذه للشركات المتخصصة في صيانة العقد. ومن الجدير بالذكر أن توقيت إنشاء هذه الشركات وجمع الأموال على نطاق واسع يتزامن مع الاتجاه المتزايد للخدمات السحابية في صناعة التكنولوجيا في أمريكا الشمالية.

| مشروع | الفئة | تأسست منذ | | --- | --- | --- | | الكيمياء | العقد | 2017 | | انفورا | العقد | 2016 | | NowNodes | العقد | 2019 | | كويك نودز | العقد | 2017 | | مرساة | العقد | 2017 | | تشينستاك | العقد | 2018 |

! [من blockchain إلى LLM ، تفسير متعمق لتطور وتحديات تقنية فهرسة البيانات] (https://img-cdn.gateio.im/resized-social/moments-69a80767fe-4fb6b0d790-dd1a6f-1c6801)

ببساطة ، لا يمكن لاستضافة العقد عن بُعد أن تحل المشكلة تمامًا ، خاصة الآن بعد ظهور البروتوكولات ذات الصلة مثل DeFi و NFT. يحتاج المطورون إلى التعامل مع الكثير من مشاكل البيانات ، لأن البيانات التي توفرها عُقد blockchain نفسها تسمى البيانات الأولية ، وهي ليست موحدة ومُنظَّفة. يجب استخراج البيانات الموجودة فيه وتنظيفها وتحميلها.

على سبيل المثال ، افترض أنني مطور لمشروع NFT وأريد إجراء معاملات NFT أو عرض NFT. ثم تحتاج الواجهة الأمامية إلى قراءة بيانات NFT في حساب EOA الشخصي في الوقت الفعلي. NFT هو في الحقيقة مجرد شكل موحد من الرموز. إن امتلاك NFT يعني أنني أمتلك رمزًا مميزًا بمعرف فريد تم إنشاؤه بواسطة عقد NFT ، وصورة NFT هي في الواقع بيانات وصفية ، والتي قد تكون بيانات SVG أو رابط إلى صورة على IPFS. على الرغم من أن عميل Ethereum's Geth يوفر إرشادات الفهرسة ، إلا أنه بالنسبة لبعض المشاريع ذات المتطلبات الأمامية الكبيرة ، فإنه من غير العملي طلب Geth باستمرار ثم العودة إلى الواجهة الأمامية. بالنسبة لبعض الوظائف ، مثل مزاد الطلبات وتجميع معاملات NFT ، يجب تنفيذها خارج السلسلة لجمع تعليمات المستخدم ، ثم إرسال هذه التعليمات إلى السلسلة في الوقت المناسب.

لذلك ، ولدت طبقة بيانات بسيطة. من أجل تلبية متطلبات المستخدمين في الوقت الفعلي والدقة ، يحتاج طرف المشروع إلى بناء قاعدة بياناته الخاصة ووظائف تحليل البيانات.

! [من blockchain إلى LLM ، تفسير متعمق لتطور وتحديات تقنية فهرسة البيانات] (https://img-cdn.gateio.im/resized-social/moments-69a80767fe-e56eccd2db-dd1a6f-1c6801)

** كيف تطور مفهرس البيانات؟ **

عادة ما يكون بدء مشروع ما أمرًا بسيطًا نسبيًا. لديك فكرة ، حدد بعض الأهداف ، ابحث عن أفضل المهندسين ، وقم ببناء نموذج أولي عملي ، والذي يتضمن عادةً واجهة أمامية وبعض العقود الذكية.

ومع ذلك ، من الصعب جدًا تحديد حجم المشروع. يحتاج المرء إلى التفكير بعمق في هيكل التصميم من اليوم الأول للمشروع. خلاف ذلك ، يمكن أن تواجه مشكلات بسرعة ، والتي عادة ما أشير إليها باسم "مشاكل الجليد".

! [من blockchain إلى LLM ، تفسير متعمق لتطور وتحديات تقنية فهرسة البيانات] (https://img-cdn.gateio.im/resized-social/moments-69a80767fe-f4cd8f3bfd-dd1a6f-1c6801)

لقد اقترضت هذا المصطلح من فيلم "الرجل الحديدي" ، ويبدو أنه من المناسب جدًا وصف حالة معظم الشركات الناشئة. عندما تنمو الشركات الناشئة بسرعة (تجذب الكثير من المستخدمين) ، فإنها غالبًا ما تواجه مشاكل لأنهم لم يتوقعوها في المقام الأول. في الفيلم ، لم يتوقع الشرير أبدًا أن تطير معداته الحربية إلى الفضاء لأنه لم يأخذ في الحسبان "مشكلة الجليد". وبالمثل ، بالنسبة لمطوري العديد من مشاريع Web3 ، فإن "مشكلة التجميد" تتضمن التعامل مع العبء المتزايد للتبني الجماعي للمستخدمين. هذا يضع ضغطًا كبيرًا على جانب الخادم حيث ينمو عدد المستخدمين بشكل كبير. هناك أيضًا مشكلات متعلقة بـ blockchain نفسها ، مثل مشكلات الشبكة أو إيقاف تشغيل العقدة.

! [من blockchain إلى LLM ، تفسير متعمق لتطور وتحديات تقنية فهرسة البيانات] (https://img-cdn.gateio.im/resized-social/moments-69a80767fe-4542ac6171-dd1a6f-1c6801)

في معظم الأحيان ، إنها مشكلة خلفية. على سبيل المثال ، في بعض بروتوكولات ألعاب blockchain ، هذا الموقف ليس نادرًا. عندما خططوا لإضافة المزيد من الخوادم وتوظيف المزيد من مهندسي البيانات لتحليل البيانات الموجودة على السلسلة ، لم يتوقعوا مشاركة الكثير من المستخدمين. بحلول الوقت الذي أدركوا فيه ذلك ، كان الأوان قد فات. ولا يمكن حل هذه المشكلات الفنية بمجرد إضافة المزيد من المهندسين الخلفيين. كما قلت من قبل ، يجب تضمين هذه الاعتبارات في الخطة منذ البداية.

تتضمن المشكلة الثانية إضافة بلوكشين جديد. ربما تكون قد تجنبت مشكلات جانب الخادم في المقام الأول وظفت مجموعة من المهندسين الجيدين. ومع ذلك ، قد لا يكون المستخدمون سعداء باستخدام blockchain الحالي. إنهم يريدون أن تعمل خدمتك أيضًا على سلاسل شائعة أخرى مثل سلاسل zk أو سلاسل L2. قد يبدو هيكل مشروعك كما يلي:

! [من blockchain إلى LLM ، تفسير متعمق لتطور وتحديات تقنية فهرسة البيانات] (https://img-cdn.gateio.im/resized-social/moments-69a80767fe-369cff777c-dd1a6f-1c6801)

في هذا النوع من النظام ، لديك سيطرة كاملة على بياناتك ، مما يسمح بإدارة أفضل وزيادة الأمان. يحد النظام من طلبات الاتصال ، مما يقلل من مخاطر التحميل الزائد ويزيد الكفاءة. والإعداد متوافق مع الواجهة الأمامية ، مما يضمن تكاملًا سلسًا وتجربة مستخدم.

ومع ذلك ، تتضاعف تكاليف التشغيل والصيانة ، مما قد يشكل ضغطًا على مواردك. تتطلب إضافة blockchain جديدة في كل مرة عملاً متكررًا ، الأمر الذي قد يستغرق وقتًا طويلاً وغير فعال. يمكن أن يؤدي تحديد البيانات من مجموعات البيانات الكبيرة إلى تقليل أوقات الاستعلام ، مما قد يؤدي إلى إبطاء العملية. بسبب مشكلات شبكة blockchain مثل التراجع وإعادة التنظيم ، يمكن أن تصبح البيانات ملوثة ، مما يضر بسلامة البيانات وموثوقيتها.

تم تصميم المشاريع لتعكس أعضاء فريقك. إن إضافة المزيد من العقد ومحاولة بناء نظام يركز على الخلفية يعني أنك بحاجة إلى توظيف المزيد من المهندسين لتشغيل هذه العقد وفك تشفير البيانات الأولية.

يشبه هذا النموذج الأيام الأولى للإنترنت ، عندما اختار مطورو التطبيقات ومنصات التجارة الإلكترونية بناء مرافق IDC (مركز بيانات الإنترنت) الخاصة بهم. ومع ذلك ، مع نمو طلبات المستخدمين وانفجار حالة شبكة blockchain ، تسير التكلفة جنبًا إلى جنب مع تعقيد تصميم البرنامج. علاوة على ذلك ، فإن هذا النهج يعيق التوسع السريع في السوق. تتطلب بعض سلاسل الكتل العامة عالية الأداء عمليات عقدة كثيفة الأجهزة ، بينما تستهلك مزامنة البيانات وتنظيفها الموارد البشرية وتكاليف الوقت.

إذا كنت تحاول إنشاء سوق NFT قائم على blockchain أو لعبة رائعة ، فهل من المستغرب أن 65 ٪ من أعضاء فريقك هم مهندسو الخلفية ومهندسي البيانات؟

** ربما يتساءل المطورون عن سبب عدم قيام أحد بفك تشفير ونقل هذه البيانات على السلسلة لهم حتى يتمكنوا من التركيز على بناء منتجات أفضل. **

** أعتقد أن هذا هو سبب وجود المفهرسات. **

! [من blockchain إلى LLM ، تفسير متعمق لتطور وتحديات تقنية فهرسة البيانات] (https://img-cdn.gateio.im/resized-social/moments-69a80767fe-4251be93d1-dd1a6f-1c6801)

لتقليل صعوبة الوصول إلى تطبيقات Web3 وشبكات blockchain ، تختار العديد من فرق التطوير بما في ذلكنا دمج خطوات مثل صيانة عقدة الأرشيف ، و ETL للبيانات على السلسلة (استخراج وتحويل وتحميل) واستدعاءات قواعد البيانات. كانت هذه المهام تتطلب في الأصل من فريق المشروع الحفاظ على أنفسهم ، لكنهم الآن قد حققوا عمليات متكاملة من خلال توفير بيانات متعددة السلاسل وواجهات برمجة التطبيقات للعقدة.

بمساعدة واجهات برمجة التطبيقات هذه ، يمكن للمستخدمين تخصيص البيانات على السلسلة وفقًا لاحتياجاتهم. يغطي هذا كل شيء بدءًا من البيانات الوصفية الشائعة لـ NFT ، ومراقبة النشاط عبر السلسلة لعناوين محددة ، إلى تتبع بيانات المعاملات لمجمعات سيولة رمزية محددة. غالبًا ما أشير إلى هذا النهج كجزء من بنية مشاريع Web3 الحديثة.

! [من blockchain إلى LLM ، تفسير متعمق لتطور وتحديات تقنية فهرسة البيانات] (https://img-cdn.gateio.im/resized-social/moments-69a80767fe-680c32fec1-dd1a6f-1c6801)

سيتم تنفيذ تمويل وبناء مشاريع طبقة البيانات وطبقة المؤشر بشكل أساسي في عام 2022. أعتقد أن الممارسات التجارية لطبقة الفهرس ومشاريع طبقة البيانات هذه ترتبط ارتباطًا وثيقًا بتصميم بنية البيانات الأساسية الخاصة بها ، خاصةً بتصميم أنظمة OLAP (المعالجة التحليلية عبر الإنترنت). يعد اعتماد محرك أساسي مناسب هو المفتاح لتحسين أداء طبقة الفهرس ، بما في ذلك تحسين سرعة الفهرسة وضمان ثباتها. تشمل المحركات الشائعة الاستخدام Hive و Spark SQL و Presto و Kylin و Impala و Druid و ClickHouse وما إلى ذلك. من بينها ، ClickHouse هي قاعدة بيانات قوية تُستخدم على نطاق واسع في شركات الإنترنت ، وقد تم فتحها في عام 2016 وحصلت على تمويل بقيمة 250 مليون دولار أمريكي في عام 2021.

! [من blockchain إلى LLM ، تفسير متعمق لتطور وتحديات تقنية فهرسة البيانات] (https://img-cdn.gateio.im/resized-social/moments-69a80767fe-7af93de7f8-dd1a6f-1c6801)

لذلك ، أدى ظهور جيل جديد من قواعد البيانات وبنى تحسين فهرس البيانات المحسّن إلى إنشاء طبقة فهرس بيانات Web3. يتيح ذلك للشركات في هذا المجال تقديم خدمات API للبيانات بطريقة أسرع وأكثر كفاءة.

ومع ذلك ، لا يزال بناء فهرسة البيانات على السلسلة محاطًا بسحبتين مظلمتين.

اثنان من الغيوم الداكنة

** أول سحابة مظلمة ** تتعلق بتأثير استقرار شبكة blockchain على جانب الخادم. على الرغم من أن شبكة blockchain تتمتع باستقرار قوي ، إلا أن هذا ليس هو الحال أثناء نقل البيانات ومعالجتها. على سبيل المثال ، قد تشكل أحداث مثل عمليات إعادة التنظيم (reorgs) والتراجع (التراجع) لـ blockchain تحديات لاستقرار بيانات المفهرس.

تتم إعادة تنظيم blockchain عندما تفقد العقد التزامن مؤقتًا ، مما يتسبب في وجود نسختين مختلفتين من blockchain في نفس الوقت. يمكن أن تحدث مثل هذه المواقف بسبب فشل النظام أو تأخيرات الشبكة أو حتى السلوك الضار. عندما تتم مزامنة العقد ، فإنها ستتقارب إلى سلسلة رسمية واحدة ، وسيتم تجاهل الكتل "المتشعبة" البديلة السابقة.

بحلول وقت حدوث إعادة التنظيم ، قد يكون المفهرس قد قام بمعالجة البيانات من الكتل التي تم تجاهلها في النهاية ، مما أدى إلى تلويث قاعدة البيانات. لذلك ، يجب على المفهرسين التكيف مع هذا الموقف ، والتخلص من البيانات الموجودة على السلاسل غير الصالحة وإعادة معالجة البيانات على السلاسل المقبولة حديثًا.

! [من blockchain إلى LLM ، تفسير متعمق لتطور وتحديات تقنية فهرسة البيانات] (https://img-cdn.gateio.im/resized-social/moments-69a80767fe-a7067aa065-dd1a6f-1c6801)

قد تؤدي هذه التعديلات إلى زيادة استخدام الموارد ويحتمل أن تؤخر توافر البيانات. في الحالات القصوى ، يمكن لعمليات إعادة التنظيم المتكررة أو واسعة النطاق أن تؤثر بشدة على موثوقية وأداء الخدمات التي تعتمد على المفهرسات ، بما في ذلك تطبيقات Web3 التي تستخدم واجهات برمجة التطبيقات لجلب البيانات.

بالإضافة إلى ذلك ، نواجه مشكلات تتعلق بتوافق تنسيق البيانات وتنوع معايير البيانات عبر شبكات blockchain.

في مجال تقنية blockchain ، هناك العديد من الشبكات المختلفة ، لكل منها معايير بيانات فريدة خاصة بها. على سبيل المثال ، هناك سلاسل متوافقة مع EVM (Ethereum Virtual Machine) وسلاسل غير تابعة لـ EVM وسلاسل zk (المعرفة الصفرية) ، ولكل منها هيكل وتنسيق بيانات خاص به.

هذا بلا شك تحد كبير للمفهرسين. من أجل توفير بيانات مفيدة ودقيقة من خلال واجهات برمجة التطبيقات ، يجب أن يكون المفهرسون قادرين على التعامل مع تنسيقات البيانات المتنوعة هذه. ومع ذلك ، نظرًا لعدم وجود معيار عالمي لبيانات blockchain ، فقد يستخدم مفهرسون مختلفون معايير API مختلفة. يمكن أن يؤدي ذلك إلى مشكلات توافق البيانات ، حيث قد لا تكون البيانات المستخرجة والمُحولة من مفهرس واحد قابلة للاستخدام في نظام آخر.

! [من blockchain إلى LLM ، تفسير متعمق لتطور وتحديات تقنية فهرسة البيانات] (https://img-cdn.gateio.im/resized-social/moments-69a80767fe-7c810919fc-dd1a6f-1c6801)

بالإضافة إلى ذلك ، بينما يستكشف المطورون في هذا العالم متعدد السلاسل ، فإنهم غالبًا ما يواجهون التحدي المتمثل في التعامل مع معايير البيانات المختلفة هذه. قد لا يعمل الحل الذي يعمل مع شبكة blockchain مع شبكة أخرى ، مما يجعل من الصعب تطوير التطبيقات التي يمكنها التفاعل مع شبكات متعددة.

في الواقع ، فإن التحديات التي تواجه صناعة فهرسة blockchain تذكرنا بمشكلتين لم يتم حلهما في الفيزياء حددهما اللورد كلفن في أوائل القرن العشرين ، والتي أدت في النهاية إلى ولادة مجالات ثورية مثل ميكانيكا الكم والديناميكا الحرارية.

في مواجهة هذه التحديات ، اتخذت الصناعة بالفعل بعض الخطوات ، مثل إدخال زمن الوصول أو دمج التدفق في خط أنابيب كافكا ، وحتى إنشاء اتحاد معايير لتعزيز صناعة فهرسة blockchain. هذه التدابير قادرة حاليًا على معالجة عدم استقرار شبكات blockchain وتنوع معايير البيانات ، بحيث يمكن للمفهرسين توفير بيانات دقيقة وموثوقة.

ومع ذلك ، مثلما أحدث ظهور نظرية الكم ثورة في فهمنا للعالم المادي ، يمكننا أيضًا التفكير في طرق أكثر جذرية لتحسين البنية التحتية لبيانات blockchain.

** بعد كل شيء ، قد تبدو البنية التحتية الحالية ، بمستودعات البيانات ومكدساتها المنظمة بدقة ، مثالية جدًا وجميلة جدًا لدرجة يصعب تصديقها. **

لذا ، ** هل هناك طريقة أخرى؟ **

إيجاد الأنماط

دعنا نعود إلى الموضوع الأصلي حول ظهور موفري ومفهرسات العقدة ، وننظر في مشكلة غريبة. لماذا لم يظهر مشغلو العقدة في عام 2010 ، لكن ظهرت المفهرسات فجأة بأعداد كبيرة وحصلت على الكثير من الاستثمار في عام 2022؟

أعتقد أن ما ورد أعلاه قد أجاب جزئيًا على هذه الأسئلة. هذا بسبب الاستخدام الواسع لتقنيات الحوسبة السحابية وتخزين البيانات في صناعة البرمجيات ، وليس فقط في مجال التشفير.

في عالم التشفير ، حدث شيء خاص أيضًا ، خاصةً عندما أصبحت معايير ERC20 و ERC721 شائعة في وسائل الإعلام العامة. بالإضافة إلى ذلك ، جعل صيف DeFi البيانات على السلسلة أكثر تعقيدًا. يتم توجيه معاملات المكالمات المختلفة على عقود ذكية مختلفة ، بدلاً من بيانات المعاملات البسيطة كما في المرحلة المبكرة ، شهد تنسيق وتعقيد البيانات على السلسلة تغييرات ونموًا مفاجئًا.

! [من blockchain إلى LLM ، تفسير متعمق لتطور وتحديات تقنية فهرسة البيانات] (https://img-cdn.gateio.im/resized-social/moments-69a80767fe-0636140b99-dd1a6f-1c6801)

على الرغم من أنه في مجتمع العملات المشفرة ، فقد تم التأكيد دائمًا على الانفصال عن تقنية Web2 التقليدية ، ولكن ما لا يمكننا تجاهله هو أن تطوير البنية التحتية للعملات المشفرة يعتمد على التطوير المستمر والاختراقات في مجالات الرياضيات والتشفير والتكنولوجيا السحابية والبيانات الضخمة .. على غرار البنية الصينية التقليدية للنقر واللغة ، ترتبط المكونات المختلفة في النظام البيئي للعملات المشفرة ارتباطًا وثيقًا.

سيكون التقدم والتطبيق المبتكر للعلم والتكنولوجيا ملزمين دائمًا ببعض المبادئ الموضوعية. على سبيل المثال ، بدون الدعم الأساسي لتقنية تشفير المنحنى البيضاوي ، لا يمكن لنظامنا البيئي للعملات المشفرة اليوم أن يكون موجودًا. وبالمثل ، لم يكن التطبيق العملي لإثباتات المعرفة الصفرية ممكنًا لولا الورقة البحثية المهمة حول براهين المعرفة الصفرية التي نشرها معهد ماساتشوستس للتكنولوجيا في عام 1985. لذلك نرى نمطًا مثيرًا للاهتمام. \ * \ * يعتمد التطبيق الواسع والتوسع في مزودي خدمة العقدة على النمو السريع للخدمات السحابية العالمية وتقنية المحاكاة الافتراضية. \ * \ * في الوقت نفسه ، ** يعتمد تطوير طبقة البيانات في السلسلة على التطوير النشط لبنية وخدمات قاعدة بيانات مفتوحة المصدر ممتازة ** ، ** هذه البنى هي حلول البيانات التي تستخدمها العديد من منتجات ذكاء الأعمال الاعتماد عليها في السنوات الأخيرة **. هذه كلها متطلبات فنية أساسية يجب أن تلبيها الشركات الناشئة من أجل تحقيق الجدوى التجارية. عندما يتعلق الأمر بمشاريع Web3 ، فإن تلك التي تستخدم بنية تحتية متقدمة تميل إلى الحصول على ميزة على تلك التي تعتمد على بنى قديمة. يعد تآكل الحصة السوقية لشركة OpenSea من خلال تبادلات NFT الأسرع والأكثر سهولة في الاستخدام مثالًا حيًا.

بالإضافة إلى ذلك ، يمكننا أن نرى أيضًا اتجاهًا واضحًا: لقد نضجت تقنية الذكاء الاصطناعي (AI) و LLM تدريجياً ولديها إمكانية للتطبيق على نطاق واسع.

** لذلك ، يظهر سؤال مهم: كيف سيغير الذكاء الاصطناعي نمط البيانات على السلسلة؟ **

الكهانة

دائمًا ما يكون التنبؤ بالمستقبل محفوفًا بالصعوبات ، ولكن يمكننا استكشاف الإجابات المحتملة من خلال فهم المشكلات التي نواجهها في تطوير blockchain. ** لدى المطورين طلب واضح على البيانات على السلسلة: ما يحتاجون إليه هو بيانات على السلسلة دقيقة وفي الوقت المناسب وسهلة الفهم. **

إحدى المشكلات التي نواجهها حاليًا هي أن استعلامات SQL المعقدة مطلوبة للحصول على بيانات معينة أو عرضها على دفعات. هذا هو السبب في أن وظيفة SQL مفتوحة المصدر التي يوفرها Dune تحظى بشعبية كبيرة في مجتمع التشفير. لا يحتاج المستخدمون إلى كتابة SQL لإنشاء مخططات من البداية ، فهم يحتاجون فقط إلى تفرع وتعديل عنوان العقد الذكي الذي يريدون الانتباه إليه ، وبعد ذلك يمكنهم إنشاء المخططات التي يحتاجون إليها. ومع ذلك ، لا يزال هذا الأمر معقدًا للغاية بالنسبة للمستخدم العادي الذي يرغب فقط في عرض بيانات السيولة أو الإنزال الجوي في ظل ظروف معينة.

في رأيي ، فإن الخطوة الأولى في حل هذه المشكلة هي استخدام LLM ومعالجة اللغة الطبيعية.

يمكننا بناء واجهة "استعلام بيانات" أكثر تركيزًا على المستخدم والاستفادة من تقنيات LLM. في الحالات الحالية ، يجب على المستخدمين استخدام لغات الاستعلام المعقدة مثل SQL أو GraphQL لاستخراج البيانات المقابلة على السلسلة من واجهة برمجة التطبيقات أو الاستوديوهات. ومع ذلك ، باستخدام LLM ، يمكننا تقديم طريقة أكثر بديهية وشبيهة بالإنسان لطرح الأسئلة. بهذه الطريقة ، يمكن للمستخدمين التعبير عن أسئلتهم "بلغة طبيعية" ، وستقوم LLM بترجمتها إلى استعلامات مناسبة وتزويد المستخدمين بالإجابات التي يحتاجون إليها.

! [من blockchain إلى LLM ، تفسير متعمق لتطور وتحديات تقنية فهرسة البيانات] (https://img-cdn.gateio.im/resized-social/moments-69a80767fe-ceaafb4b46-dd1a6f-1c6801)

من وجهة نظر المطورين ، يمكن للذكاء الاصطناعي أيضًا تحسين تحليل أحداث العقد على السلسلة وفك تشفير ABI. حاليًا ، تتطلب تفاصيل العديد من عقود DeFi من المطورين تحليلها وفك تشفيرها يدويًا. ومع ذلك ، إذا تم تقديم الذكاء الاصطناعي ، فيمكننا تحسين تقنيات تفكيك العقود المختلفة واسترداد ABI المقابل بسرعة. إلى جانب نموذج اللغة الكبير (LLM) ، يمكن لهذا التكوين تحليل تواقيع الوظائف بذكاء والتعامل بكفاءة مع أنواع البيانات المختلفة. علاوة على ذلك ، عندما يتم دمج النظام مع إطار معالجة "حوسبة التدفق" ، يمكنه معالجة تحليل بيانات المعاملات في الوقت الفعلي لتلبية الاحتياجات الفورية للمستخدمين.

من منظور عالمي ، فإن الهدف من المفهرس هو تزويد المستخدمين ببيانات دقيقة. كما أوضحت من قبل ، تتمثل المشكلة المحتملة في طبقة البيانات على السلسلة في أن الأجزاء الفردية من البيانات مبعثرة عبر قواعد بيانات مفهرس مختلفة ومعزولة عن بعضها البعض. من أجل تلبية احتياجات البيانات المتنوعة ، يختار بعض المصممين دمج جميع البيانات الموجودة على السلسلة في قاعدة بيانات ، بحيث يمكن للمستخدمين تحديد المعلومات المطلوبة من مجموعة بيانات واحدة. تختار بعض البروتوكولات تضمين بعض البيانات فقط ، مثل بيانات DeFi وبيانات NFT. لكن مشكلة معايير البيانات غير المتوافقة ما زالت قائمة. في بعض الأحيان ، يحتاج المطورون إلى جلب البيانات من مصادر متعددة وإعادة تنسيقها في قاعدة البيانات الخاصة بهم ، مما يزيد بلا شك من عبء الصيانة عليهم. بالإضافة إلى ذلك ، لا يمكنهم الترحيل إلى مزود آخر في الوقت المناسب في حالة وجود مشكلة مع مزود بيانات واحد.

! [من blockchain إلى LLM ، تفسير متعمق لتطور وتحديات تقنية فهرسة البيانات] (https://img-cdn.gateio.im/resized-social/moments-69a80767fe-2786fb41e9-dd1a6f-1c6801)

إذن ، كيف يمكن لـ LLM و AI حل هذه المشكلة؟ زودني LlamaIndex بوحي. ماذا لو لم يحتاج المطورون إلى مفهرس ، لكنهم يستخدمون خدمة بروكسي منتشرة (وكيل) لقراءة البيانات الأولية مباشرة في السلسلة؟ يجمع هذا الوكيل بين تقنيات المفهرس و LLM. من وجهة نظر المستخدم ، لا يحتاجون إلى معرفة أي شيء عن واجهة برمجة التطبيقات أو لغة الاستعلام ، بل يحتاجون فقط إلى طرح الأسئلة والحصول على تعليقات فورية.

! [من blockchain إلى LLM ، تفسير متعمق لتطور وتحديات تقنية فهرسة البيانات] (https://img-cdn.gateio.im/resized-social/moments-69a80767fe-d29a44cd57-dd1a6f-1c6801)

مزودًا بـ LLM وتكنولوجيا الذكاء الاصطناعي ، يتفهم الوكيل البيانات الخام ويعالجها ويحولها إلى تنسيق يسهل على المستخدمين فهمه. هذا يلغي حاجة المستخدمين إلى مواجهة واجهات برمجة التطبيقات المعقدة أو لغات الاستعلام ، ويمكنهم ببساطة طرح الأسئلة بلغة طبيعية والحصول على تعليقات في الوقت الفعلي. تزيد هذه الميزة من إمكانية الوصول إلى البيانات وسهولة استخدامها ، وتجذب قاعدة مستخدمين أوسع للوصول إلى البيانات على السلسلة.

بالإضافة إلى ذلك ، تحل طريقة خدمة الوكيل (Agent) مشكلة عدم توافق معيار البيانات. نظرًا لأنه تم تصميمه مع القدرة على تحليل ومعالجة البيانات الأولية على السلسلة ، فيمكنه التكيف مع تنسيقات ومعايير البيانات المختلفة. نتيجة لذلك ، لا يحتاج المطورون إلى إعادة تنسيق البيانات من مصادر مختلفة ، مما يقلل من عبء العمل عليهم.

بالطبع ، هذه مجرد تكهنات حول مسار التطور المستقبلي لبيانات السلسلة. لكن في مجال التكنولوجيا ، غالبًا ما تكون هذه الأفكار والنظريات الجريئة هي التي تقود التقدم الثوري. يجب أن نتذكر أنه سواء كان اختراع العجلة أو ولادة blockchain ، فإن جميع الاختراقات الكبرى تبدأ من افتراض شخص ما أو فكرة "مجنونة".

بينما نحتضن التغيير وعدم اليقين ، فإننا أيضًا نواجه تحديًا لدفع حدود الاحتمال باستمرار. في ظل هذه الخلفية ، نتخيل عالماً حيث سيؤدي الجمع بين الذكاء الاصطناعي والماجستير والبلوك تشين إلى إنتاج مجال تكنولوجي أكثر انفتاحًا وشمولية.

تدعم Chainbase هذه الرؤية وتلتزم بجعلها حقيقة واقعة.

مهمتنا في Chainbase هي إنشاء بنية تحتية مفتوحة وودية وشفافة ومستدامة للبيانات المشفرة. هدفنا هو تبسيط استخدام هذه البيانات من قبل المطورين ، مما يلغي الحاجة إلى إعادة هيكلة معقدة لمكدس تكنولوجيا الواجهة الخلفية. وبهذه الطريقة ، نأمل أن نستهل مستقبلًا لا تخدم فيه التكنولوجيا المستخدمين فحسب ، بل تمكّنهم أيضًا.

ومع ذلك ، يجب أن أوضح أن هذه ليست خارطة الطريق الخاصة بنا. بدلاً من ذلك ، هذا هو تأملي الشخصي حول التطور الأخير والتقدم المحرز في البيانات على السلسلة في المجتمع كممثل علاقات مطور.

شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • مشاركة
تعليق
0/400
لا توجد تعليقات
  • تثبيت