تم الانتهاء من المسودة الأولى لهذا المقال في وقت فراغي في نهاية شهر أغسطس، وبعد نشره على عجل، تلقيت الكثير من النصائح، فقمت بإضافة وتغيير وحذف بعض المحتوى لتجنب إضحاك الناس.
يقيّم محتوى هذه المقالة بشكل أساسي الوضع الحالي لصناعة الذكاء الاصطناعي من منظور استثماري، ويعكس ويخمّن مسارات التكنولوجيا/المنتج للشركات المختلفة، ويلخص بشكل تجريدي استراتيجيات الشركات في صناعة الذكاء الاصطناعي. ولذلك، هناك حتماً بعض الإغفالات عندما يتعلق الأمر بتقنيات معينة، لذا يرجى التحمل معي.
لكن في التحليل النهائي، لا تزال العديد من الشركات الكبرى التي يمكنها نشر الأبحاث ممزقة، ولا يبدو أن أحدًا قادر على تقييم مدى صحة محتوى هذه المقالة. تمامًا مثل تسجيل GPT-3.5 مع GPT-4، يبدو الأمر معقولًا، لكنه يكون مجردًا بعض الشيء عندما تفكر فيه بعناية.
ولذلك يوصي المؤلف باعتبار هذه المقالة بمثابة "حكم" تم تشكيله بعد جمع معلومات عن الصناعات غير المؤكدة. وبما أنه حكم، فيجب أن يكون الموقف واضحا، ويجب أن يكون البيان ذا معنى. وأما هل هي صحيحة أم لا، فليختبرها الزمن.
لقد اعتقد المؤلف دائمًا أن الصناعات الجديدة مزعجة، لذلك من الصحيح دائمًا استخدام عقلك أكثر والجرأة في إصدار الأحكام. وبالنسبة لأسئلة الصواب والخطأ، فإن المعدل الصحيح للتخمين الأعمى هو 50%، واحتمال التخمين بشكل غير صحيح ثلاث مرات متتالية هو 12.5%. وحتى إصدار الأحكام على مستوى رمي العملة المعدنية له معنى. ليس من المخيف إصدار حكم، والأفظع من ذلك هو أن دقة الحكم أقل من دقة رمي العملة المعدنية.
قبل أن أفتتح هذه المقالة رسميًا، أود أن أشكر العمل التالي، الذي قدم إلهامًا قيمًا ومصادر بيانات لهذه المقالة. بالطبع، بما أن العديد من الاستدلالات في هذه المقالة تعتمد على هذه الأعمال، فإذا كانت تحتوي على أخطاء أو كان لدى المؤلف فهم خاطئ، فإن الاستدلالات في هذه المقالة لن تكون قوية بعد الآن، ويُطلب من القراء إصدار أحكامهم الخاصة. لا تشكل هذه المقالة نصيحة استثمارية، ومن الصعب أن تشكل نصيحة استثمارية.
•مركز سلسلة الفكر: جهد متواصل لقياس الأداء المنطقي للنماذج اللغوية الكبيرة (
•LIMA: الأقل هو الأفضل للمحاذاة (
•يونيو 2023، مراجعة مرحلية لضبط التعليمات (
•بنية GPT-4، البنية التحتية، مجموعة بيانات التدريب، التكاليف، الرؤية، وزارة التربية والتعليم (
حسنًا، فلنبدأ هذه المقالة رسميًا.
نموذج كبير: إطلاق صاروخ إلكتروني
الخطوة الأولى في مناقشة الذكاء الاصطناعي في عام 2023 هي مناقشة ما إذا كان لا يزال من الممكن القيام بنماذج ريادة الأعمال واسعة النطاق.
لقد تحول الآن النموذج الكبير (التدريب المسبق) إلى مشكلة إطلاق الصاروخ، فطالما يمكن حرقه والاتجاه صحيح، يمكن لأي شخص أن يفعل ذلك. يمكن القول أن تدريب نموذج كبير هو إطلاق صاروخ سيبراني.
والأمر غير البديهي هو أن المستثمرين يستخفون بصعوبة تدريب النماذج الضخمة، ولكنهم يبالغون في تقدير صعوبة إطلاق صواريخ حقيقية. وبنفس التكلفة البالغة 60 مليون دولار أمريكي، سيعتقد المستثمرون أنه إذا فشل الصاروخ في الإقلاع، فستكون هناك فرصة ثانية، في حين أن الفشل في تدريب نموذج كبير سيعتبر مضيعة للمال.
لا يزال GPT-4 يستهلك 60 مليون دولار أمريكي من كفاءة استخدام وحدة معالجة الرسومات الخاصة بـ OpenAI (تبلغ حوالي 30%). هذه مسألة {الأداء = الكفاءة × التكلفة}، والأداء يمثل عائقًا. إذا لم تتمكن الشركات الناشئة الأخرى من تحقيق تأثيرات أداء أكبر من 30% × 60 مليون = 18 مليون دولار أمريكي، فيمكن للمستخدمين أيضًا استخدام GPT-4 مباشرة.
حاليًا، العديد من الشركات التي تدعي أنها تدرب نماذج كبيرة لديها جولات تمويل تتراوح من مليون دولار إلى 5 ملايين دولار. بمعنى آخر، حتى الشركات التي لديها أكبر قدر من التمويل لا تملك سوى ذخيرة كافية لدعم عملية إطلاق واحدة. حتى لو وصل معدل استخدام وحدة معالجة الرسومات لهذا الإطلاق إلى 100%، فسيكون من الصعب تجاوز GPT-4.
من هذا المنظور، من الأفضل إطلاق الصواريخ، لأن معظم الصواريخ الحالية هي مركبات إطلاق، تحمل أقمارًا صناعية إلى السماء، وسعة الحمولة الواحدة محدودة، لذا يمكن لشركات الصواريخ الصغيرة أن تتلقى طلبات للأقمار الصناعية لم يكن لدى الآخرين الوقت الكافي لها. للاطلاق.
تختلف النماذج الكبيرة، فالتكلفة الحدية للتوسع الأفقي للنماذج الكبيرة هي فقط تكلفة قوة الحوسبة، ويمكن توسيع تكلفة قوة الحوسبة بشكل مرن، مما يعني أنه بالنسبة للشركات ذات النماذج الكبيرة، فإن ربح كل طلب هو ربح مجاني. ، لا توجد أي تكلفة إضافية تقريبًا، والقدرة على التنفيذ كبيرة جدًا. من الصعب على شركة نموذجية جديدة ذات نوعية رديئة واسعة النطاق أن تتلقى الطلب الفائض.
وما لم يتم تخفيض تكلفة التدريب بشكل كبير، ستجد العديد من الشركات صعوبة في صنع نموذج كبير يمكن طرحه في السوق على المدى القصير حتى لو كانوا يعرفون البنية الكاملة لـ GPT-4.
التخصيص: مواجهة مشكلة "الفائز يأخذ كل شيء"
في صناعة الأجهزة، هناك ظاهرة شائعة تتمثل في تحقيق أرباح مبكرة من خلال الاحتياجات المخصصة، ثم تحقيق اختراقات تكنولوجية (أو معادلة) من خلال الأرباح المبكرة. ومع ذلك، فإن تخصيص صناعة النماذج واسعة النطاق من الصعب أن يصبح مخرجًا للوافدين الجدد.
فيما يتعلق بهذا الحكم، فإن التفسير بسيط للغاية: الغالبية العظمى من النماذج المضبوطة لا يمكنها اللحاق بـ GPT-4، حتى لو لحقت بالركب، فإن تكلفة التعميم مباشرة باستخدام GPT-4 أقل، والحاجة إلى الموظفين أقل والحاجة إلى الحظ أقل، ومتطلبات البيانات أقل. وطالما أن فجوة الأداء بين GPT-4 والنماذج الأخرى لا تزال موجودة، فلا يمكن أن يكون التخصيص هو الحل لشركات النماذج الكبيرة.
من الأمثلة النموذجية للغاية شركة Jasper، التي تستخدم GPT-3 المضبوطة بدقة لخدمة عملاء المؤسسات. ومع ذلك، بعد أن أصدرت OpenAI ChatGPT (GPT-3.5)، خسر مستخدموها بسرعة. لأنه يمكن الحصول على مخرجات Jasper ببساطة عن طريق إدخال GPT-3.5، دون استخدام "إصدار سابق" ذو قدرة تعميمية ضعيفة ويقتصر على الاستخدام الداخلي في المؤسسات.
بالمقارنة مع الشركات الجديدة، تتمتع Jasper على الأقل بفترة زمنية للتطوير من GPT-3 إلى GPT-3.5. ومع ذلك، تحتاج الشركات الجديدة الآن إلى مواجهة ظهور GPT-3.5 منخفض التكلفة وعالي السرعة وGPT-4 عالي الأداء في نفس الوقت.
ولذلك، فإن احتمال البقاء على أمل تجميع الأرباح من خلال التخصيص لتحقيق اختراقات تكنولوجية منخفض للغاية.
الضبط الدقيق: ضروري، لا تؤمن بالخرافات
لدى صناعة الذكاء الاصطناعي الحالية توقعات غير واقعية للضبط الدقيق، وهو أمر مبالغ فيه سواء من حيث التنفيذ الفني المحدد أو الإيقاع الفني على المستوى الكلي.
يشير الضبط الدقيق الذي تتم مناقشته حاليًا في الصناعة في الغالب إلى "الاعتماد على النموذج المُدرب مسبقًا، مما يجعله يولد إجابات تلبي النوايا البشرية". يمكن أن يسمى هذا النوع من الضبط الدقيق "المحاذاة"، أي مواءمة الإجابة مع النوايا البشرية، بدلاً من إضافة الحكمة إلى النموذج الكبير.
وفقًا لنتائج الأبحاث الخاصة بأوراق بحثية متعددة، يجب أن تأتي معرفة النماذج الكبيرة بشكل أساسي من التدريب المسبق، في حين يتم استخدام الضبط الدقيق بشكل أكبر للمحاذاة.
التفسير البسيط هو أن التدريب المسبق يحدد قدرة الدماغ، والضبط الدقيق يحدد اللغة الأم. إن ضبط النموذج الذي تم تدريبه مسبقًا هو عملية "القضاء على الأمية".
ومع ذلك، غالبًا ما يُنظر إلى الضبط الدقيق في الصناعة على أنه وسيلة "لتعزيز ذكاء" النموذج، أي أنه من خلال الضبط الدقيق لتحسين أداء النموذج وزيادة المعرفة بالنموذج، يُعتقد أن هذا يمكن أن يصل إلى "الكأس المقدسة" للذكاء الاصطناعي". هذا الخط من التفكير متحيز إلى حد ما.
أولا وقبل كل شيء، لم يتحسن أداء النموذج نفسه، ولكنه يمكن أن يتماشى بشكل أفضل مع نوايا الإنسان. وإذا تجاوز تعقيد المهمة أداء النموذج، فإن الضبط الدقيق لن يؤدي إلى النتائج المتوقعة. تمامًا مثل السماح للعقل البشري بإجراء عمليات كمومية، فإن الفشل في القيام بذلك ليس مسألة تعليم.
ثانيًا، يتم تنفيذ "ملحق المعرفة" في جزء "محاذاة النية"، ويكون التأثير أشبه بـ "الببغاء". أي: أن النموذج إنما يقلد ما يقوله الخبراء دون أن يفهم المعنى. على الرغم من أن العديد من الصناعات يمكن أن تحصل على حلول جيدة من خلال "الترديد" (بعد كل شيء، فإن معظم الصناعات ليست معقدة...)، فمن الواضح أن هذه ليست النتيجة التي ينبغي لنا أن نسعى إلى تحقيقها على المدى الطويل.
أخيرًا، بالنسبة للتدريب على "تكملة مجموعات البيانات الإضافية، وتحسين أداء النموذج، وزيادة المعرفة بالنموذج"، ينبغي اعتبار أن النموذج لديه القدرة على "التعلم المتزايد/التعلم المستمر"، أي المعلمات الكاملة للنموذج يمكن تحسينها من خلال مجموعات البيانات المتزايدة. وهذا ليس مفهومًا في نفس فئة ما يسمى بـ "ضبط التعليمات".
بشكل عام، يعد الضبط الدقيق أمرًا مهمًا للغاية، ولكن من الخطأ اتخاذ موقف "خرافي" تجاه الضبط الدقيق الحالي، خاصة أولئك الذين يتوقون إلى تسمية الضبط الدقيق الحالي بالكأس المقدسة، وهو نوع من الضبط الدقيق "الفيزياء الحالية على الصرح. هناك سحابتان داكنتان فقط تطفوان."
لنعد خطوة إلى الوراء، إذا كان من الممكن حقًا حل الطلب على "زيادة الذكاء" من خلال تحسين التعليمات، وإجراء بحث بسيط عن المتجهات، ووضع المعرفة مباشرة في السياق، ثم كتابة بعض القوالب ببساطة، فهناك احتمال كبير أنه سيكون هناك نفس التأثير أو حتى أفضل.
الجميع يحب الضبط الدقيق، وربما يكون أيضًا نوعًا من إحياء مهارات الكيمياء في العصر الحديث...
توقعات النموذج الكبير: أربع عمليات حسابية
(لاحظ أن هذا الجزء من المحتوى يعتمد بالكامل على البيانات التي كشف عنها ديلان باتل، ولا يمكن التحقق من موثوقيتها في الوقت الحالي)
يعتمد تدريب GPT-4 على سلسلة A من بطاقات N كفاءة التدريب 30% مدة التدريب حوالي شهرين التكلفة حوالي 60 مليون المبلغ الإجمالي للمعلمة {1.7 تريليون = 110 مليار × 16 نموذج خبير}. يمكنه التعامل مع مشكلة واحدة. المعلمات حوالي 280 مليار.
بمعنى آخر، هناك العديد من المعلمات الأساسية التي من شأنها أن تسبب تغييرات في نمط تدريب النماذج الكبيرة.
•كفاءة التدريب: يمكن أن تؤدي الزيادة من 30% إلى 60% إلى مضاعفة الوقت بشكل مباشر
• زيادة كثافة طاقة الحوسبة: بعد التبديل من السلسلة A إلى السلسلة H ثم إلى بطاقة الذكاء الاصطناعي المخصصة، تم تحسين كثافة طاقة الحوسبة، ويمكن حل العديد من المشكلات التي تؤثر على الكفاءة في البنية.
• انخفاض تكاليف طاقة الحوسبة: قام لاو هوانغ (مؤسس شركة Nvidia) بتخفيض بطاقة الرسومات، مما أدى إلى انخفاض التكلفة بشكل كبير
• تحسين كفاءة المعلمات: هناك مجال لتحسين كفاءة المعلمات للنموذج. وبالرجوع إلى النموذج السابق، يمكن عادة زيادة كفاءة المعلمات للنموذج القديم عدة مرات. ومن الممكن استخدام 30% لمعلمات GPT-4 لتحقيق تأثير مماثل
خلاصة القول، أن تكلفة تدريب نموذج بمستوى أداء GPT-4 من الصفر قد توفر مساحة للتحسين تتراوح بين 10 إلى 20 ضعفًا، والتي تنخفض إلى 3 ملايين دولار أمريكي إلى 6 ملايين دولار أمريكي. وهذه التكلفة فعالة للغاية من حيث التكلفة بالنسبة للشركات الناشئة. والشركات الكبيرة مقبولة أكثر.
وقد يستغرق هذا التغيير حوالي عامين حتى يكتمل.
في الوقت الحاضر، لا تزال تكنولوجيا النماذج الكبيرة السائدة تعتمد على المحولات، ولم تتغير البنية التحتية، ولم يتم استنفاد فكرة تحسين الكيمياء وإضافة المعلمات لإنشاء المعجزات. يتم تنفيذ تدريب GPT-4 على أساس قيود الطاقة الحاسوبية العالية، ووقت التدريب ليس طويلاً بما يكفي.
إذا كانت المعلمات تنمو خطيًا مع وقت التدريب، فقد يكون الحد الأعلى لمعلمات النموذج المشابه لمعمارية GPT-4 حوالي 10 تريليون، أي أن وقت التدريب يتضاعف (×2)، وتكون بطاقة الرسوميات المتوازية تمت مضاعفة (×2)، وكفاءة التدريب أسرع بمقدار النصف (×1.5)، وكفاءة المعلمة أعلى بمقدار النصف (×1.5)، وأخيراً تم الحصول على النتيجة بعشرة أضعاف. ووفقاً لأسلوب الرغبة في المخاطرة في وادي السيليكون، فإن الاحتمالية العالية لتحقيق هذه المعلمة سيتم تحقيقها خلال عام، بغض النظر عما إذا كان الأداء قد تحسن أم لا.
ومع ذلك، بعد الوصول إلى 10 تريليون معلمة، من غير المعروف تمامًا ما إذا كان LLM لا يزال بإمكانه استخدام فكرة زيادة المعلمات لتحقيق المعجزات.
إذا كان التحسن في أداء النموذج من حيث عدد المعلمات يتناقص بشكل هامشي، فمن المرجح أن يكون 10 تريليون عقبة. ومع ذلك، هناك أيضًا تخمين بأن عدد المعلمات يحسن أداء النموذج بزيادة هامشية، على غرار "إذا كان الشخص ذكيًا بما فيه الكفاية، فيمكنه تعلم كل شيء بسرعة". الأول جيد. وإذا كان الأخير صحيحا، فإن أداء النموذج قد يتزايد بشكل كبير، وسوف يكون ما سيحدث في ذلك الوقت غير قابل للتنبؤ به على الإطلاق.
من الصعب التنبؤ بالكيمياء، ولكن من السهل التنبؤ بإيقاع استراتيجية الشركة. يعد النموذج ذو المعلمة الإجمالية 10 تريليون نقطة نهاية على مستوى المعلم بالنسبة لمعظم المؤسسات، سواء كانت عملاقة مثل Google/MS/APPL أو OpenAI أصغر، ومن الممكن التوقف والقيام ببعض عمليات الاستكشاف الفني.
يمكن تحويل تفضيل المؤسسة/رأس المال للمخاطرة إلى "وقت التحمل"، فإذا كان وقت التحمل بأكمله عبارة عن حرق مكثف للنفقات، فمن الصعب أن يتجاوز 6 أشهر. التكنولوجيا البشرية لا تنمو بالسرعة الكافية، وعادة ما تستغرق الدورة 5 سنوات أو أكثر. لذلك، في غضون 5 سنوات، يمكن تقدير مقدار المعلمة النهائية للنموذج ويجب أن يتراوح بين 20 تريليون إلى 50 تريليون. وما لم يحدث تقدم كبير في التكنولوجيا/الهندسة المعمارية مرة أخرى، فإن احتمال تجاوز هذا الحجم منخفض للغاية.
تعدد الوسائط: الفيل في الغرفة
تعد تعدد الوسائط بمثابة الفيل الموجود في الغرفة وقد يؤثر بشكل عميق على مشهد مضمار السباق.
التعريف البسيط لتعدد الوسائط هو: دعم إدخال وإخراج معلومات الوسائط المتعددة. هذا التعريف فضفاض للغاية، على سبيل المثال، بعض المنتجات الموجودة في السوق والتي تدعي أنها قادرة على إجراء إدخال متعدد الوسائط هي في الواقع ChatBot مع طبقة من التعرف الضوئي على الحروف خارجها. هناك أيضًا نماذج تلبي تمامًا تعريف تعدد الوسائط، لكن أدائها مخيب للآمال. حتى قدرة إدخال الصور متعددة الوسائط لـ GPT-4 لم يتم فتحها على نطاق واسع بعد، ويمكن ملاحظة أن هذه الوظيفة ليست مستقرة جدًا.
ومع ذلك، فإن عمليات إطلاق الوسائط المتعددة ليست بعيدة المنال. هناك احتمال كبير أن يدعم GPT-5 في الأصل الوسائط المتعددة، مما يعني أن الهيكل يحتاج إلى إعادة تصميم وإعادة تدريب. وفقا للمنطق السابق، لا يزال هناك مجال للنمو من 10 إلى 50 مرة في معلمات النماذج الكبيرة. وينبغي أن يكون كافيا لوضع قدرات متعددة الوسائط فيها. لذلك، من المتوقع أن تظهر نماذج متعددة الوسائط عالية الأداء وعالية التوفر في غضون عامين، وإذا كنا متفائلين، فسيكون ذلك خلال عام واحد تقريبًا.
تعدد الوسائط هو الفيل الموجود في الغرفة، يعلم الجميع أنه سيكون هناك شيء من هذا القبيل في نهاية المطاف، ولكن العديد من المنتجات/الأبحاث/الاستراتيجيات تتجاهل وجودها لدرجة أن هناك خطأ في التقدير في الأجزاء الرئيسية.
على سبيل المثال، من الناحية النظرية، سيتم قمع نماذج الصورة الفردية بشدة من خلال النماذج متعددة الوسائط، ولكن حاليًا تتجاهل معظم الأبحاث/الاستثمارات هذه المشكلة، مما يؤدي إلى تقييمات عالية جدًا لبعض الشركات التي تركز على نماذج الصور. ومن المرجح أن تفقد هذه الشركات الحواجز التقنية وتتحول إلى مقدمي خدمات في المستقبل. وينبغي لنظام التقييم الخاص بها أن يشير إلى مقدمي الخدمات وليس شركات التكنولوجيا.
إذا كنت تريد أن تحكي قصة "الاستثمار يعتمد على الأشخاص، فإن نفس الفريق يمكنه تحويل الأعمال"، فقط تظاهر بأنني لم أقل ذلك. الأساطير موجودة دائمًا، لكن لا يمكنك تصديقها عند إجراء البحث.
من يمكنه تدريب GPT-4: نعم، ولكن ليس ضروريًا
لا يستغرق صنع الكيمياء وقتًا طويلاً، وتقوم الشركات الكبرى بشراء بطاقات الرسومات. الشيء الواضح جدًا هو أنه بعد عام، ستمتلك الشركات الكبيرة القدرة على تدريب نماذج على مستوى GPT-4. ولكن ما إذا كنت تريد التدريب أم لا هو سؤال آخر.
في مجال الألعاب، هناك اقتراح كلاسيكي يسمى "Yuanshin لعب Yuanshen"، أي: عندما يمكن للاعبين اختيار لعب Yuanshen أو منتج منافس لـ Yuanshen، إذا لم يكن المنتج المنافس جيدًا مثل Yuanshen، فالعب Original God .
وينطبق نهج "الفائز يأخذ كل شيء" أيضًا على صناعة النماذج الكبيرة. إذا اتبعت شركة ما OpenAI وبعد نصف عام من البحث والتطوير، فإنها تطلق نموذجها الكبير الخاص بها بأداء 90% مشابه لـ GPT-4، على أمل طرحه في السوق. في هذا الوقت ستواجه الشركة المشاكل التالية:
• يتمتع OpenAI بميزة النطاق المتمثلة في الموارد السحابية والتكاليف المنخفضة
•تم استخدام واجهة برمجة تطبيقات OpenAI على نطاق واسع في رموز المنتجات، ومن الصعب استبدالها
• لا يزال منتج الشركة لا يتفوق على GPT-4
• منتج الجيل التالي من OpenAI (ربما GPT-5) على وشك الإصدار
ويمكن ملاحظة أن الشركة تتعرض لضغوط كبيرة. بدلاً من تدريب GPT-4، من الأفضل المراهنة مباشرة على نموذج الجيل التالي (مقارنة بـGPT-5). وبعد ذلك ستتغير المشكلة من "مشكلة منتج منافس مماثل" إلى "مشكلة الابتكار التكنولوجي". وهذا عبء لا يطاق بالنسبة للشركات الصغيرة.
لذلك، فإن مناقشة "من يمكنه تدريب GPT-4" هي قضية استراتيجية ميتة، وبدلاً من التفكير في هذه القضية، من الأفضل إيجاد اتجاه أكثر يقينًا وفرصًا أكثر.
نصيحة للشركات الناشئة العاملة في مجال الذكاء الاصطناعي: الأداء أولاً، وتجنب الركود
كتب المؤلف العديد من المقالات التي تشكو من langchain، والسبب الأساسي هو أن langchain لا يترك مجالًا للمطورين لتحسين الأداء. يطلق عليه بشكل ملطف "الإطار العالمي". ومن أجل ضمان العالمية، تم التخلي عن مجال كبير لتحسين أداء النماذج الكبيرة، مثل الحوار متعدد الجولات والتحكم في التنسيق الذي يتم تنفيذه عن طريق الضبط الدقيق. وبالمثل، هناك التوجيه/Auto-GPT/BabyAGI وما إلى ذلك، وكلها تريد أن تكون "إطار عمل يمكن استخدامه مدى الحياة".
الحقيقة الموضوعية هي أن OpenAI أصدرت استدعاء الوظائف في مايو، والعديد من الأماكن المزعجة في الكود لديها حلول تنفيذ أفضل، وتكلفة تنفيذ حل أفضل هي إعادة هيكلة الأجزاء الرئيسية من كود المنتج. في أغسطس، أصدرت شركة OpenAI الإذن بضبط GPT-3.5، والعديد من الروابط التي تتطلب تحكمًا دقيقًا في المخرجات لديها حلول محتملة جديدة.
ولذلك، يتعين على الشركات الناشئة أن تواجه خياراً رئيسياً: هل ينبغي لها أن تختار ① تحسين الأداء وإعادة تصميم المنتجات بشكل مستمر، أو ② الحد من استخدام الميزات الجديدة واستخدام الميزات القديمة دائماً من أجل التطوير؟
بالنسبة لريادة أعمال تطبيقات التكنولوجيا الجديدة، لا يمثل "التطوير" عملية كتابة التعليمات البرمجية فحسب، بل يمثل أيضًا "الحد الأعلى" لوظيفة/استراتيجية المنتج. كلما ارتفع الأداء الذي يمكن التحكم فيه، زادت الوظائف النظرية للمنتج وزادت مرونته الإستراتيجية.
لا يمكن التنبؤ بتطور التكنولوجيا، وقد تؤدي الإبداعات التكنولوجية الصغيرة إلى تغييرات حساسة للغاية في المشهد التنافسي. وينبغي للشركات البادئة أن تتمتع بالقدرة على مقاومة الهشاشة في تطوير التكنولوجيا.
—— بكلمات إنسانية: يجب إعطاء الأولوية للأداء وتجنب البقاء. على مستوى التطوير، استخدم المزيد من الميزات الجديدة؛ وعلى جانب المنتج، فكر في الوظائف التي يمكن أن تؤديها الميزات الجديدة؛ وعلى الجانب الاستراتيجي، فكر في تأثير الميزات الجديدة على الإستراتيجية.
في "ممر تشين"، ذكر أنه بعد تأسيس أسرة تشين، تمت مصادرة الأسلحة المعدنية من جميع أنحاء العالم وصبها في اثني عشر تمثالًا برونزيًا للقضاء على احتمالية الانتفاضات المدنية. ولكن من المعروف أن أسرة تشين كانت قصيرة العمر. إن الاهتمام بالتغييرات أكثر فائدة من تجاهلها.
نصيحة للشركات الناشئة في مجال الذكاء الاصطناعي: إنشاء التطبيقات بثقة
هناك خطر خفي شائع جدًا عندما تقوم الشركات الناشئة بتطوير التطبيقات: دخول الشركات الكبيرة. لا تشمل الشركات الكبرى هنا عمالقة التطبيقات فقط، مثل Meta/Byte/Tencent وما إلى ذلك، ولكن أيضًا الشركات الرائدة في مجال الذكاء الاصطناعي، مثل OpenAI.
عادة ما يكون هناك سببان لدخول الشركات الكبيرة إلى السوق: نشر فرص المنتجات، وتقليص المنبع والمصب.
"فرص تخطيط المنتج" هو المعنى الحرفي، وتشعر الشركات الكبيرة أن هذا الاتجاه يستحق المتابعة، لذلك تفعل ذلك.
"القطع بين المنبع والمصب" هو في الغالب خطوة عاجزة. قد يكون ذلك لأنني طورت نموذجًا كبيرًا مشابهًا لـ OpenAI. ومع ذلك، نظرًا لمشكلة الفائز يأخذ كل شيء في النماذج الكبيرة، لا يوجد مستخدمون، مما يؤدي إلى في حرق التكاليف، ولا إيرادات، ولا بيانات، الأمر الذي يؤدي بدوره إلى تأخر الأداء تدريجياً. في هذا الوقت، يعد التدخل في المراحل النهائية وتطوير تطبيقات محددة واستخدام التكنولوجيا الخاصة بك هي الخيارات الوحيدة.
وفقًا للتجربة التاريخية، وبسبب مشكلة الهيكل التنظيمي، كلما اقتربت الشركة من المصب، كان من الأسهل أن تتخلف عن الركب في مجال التكنولوجيا، وكلما كانت التكنولوجيا أكثر تخلفًا، كلما زاد حاجتها إلى المصب. سوف تتنافس شركات التكنولوجيا المزعومة هذه في نهاية المطاف على نفس المكانة البيئية مثل شركات طبقة التطبيقات.
ومع ذلك، في ساحة معركة طبقة التطبيق، نظرًا لقصر وقت تكنولوجيا الذكاء الاصطناعي، لا توجد ميزة نطاق فعالة وقابلة لإعادة الاستخدام، ونقطة البداية للشركات الكبيرة والشركات الناشئة متشابهة. بالمقارنة مع الشركات الكبيرة، تعتبر الشركات الناشئة أكثر كفاءة ولديها رؤى أعمق، مما يجعل الاستفادة منها أسهل.
شيء واحد جدير بالملاحظة هو أن جميع المواد الترويجية لـ MS Azure تقريبًا تدور الآن حول OpenAI، ومع ذلك، فإن شركة كبيرة مثل Microsoft تعتمد بالكامل على OpenAI كمنصة لها، مما يثبت من الجانب أن الشركات الناشئة تتمتع بمزايا طبيعية في مجال الذكاء الاصطناعي.
بالطبع، قد لا يتمكن بعض بائعي الخدمات السحابية من قبول أن تقودهم الشركات الناشئة ويريدون التهام السوق بالكامل بأنفسهم. إنها باهظة الثمن وبطيئة ولا تشكل تهديدًا مباشرًا.
والحقيقة هي أن هناك بالفعل بعض مسارات تطبيقات الذكاء الاصطناعي قصيرة العمر للغاية، ولكن لا يزال هناك العديد من المسارات طويلة العمر التي لم يتم اكتشافها بعد، وتطبيقات الذكاء الاصطناعي لا يفوز فيها الفائز بكل شيء. يعد التوسع من التطبيقات إلى الأنظمة الأساسية أو التقنيات أيضًا مسارًا أكثر جدوى.
لذلك، يجب أن نلقي نظرة عقلانية على قدرة الشركات الكبيرة على غزو طبقة التطبيقات. اقتراحنا هو أن الشركات الناشئة في مجال الذكاء الاصطناعي يمكنها تقديم التطبيقات بثقة.
نصيحة للشركات الناشئة العاملة في مجال الذكاء الاصطناعي: انتبه إلى شريان حياة المنتج
كما ذكرنا سابقًا، يمكن للشركات الناشئة في مجال الذكاء الاصطناعي إنشاء تطبيقات بأمان، ولكن يجب عليها مراعاة أداء نموذج الذكاء الاصطناعي وتجنب البقاء فيه. ويتجلى هذا الوضع بشكل مباشر في أن منتجات الذكاء الاصطناعي قد تفقد قاعدة الطلب الخاصة بها وتذبل تدريجياً خلال بضعة أشهر، وقد يحدث هذا الوضع بشكل متكرر.
تحتاج تطبيقات الذكاء الاصطناعي إلى استخدام خدمات النماذج الكبيرة، ويستمر أداء النماذج الكبيرة في التحسن. هذا التحسن ليس تحسينًا في بُعد واحد مثل "السرعة"، ولكنه تغيير في جميع الجوانب مثل جودة الإخراج وطول الإخراج وإمكانية التحكم في الإخراج. ستؤدي كل ترقية مهمة في التكنولوجيا إلى تخلف منتجات طبقة التطبيقات الحالية من الناحية التكنولوجية وإنشاء فرص جديدة ومنافسين جدد.
نطلق على الوقت الذي يحتفظ فيه تطبيق الذكاء الاصطناعي بالمزايا والضرورة في الإستراتيجية/المنتج/التكنولوجيا باسم "شريان الحياة".
فيما يلي بعض الأمثلة ذات شرايين الحياة الأقصر:
• عندما يدعم ChatGPT/Claude تحميل الملفات، يصبح ChatPDF غير ضروري
•عندما يدعم Office365 برنامج Copilot، ستفقد المنتجات التي تستخدم الذكاء الاصطناعي لرسم PPT مزاياها
• عند ظهور GPT-3.5، لن يعد Jasper ضروريًا
**بالنظر إلى أن صناعة الذكاء الاصطناعي تتطور بسرعة، فإن شريان الحياة المحدود هو القاعدة. لذلك، فإن قبول حقيقة أن شريان الحياة محدود ومحاولة اختيار اتجاه ذو شريان حياة أطول سيساعد في الحفاظ على المزايا طويلة المدى وضرورة المنتج. **
بشكل عام، يمكن تقسيم شريان الحياة ببساطة إلى مستويات 3/6/12 شهرًا.
•3 أشهر: الوظائف التي لم يتوفر لدى الشركات الكبيرة الوقت الكافي لتنفيذها (مثل وظائف المكتب/ChatGPT التي لم يتوفر لها الوقت الكافي لتنفيذها)
• 6 أشهر: يصعب تنفيذه ولا يمكن دمجه في الحلول الحالية، ولكن المزايا/الضروريات ستختفي مع تحسين أداء الذكاء الاصطناعي (مثل إطار الذكاء الاصطناعي العام)
•12 شهرًا: المزايا/الضروريات يمكن أن تستمر لفترة طويلة ولا تتأثر بسهولة بالشركات الكبرى/التطورات التكنولوجية (مثل معانقة الوجه)
*إن دورة حياة منتجات المنصة ليست بالضرورة طويلة، ففي نهاية المطاف، المتاجر هي أيضًا منصات
تحتاج الشركات الناشئة إلى شريان حياة مدته 6 أشهر فقط لتحديد اتجاهها، ومن الصعب الحصول على شريان حياة مدته 12 شهرًا.
عندما يصل شريان حياة المنتج إلى النهاية، هناك حالتان بشكل عام. الوضع الأول هو اختفاء المزايا وتحتاج تكنولوجيا ترقية المنتج إلى إعادة البناء.يرجى الرجوع إلى "الأداء أولاً" أعلاه؛ والموقف الثاني هو اختفاء الضرورة وسيتم استبدال المنتج تدريجيًا.في هذا الوقت، سيتم استبدال المنتج لا يزال هناك عدة أشهر من "عمر التشغيل" كافية للشركات الناشئة لاختيار الاتجاه التالي.
نصيحة للشركات الناشئة في مجال الذكاء الاصطناعي: يمكن لـ Web3+AI القيام بذلك
حاليًا، هناك العديد من المشاريع الريادية حول موضوع Web3+AI، ومع ذلك، نظرًا لعدم اليقين بشأن تطور التكنولوجيا والمرحلة المبكرة من السوق، فإن موضوع Web3+AI سيظل به العديد من المتغيرات في المستقبل.
الغرض من هذا المقال هو إيجاد اليقين مع احتمالية عالية للصواب في حالة عدم اليقين، لذلك لا يزال المؤلف يأمل في طرح بعض الأفكار واقتراح بعض المحاور والتوجهات التي قد تكون لها فرص للرجوع إليها من قبل الشركات الناشئة و الباحثين المهتمين.
• نزع السيادة/اللامركزية
في الوقت الحاضر، لا يقدم القادة في صناعة الذكاء الاصطناعي سوى نماذج مغلقة المصدر، ولا يمكن السيطرة على الاستقرار والشفافية والحياد في تقديم خدماتهم المستمرة. قد تصبح إزالة السيادة/اللامركزية موضوعًا مهمًا في صناعة الذكاء الاصطناعي، أي توفير خدمات ذكاء اصطناعي مستقرة وشفافة ومحايدة بناءً على البنية الأساسية لنزع السيادة/اللامركزية.
إن إلغاء السيادة/اللامركزية هو "بديل" و"ردع" يمكن أن يزيد بشكل كبير من التكاليف غير الأخلاقية لشركات الذكاء الاصطناعي المركزية/السيادية ويمنعها من استخدام نماذج الذكاء الاصطناعي في المجالات العسكرية والطائفية والسياسة وغيرها من الجوانب.
في الحالات القصوى، بمجرد أن لا تصبح خدمات الذكاء الاصطناعي المركزية/السيادية متاحة/جديرة بالثقة لسبب ما، يمكن أن يستمر الذكاء الاصطناعي غير السيادي/اللامركزي في تقديم خدمات متاحة للغاية لمنع البلدان/المناطق الفردية وحتى البشرية من فقدان الذكاء الاصطناعي.
• التطبيق العملي لقوة الحوسبة
خلف تحول ETH من إثبات العمل (PoW) إلى إثبات الحصة (PoS) تكمن المعضلة المنتقدة المتمثلة في "التعدين لا يولد قيمة". يمكن أن يوفر الجمع بين Web3 و AI سيناريو عمليًا لقوة الحوسبة، وذلك لتحقيق استيعاب قوة حوسبة الأسهم وتعزيز نمو إجمالي قوة الحوسبة، وما إلى ذلك التأثير.
•الأصول الافتراضية
يعد الذكاء الاصطناعي أحد الأصول الأصلية لقوة الحوسبة والتخزين، ويمكن أن يوفر الجمع بين Web3 والذكاء الاصطناعي قناة لتحويل الذكاء الاصطناعي إلى أصول افتراضية، وإنشاء أصول افتراضية أصلية حقيقية لـ Web3 مع تحقيق إنشاء قيمة صناعة الذكاء الاصطناعي.
•متغيرات لتطبيقات Web3
قد يوفر الجمع بين Web3 وAI وظائف جديدة وفرص نمو لتطبيقات Web3، ويمكن إعادة تصميم تطبيقات Web3 الحالية بالكامل.
مكتوب في النهاية: نحن في سبتمبر، هل لا يزال الذكاء الاصطناعي يستحق بدء عمل تجاري الآن
اسمحوا لي أن أتحدث عن الاستنتاج أولاً: إنه أمر جدير بالاهتمام، ويمكن استخدام هذا الاستنتاج حتى حلول السنة الصينية الجديدة باحتمال كبير.
غالبًا ما يكون تصور الناس للمواقف متحيزًا، وأنا لست استثناءً. البعض متفائل للغاية والبعض الآخر متشائم للغاية. تواصل المؤلف ذات مرة مع فريقين. يعتقد أحد الفريقين أنه سيكون قادرًا على بناء وكيل ذكاء اصطناعي في الربع الأول من العام المقبل، بينما يشعر الفريق الآخر أن الذكاء الاصطناعي مناسب فقط لإدارة قاعدة المعرفة. من الواضح أن الأول متفائل للغاية، في حين أن الفريق الآخر يعتقد أن الذكاء الاصطناعي مناسب فقط لإدارة قاعدة المعرفة. هذا الأخير متشائم للغاية.
عند وضع خطط طويلة المدى، فإن التفاؤل الزائد أو التشاؤم الزائد سيؤدي إلى مخاطر، والملاحظات المتداولة على نطاق واسع غالبًا ما تكون هذه الملاحظات شديدة التحيز، مما يجعل التفكير المستقل ثمينًا للغاية. لذلك، بغض النظر عما إذا كان القارئ يمكنه قبول آراء هذه المقالة، طالما أن القارئ لديه تفكير وحكم مستقل أثناء عملية القراءة، سيكون المؤلف سعيدًا للغاية.
وأخيراً أعلن. إذا كانت لديك فكرة جيدة لبدء تشغيل الذكاء الاصطناعي أو كان لديك بالفعل مشروع مكتمل، فلا تتردد في التواصل مع أصدقاء NGC (مثلي).
نحن نحدد المشاريع ذات الابتكارات الثورية، التي تهدف إلى حل المشكلات من خلال حلول تتميز بالبساطة والقدرة على تحمل التكاليف والسرعة والتفرد وملاءمة السوق للمنتج.
شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
NGC Ventures: هل لا يزال الأمر يستحق بدء عمل تجاري في مجال الذكاء الاصطناعي الحالي؟
بقلم شيري، مدير الاستثمار، NGC Ventures
مقدمة
تم الانتهاء من المسودة الأولى لهذا المقال في وقت فراغي في نهاية شهر أغسطس، وبعد نشره على عجل، تلقيت الكثير من النصائح، فقمت بإضافة وتغيير وحذف بعض المحتوى لتجنب إضحاك الناس.
يقيّم محتوى هذه المقالة بشكل أساسي الوضع الحالي لصناعة الذكاء الاصطناعي من منظور استثماري، ويعكس ويخمّن مسارات التكنولوجيا/المنتج للشركات المختلفة، ويلخص بشكل تجريدي استراتيجيات الشركات في صناعة الذكاء الاصطناعي. ولذلك، هناك حتماً بعض الإغفالات عندما يتعلق الأمر بتقنيات معينة، لذا يرجى التحمل معي.
لكن في التحليل النهائي، لا تزال العديد من الشركات الكبرى التي يمكنها نشر الأبحاث ممزقة، ولا يبدو أن أحدًا قادر على تقييم مدى صحة محتوى هذه المقالة. تمامًا مثل تسجيل GPT-3.5 مع GPT-4، يبدو الأمر معقولًا، لكنه يكون مجردًا بعض الشيء عندما تفكر فيه بعناية.
ولذلك يوصي المؤلف باعتبار هذه المقالة بمثابة "حكم" تم تشكيله بعد جمع معلومات عن الصناعات غير المؤكدة. وبما أنه حكم، فيجب أن يكون الموقف واضحا، ويجب أن يكون البيان ذا معنى. وأما هل هي صحيحة أم لا، فليختبرها الزمن.
لقد اعتقد المؤلف دائمًا أن الصناعات الجديدة مزعجة، لذلك من الصحيح دائمًا استخدام عقلك أكثر والجرأة في إصدار الأحكام. وبالنسبة لأسئلة الصواب والخطأ، فإن المعدل الصحيح للتخمين الأعمى هو 50%، واحتمال التخمين بشكل غير صحيح ثلاث مرات متتالية هو 12.5%. وحتى إصدار الأحكام على مستوى رمي العملة المعدنية له معنى. ليس من المخيف إصدار حكم، والأفظع من ذلك هو أن دقة الحكم أقل من دقة رمي العملة المعدنية.
قبل أن أفتتح هذه المقالة رسميًا، أود أن أشكر العمل التالي، الذي قدم إلهامًا قيمًا ومصادر بيانات لهذه المقالة. بالطبع، بما أن العديد من الاستدلالات في هذه المقالة تعتمد على هذه الأعمال، فإذا كانت تحتوي على أخطاء أو كان لدى المؤلف فهم خاطئ، فإن الاستدلالات في هذه المقالة لن تكون قوية بعد الآن، ويُطلب من القراء إصدار أحكامهم الخاصة. لا تشكل هذه المقالة نصيحة استثمارية، ومن الصعب أن تشكل نصيحة استثمارية.
•مركز سلسلة الفكر: جهد متواصل لقياس الأداء المنطقي للنماذج اللغوية الكبيرة (
•LIMA: الأقل هو الأفضل للمحاذاة (
•يونيو 2023، مراجعة مرحلية لضبط التعليمات (
•بنية GPT-4، البنية التحتية، مجموعة بيانات التدريب، التكاليف، الرؤية، وزارة التربية والتعليم (
حسنًا، فلنبدأ هذه المقالة رسميًا.
نموذج كبير: إطلاق صاروخ إلكتروني
الخطوة الأولى في مناقشة الذكاء الاصطناعي في عام 2023 هي مناقشة ما إذا كان لا يزال من الممكن القيام بنماذج ريادة الأعمال واسعة النطاق.
لقد تحول الآن النموذج الكبير (التدريب المسبق) إلى مشكلة إطلاق الصاروخ، فطالما يمكن حرقه والاتجاه صحيح، يمكن لأي شخص أن يفعل ذلك. يمكن القول أن تدريب نموذج كبير هو إطلاق صاروخ سيبراني.
والأمر غير البديهي هو أن المستثمرين يستخفون بصعوبة تدريب النماذج الضخمة، ولكنهم يبالغون في تقدير صعوبة إطلاق صواريخ حقيقية. وبنفس التكلفة البالغة 60 مليون دولار أمريكي، سيعتقد المستثمرون أنه إذا فشل الصاروخ في الإقلاع، فستكون هناك فرصة ثانية، في حين أن الفشل في تدريب نموذج كبير سيعتبر مضيعة للمال.
لا يزال GPT-4 يستهلك 60 مليون دولار أمريكي من كفاءة استخدام وحدة معالجة الرسومات الخاصة بـ OpenAI (تبلغ حوالي 30%). هذه مسألة {الأداء = الكفاءة × التكلفة}، والأداء يمثل عائقًا. إذا لم تتمكن الشركات الناشئة الأخرى من تحقيق تأثيرات أداء أكبر من 30% × 60 مليون = 18 مليون دولار أمريكي، فيمكن للمستخدمين أيضًا استخدام GPT-4 مباشرة.
حاليًا، العديد من الشركات التي تدعي أنها تدرب نماذج كبيرة لديها جولات تمويل تتراوح من مليون دولار إلى 5 ملايين دولار. بمعنى آخر، حتى الشركات التي لديها أكبر قدر من التمويل لا تملك سوى ذخيرة كافية لدعم عملية إطلاق واحدة. حتى لو وصل معدل استخدام وحدة معالجة الرسومات لهذا الإطلاق إلى 100%، فسيكون من الصعب تجاوز GPT-4.
من هذا المنظور، من الأفضل إطلاق الصواريخ، لأن معظم الصواريخ الحالية هي مركبات إطلاق، تحمل أقمارًا صناعية إلى السماء، وسعة الحمولة الواحدة محدودة، لذا يمكن لشركات الصواريخ الصغيرة أن تتلقى طلبات للأقمار الصناعية لم يكن لدى الآخرين الوقت الكافي لها. للاطلاق.
تختلف النماذج الكبيرة، فالتكلفة الحدية للتوسع الأفقي للنماذج الكبيرة هي فقط تكلفة قوة الحوسبة، ويمكن توسيع تكلفة قوة الحوسبة بشكل مرن، مما يعني أنه بالنسبة للشركات ذات النماذج الكبيرة، فإن ربح كل طلب هو ربح مجاني. ، لا توجد أي تكلفة إضافية تقريبًا، والقدرة على التنفيذ كبيرة جدًا. من الصعب على شركة نموذجية جديدة ذات نوعية رديئة واسعة النطاق أن تتلقى الطلب الفائض.
وما لم يتم تخفيض تكلفة التدريب بشكل كبير، ستجد العديد من الشركات صعوبة في صنع نموذج كبير يمكن طرحه في السوق على المدى القصير حتى لو كانوا يعرفون البنية الكاملة لـ GPT-4.
التخصيص: مواجهة مشكلة "الفائز يأخذ كل شيء"
في صناعة الأجهزة، هناك ظاهرة شائعة تتمثل في تحقيق أرباح مبكرة من خلال الاحتياجات المخصصة، ثم تحقيق اختراقات تكنولوجية (أو معادلة) من خلال الأرباح المبكرة. ومع ذلك، فإن تخصيص صناعة النماذج واسعة النطاق من الصعب أن يصبح مخرجًا للوافدين الجدد.
فيما يتعلق بهذا الحكم، فإن التفسير بسيط للغاية: الغالبية العظمى من النماذج المضبوطة لا يمكنها اللحاق بـ GPT-4، حتى لو لحقت بالركب، فإن تكلفة التعميم مباشرة باستخدام GPT-4 أقل، والحاجة إلى الموظفين أقل والحاجة إلى الحظ أقل، ومتطلبات البيانات أقل. وطالما أن فجوة الأداء بين GPT-4 والنماذج الأخرى لا تزال موجودة، فلا يمكن أن يكون التخصيص هو الحل لشركات النماذج الكبيرة.
من الأمثلة النموذجية للغاية شركة Jasper، التي تستخدم GPT-3 المضبوطة بدقة لخدمة عملاء المؤسسات. ومع ذلك، بعد أن أصدرت OpenAI ChatGPT (GPT-3.5)، خسر مستخدموها بسرعة. لأنه يمكن الحصول على مخرجات Jasper ببساطة عن طريق إدخال GPT-3.5، دون استخدام "إصدار سابق" ذو قدرة تعميمية ضعيفة ويقتصر على الاستخدام الداخلي في المؤسسات.
بالمقارنة مع الشركات الجديدة، تتمتع Jasper على الأقل بفترة زمنية للتطوير من GPT-3 إلى GPT-3.5. ومع ذلك، تحتاج الشركات الجديدة الآن إلى مواجهة ظهور GPT-3.5 منخفض التكلفة وعالي السرعة وGPT-4 عالي الأداء في نفس الوقت.
ولذلك، فإن احتمال البقاء على أمل تجميع الأرباح من خلال التخصيص لتحقيق اختراقات تكنولوجية منخفض للغاية.
الضبط الدقيق: ضروري، لا تؤمن بالخرافات
لدى صناعة الذكاء الاصطناعي الحالية توقعات غير واقعية للضبط الدقيق، وهو أمر مبالغ فيه سواء من حيث التنفيذ الفني المحدد أو الإيقاع الفني على المستوى الكلي.
يشير الضبط الدقيق الذي تتم مناقشته حاليًا في الصناعة في الغالب إلى "الاعتماد على النموذج المُدرب مسبقًا، مما يجعله يولد إجابات تلبي النوايا البشرية". يمكن أن يسمى هذا النوع من الضبط الدقيق "المحاذاة"، أي مواءمة الإجابة مع النوايا البشرية، بدلاً من إضافة الحكمة إلى النموذج الكبير.
وفقًا لنتائج الأبحاث الخاصة بأوراق بحثية متعددة، يجب أن تأتي معرفة النماذج الكبيرة بشكل أساسي من التدريب المسبق، في حين يتم استخدام الضبط الدقيق بشكل أكبر للمحاذاة.
التفسير البسيط هو أن التدريب المسبق يحدد قدرة الدماغ، والضبط الدقيق يحدد اللغة الأم. إن ضبط النموذج الذي تم تدريبه مسبقًا هو عملية "القضاء على الأمية".
ومع ذلك، غالبًا ما يُنظر إلى الضبط الدقيق في الصناعة على أنه وسيلة "لتعزيز ذكاء" النموذج، أي أنه من خلال الضبط الدقيق لتحسين أداء النموذج وزيادة المعرفة بالنموذج، يُعتقد أن هذا يمكن أن يصل إلى "الكأس المقدسة" للذكاء الاصطناعي". هذا الخط من التفكير متحيز إلى حد ما.
أولا وقبل كل شيء، لم يتحسن أداء النموذج نفسه، ولكنه يمكن أن يتماشى بشكل أفضل مع نوايا الإنسان. وإذا تجاوز تعقيد المهمة أداء النموذج، فإن الضبط الدقيق لن يؤدي إلى النتائج المتوقعة. تمامًا مثل السماح للعقل البشري بإجراء عمليات كمومية، فإن الفشل في القيام بذلك ليس مسألة تعليم.
ثانيًا، يتم تنفيذ "ملحق المعرفة" في جزء "محاذاة النية"، ويكون التأثير أشبه بـ "الببغاء". أي: أن النموذج إنما يقلد ما يقوله الخبراء دون أن يفهم المعنى. على الرغم من أن العديد من الصناعات يمكن أن تحصل على حلول جيدة من خلال "الترديد" (بعد كل شيء، فإن معظم الصناعات ليست معقدة...)، فمن الواضح أن هذه ليست النتيجة التي ينبغي لنا أن نسعى إلى تحقيقها على المدى الطويل.
أخيرًا، بالنسبة للتدريب على "تكملة مجموعات البيانات الإضافية، وتحسين أداء النموذج، وزيادة المعرفة بالنموذج"، ينبغي اعتبار أن النموذج لديه القدرة على "التعلم المتزايد/التعلم المستمر"، أي المعلمات الكاملة للنموذج يمكن تحسينها من خلال مجموعات البيانات المتزايدة. وهذا ليس مفهومًا في نفس فئة ما يسمى بـ "ضبط التعليمات".
بشكل عام، يعد الضبط الدقيق أمرًا مهمًا للغاية، ولكن من الخطأ اتخاذ موقف "خرافي" تجاه الضبط الدقيق الحالي، خاصة أولئك الذين يتوقون إلى تسمية الضبط الدقيق الحالي بالكأس المقدسة، وهو نوع من الضبط الدقيق "الفيزياء الحالية على الصرح. هناك سحابتان داكنتان فقط تطفوان."
لنعد خطوة إلى الوراء، إذا كان من الممكن حقًا حل الطلب على "زيادة الذكاء" من خلال تحسين التعليمات، وإجراء بحث بسيط عن المتجهات، ووضع المعرفة مباشرة في السياق، ثم كتابة بعض القوالب ببساطة، فهناك احتمال كبير أنه سيكون هناك نفس التأثير أو حتى أفضل.
الجميع يحب الضبط الدقيق، وربما يكون أيضًا نوعًا من إحياء مهارات الكيمياء في العصر الحديث...
توقعات النموذج الكبير: أربع عمليات حسابية
(لاحظ أن هذا الجزء من المحتوى يعتمد بالكامل على البيانات التي كشف عنها ديلان باتل، ولا يمكن التحقق من موثوقيتها في الوقت الحالي)
يعتمد تدريب GPT-4 على سلسلة A من بطاقات N كفاءة التدريب 30% مدة التدريب حوالي شهرين التكلفة حوالي 60 مليون المبلغ الإجمالي للمعلمة {1.7 تريليون = 110 مليار × 16 نموذج خبير}. يمكنه التعامل مع مشكلة واحدة. المعلمات حوالي 280 مليار.
بمعنى آخر، هناك العديد من المعلمات الأساسية التي من شأنها أن تسبب تغييرات في نمط تدريب النماذج الكبيرة.
•كفاءة التدريب: يمكن أن تؤدي الزيادة من 30% إلى 60% إلى مضاعفة الوقت بشكل مباشر
• زيادة كثافة طاقة الحوسبة: بعد التبديل من السلسلة A إلى السلسلة H ثم إلى بطاقة الذكاء الاصطناعي المخصصة، تم تحسين كثافة طاقة الحوسبة، ويمكن حل العديد من المشكلات التي تؤثر على الكفاءة في البنية.
• انخفاض تكاليف طاقة الحوسبة: قام لاو هوانغ (مؤسس شركة Nvidia) بتخفيض بطاقة الرسومات، مما أدى إلى انخفاض التكلفة بشكل كبير
• تحسين كفاءة المعلمات: هناك مجال لتحسين كفاءة المعلمات للنموذج. وبالرجوع إلى النموذج السابق، يمكن عادة زيادة كفاءة المعلمات للنموذج القديم عدة مرات. ومن الممكن استخدام 30% لمعلمات GPT-4 لتحقيق تأثير مماثل
خلاصة القول، أن تكلفة تدريب نموذج بمستوى أداء GPT-4 من الصفر قد توفر مساحة للتحسين تتراوح بين 10 إلى 20 ضعفًا، والتي تنخفض إلى 3 ملايين دولار أمريكي إلى 6 ملايين دولار أمريكي. وهذه التكلفة فعالة للغاية من حيث التكلفة بالنسبة للشركات الناشئة. والشركات الكبيرة مقبولة أكثر.
وقد يستغرق هذا التغيير حوالي عامين حتى يكتمل.
في الوقت الحاضر، لا تزال تكنولوجيا النماذج الكبيرة السائدة تعتمد على المحولات، ولم تتغير البنية التحتية، ولم يتم استنفاد فكرة تحسين الكيمياء وإضافة المعلمات لإنشاء المعجزات. يتم تنفيذ تدريب GPT-4 على أساس قيود الطاقة الحاسوبية العالية، ووقت التدريب ليس طويلاً بما يكفي.
إذا كانت المعلمات تنمو خطيًا مع وقت التدريب، فقد يكون الحد الأعلى لمعلمات النموذج المشابه لمعمارية GPT-4 حوالي 10 تريليون، أي أن وقت التدريب يتضاعف (×2)، وتكون بطاقة الرسوميات المتوازية تمت مضاعفة (×2)، وكفاءة التدريب أسرع بمقدار النصف (×1.5)، وكفاءة المعلمة أعلى بمقدار النصف (×1.5)، وأخيراً تم الحصول على النتيجة بعشرة أضعاف. ووفقاً لأسلوب الرغبة في المخاطرة في وادي السيليكون، فإن الاحتمالية العالية لتحقيق هذه المعلمة سيتم تحقيقها خلال عام، بغض النظر عما إذا كان الأداء قد تحسن أم لا.
ومع ذلك، بعد الوصول إلى 10 تريليون معلمة، من غير المعروف تمامًا ما إذا كان LLM لا يزال بإمكانه استخدام فكرة زيادة المعلمات لتحقيق المعجزات.
إذا كان التحسن في أداء النموذج من حيث عدد المعلمات يتناقص بشكل هامشي، فمن المرجح أن يكون 10 تريليون عقبة. ومع ذلك، هناك أيضًا تخمين بأن عدد المعلمات يحسن أداء النموذج بزيادة هامشية، على غرار "إذا كان الشخص ذكيًا بما فيه الكفاية، فيمكنه تعلم كل شيء بسرعة". الأول جيد. وإذا كان الأخير صحيحا، فإن أداء النموذج قد يتزايد بشكل كبير، وسوف يكون ما سيحدث في ذلك الوقت غير قابل للتنبؤ به على الإطلاق.
من الصعب التنبؤ بالكيمياء، ولكن من السهل التنبؤ بإيقاع استراتيجية الشركة. يعد النموذج ذو المعلمة الإجمالية 10 تريليون نقطة نهاية على مستوى المعلم بالنسبة لمعظم المؤسسات، سواء كانت عملاقة مثل Google/MS/APPL أو OpenAI أصغر، ومن الممكن التوقف والقيام ببعض عمليات الاستكشاف الفني.
يمكن تحويل تفضيل المؤسسة/رأس المال للمخاطرة إلى "وقت التحمل"، فإذا كان وقت التحمل بأكمله عبارة عن حرق مكثف للنفقات، فمن الصعب أن يتجاوز 6 أشهر. التكنولوجيا البشرية لا تنمو بالسرعة الكافية، وعادة ما تستغرق الدورة 5 سنوات أو أكثر. لذلك، في غضون 5 سنوات، يمكن تقدير مقدار المعلمة النهائية للنموذج ويجب أن يتراوح بين 20 تريليون إلى 50 تريليون. وما لم يحدث تقدم كبير في التكنولوجيا/الهندسة المعمارية مرة أخرى، فإن احتمال تجاوز هذا الحجم منخفض للغاية.
تعدد الوسائط: الفيل في الغرفة
تعد تعدد الوسائط بمثابة الفيل الموجود في الغرفة وقد يؤثر بشكل عميق على مشهد مضمار السباق.
التعريف البسيط لتعدد الوسائط هو: دعم إدخال وإخراج معلومات الوسائط المتعددة. هذا التعريف فضفاض للغاية، على سبيل المثال، بعض المنتجات الموجودة في السوق والتي تدعي أنها قادرة على إجراء إدخال متعدد الوسائط هي في الواقع ChatBot مع طبقة من التعرف الضوئي على الحروف خارجها. هناك أيضًا نماذج تلبي تمامًا تعريف تعدد الوسائط، لكن أدائها مخيب للآمال. حتى قدرة إدخال الصور متعددة الوسائط لـ GPT-4 لم يتم فتحها على نطاق واسع بعد، ويمكن ملاحظة أن هذه الوظيفة ليست مستقرة جدًا.
ومع ذلك، فإن عمليات إطلاق الوسائط المتعددة ليست بعيدة المنال. هناك احتمال كبير أن يدعم GPT-5 في الأصل الوسائط المتعددة، مما يعني أن الهيكل يحتاج إلى إعادة تصميم وإعادة تدريب. وفقا للمنطق السابق، لا يزال هناك مجال للنمو من 10 إلى 50 مرة في معلمات النماذج الكبيرة. وينبغي أن يكون كافيا لوضع قدرات متعددة الوسائط فيها. لذلك، من المتوقع أن تظهر نماذج متعددة الوسائط عالية الأداء وعالية التوفر في غضون عامين، وإذا كنا متفائلين، فسيكون ذلك خلال عام واحد تقريبًا.
تعدد الوسائط هو الفيل الموجود في الغرفة، يعلم الجميع أنه سيكون هناك شيء من هذا القبيل في نهاية المطاف، ولكن العديد من المنتجات/الأبحاث/الاستراتيجيات تتجاهل وجودها لدرجة أن هناك خطأ في التقدير في الأجزاء الرئيسية.
على سبيل المثال، من الناحية النظرية، سيتم قمع نماذج الصورة الفردية بشدة من خلال النماذج متعددة الوسائط، ولكن حاليًا تتجاهل معظم الأبحاث/الاستثمارات هذه المشكلة، مما يؤدي إلى تقييمات عالية جدًا لبعض الشركات التي تركز على نماذج الصور. ومن المرجح أن تفقد هذه الشركات الحواجز التقنية وتتحول إلى مقدمي خدمات في المستقبل. وينبغي لنظام التقييم الخاص بها أن يشير إلى مقدمي الخدمات وليس شركات التكنولوجيا.
إذا كنت تريد أن تحكي قصة "الاستثمار يعتمد على الأشخاص، فإن نفس الفريق يمكنه تحويل الأعمال"، فقط تظاهر بأنني لم أقل ذلك. الأساطير موجودة دائمًا، لكن لا يمكنك تصديقها عند إجراء البحث.
من يمكنه تدريب GPT-4: نعم، ولكن ليس ضروريًا
لا يستغرق صنع الكيمياء وقتًا طويلاً، وتقوم الشركات الكبرى بشراء بطاقات الرسومات. الشيء الواضح جدًا هو أنه بعد عام، ستمتلك الشركات الكبيرة القدرة على تدريب نماذج على مستوى GPT-4. ولكن ما إذا كنت تريد التدريب أم لا هو سؤال آخر.
في مجال الألعاب، هناك اقتراح كلاسيكي يسمى "Yuanshin لعب Yuanshen"، أي: عندما يمكن للاعبين اختيار لعب Yuanshen أو منتج منافس لـ Yuanshen، إذا لم يكن المنتج المنافس جيدًا مثل Yuanshen، فالعب Original God .
وينطبق نهج "الفائز يأخذ كل شيء" أيضًا على صناعة النماذج الكبيرة. إذا اتبعت شركة ما OpenAI وبعد نصف عام من البحث والتطوير، فإنها تطلق نموذجها الكبير الخاص بها بأداء 90% مشابه لـ GPT-4، على أمل طرحه في السوق. في هذا الوقت ستواجه الشركة المشاكل التالية:
• يتمتع OpenAI بميزة النطاق المتمثلة في الموارد السحابية والتكاليف المنخفضة
•تم استخدام واجهة برمجة تطبيقات OpenAI على نطاق واسع في رموز المنتجات، ومن الصعب استبدالها
• لا يزال منتج الشركة لا يتفوق على GPT-4
• منتج الجيل التالي من OpenAI (ربما GPT-5) على وشك الإصدار
ويمكن ملاحظة أن الشركة تتعرض لضغوط كبيرة. بدلاً من تدريب GPT-4، من الأفضل المراهنة مباشرة على نموذج الجيل التالي (مقارنة بـGPT-5). وبعد ذلك ستتغير المشكلة من "مشكلة منتج منافس مماثل" إلى "مشكلة الابتكار التكنولوجي". وهذا عبء لا يطاق بالنسبة للشركات الصغيرة.
لذلك، فإن مناقشة "من يمكنه تدريب GPT-4" هي قضية استراتيجية ميتة، وبدلاً من التفكير في هذه القضية، من الأفضل إيجاد اتجاه أكثر يقينًا وفرصًا أكثر.
نصيحة للشركات الناشئة العاملة في مجال الذكاء الاصطناعي: الأداء أولاً، وتجنب الركود
كتب المؤلف العديد من المقالات التي تشكو من langchain، والسبب الأساسي هو أن langchain لا يترك مجالًا للمطورين لتحسين الأداء. يطلق عليه بشكل ملطف "الإطار العالمي". ومن أجل ضمان العالمية، تم التخلي عن مجال كبير لتحسين أداء النماذج الكبيرة، مثل الحوار متعدد الجولات والتحكم في التنسيق الذي يتم تنفيذه عن طريق الضبط الدقيق. وبالمثل، هناك التوجيه/Auto-GPT/BabyAGI وما إلى ذلك، وكلها تريد أن تكون "إطار عمل يمكن استخدامه مدى الحياة".
الحقيقة الموضوعية هي أن OpenAI أصدرت استدعاء الوظائف في مايو، والعديد من الأماكن المزعجة في الكود لديها حلول تنفيذ أفضل، وتكلفة تنفيذ حل أفضل هي إعادة هيكلة الأجزاء الرئيسية من كود المنتج. في أغسطس، أصدرت شركة OpenAI الإذن بضبط GPT-3.5، والعديد من الروابط التي تتطلب تحكمًا دقيقًا في المخرجات لديها حلول محتملة جديدة.
ولذلك، يتعين على الشركات الناشئة أن تواجه خياراً رئيسياً: هل ينبغي لها أن تختار ① تحسين الأداء وإعادة تصميم المنتجات بشكل مستمر، أو ② الحد من استخدام الميزات الجديدة واستخدام الميزات القديمة دائماً من أجل التطوير؟
بالنسبة لريادة أعمال تطبيقات التكنولوجيا الجديدة، لا يمثل "التطوير" عملية كتابة التعليمات البرمجية فحسب، بل يمثل أيضًا "الحد الأعلى" لوظيفة/استراتيجية المنتج. كلما ارتفع الأداء الذي يمكن التحكم فيه، زادت الوظائف النظرية للمنتج وزادت مرونته الإستراتيجية.
لا يمكن التنبؤ بتطور التكنولوجيا، وقد تؤدي الإبداعات التكنولوجية الصغيرة إلى تغييرات حساسة للغاية في المشهد التنافسي. وينبغي للشركات البادئة أن تتمتع بالقدرة على مقاومة الهشاشة في تطوير التكنولوجيا.
—— بكلمات إنسانية: يجب إعطاء الأولوية للأداء وتجنب البقاء. على مستوى التطوير، استخدم المزيد من الميزات الجديدة؛ وعلى جانب المنتج، فكر في الوظائف التي يمكن أن تؤديها الميزات الجديدة؛ وعلى الجانب الاستراتيجي، فكر في تأثير الميزات الجديدة على الإستراتيجية.
في "ممر تشين"، ذكر أنه بعد تأسيس أسرة تشين، تمت مصادرة الأسلحة المعدنية من جميع أنحاء العالم وصبها في اثني عشر تمثالًا برونزيًا للقضاء على احتمالية الانتفاضات المدنية. ولكن من المعروف أن أسرة تشين كانت قصيرة العمر. إن الاهتمام بالتغييرات أكثر فائدة من تجاهلها.
نصيحة للشركات الناشئة في مجال الذكاء الاصطناعي: إنشاء التطبيقات بثقة
هناك خطر خفي شائع جدًا عندما تقوم الشركات الناشئة بتطوير التطبيقات: دخول الشركات الكبيرة. لا تشمل الشركات الكبرى هنا عمالقة التطبيقات فقط، مثل Meta/Byte/Tencent وما إلى ذلك، ولكن أيضًا الشركات الرائدة في مجال الذكاء الاصطناعي، مثل OpenAI.
عادة ما يكون هناك سببان لدخول الشركات الكبيرة إلى السوق: نشر فرص المنتجات، وتقليص المنبع والمصب.
"فرص تخطيط المنتج" هو المعنى الحرفي، وتشعر الشركات الكبيرة أن هذا الاتجاه يستحق المتابعة، لذلك تفعل ذلك.
"القطع بين المنبع والمصب" هو في الغالب خطوة عاجزة. قد يكون ذلك لأنني طورت نموذجًا كبيرًا مشابهًا لـ OpenAI. ومع ذلك، نظرًا لمشكلة الفائز يأخذ كل شيء في النماذج الكبيرة، لا يوجد مستخدمون، مما يؤدي إلى في حرق التكاليف، ولا إيرادات، ولا بيانات، الأمر الذي يؤدي بدوره إلى تأخر الأداء تدريجياً. في هذا الوقت، يعد التدخل في المراحل النهائية وتطوير تطبيقات محددة واستخدام التكنولوجيا الخاصة بك هي الخيارات الوحيدة.
وفقًا للتجربة التاريخية، وبسبب مشكلة الهيكل التنظيمي، كلما اقتربت الشركة من المصب، كان من الأسهل أن تتخلف عن الركب في مجال التكنولوجيا، وكلما كانت التكنولوجيا أكثر تخلفًا، كلما زاد حاجتها إلى المصب. سوف تتنافس شركات التكنولوجيا المزعومة هذه في نهاية المطاف على نفس المكانة البيئية مثل شركات طبقة التطبيقات.
ومع ذلك، في ساحة معركة طبقة التطبيق، نظرًا لقصر وقت تكنولوجيا الذكاء الاصطناعي، لا توجد ميزة نطاق فعالة وقابلة لإعادة الاستخدام، ونقطة البداية للشركات الكبيرة والشركات الناشئة متشابهة. بالمقارنة مع الشركات الكبيرة، تعتبر الشركات الناشئة أكثر كفاءة ولديها رؤى أعمق، مما يجعل الاستفادة منها أسهل.
شيء واحد جدير بالملاحظة هو أن جميع المواد الترويجية لـ MS Azure تقريبًا تدور الآن حول OpenAI، ومع ذلك، فإن شركة كبيرة مثل Microsoft تعتمد بالكامل على OpenAI كمنصة لها، مما يثبت من الجانب أن الشركات الناشئة تتمتع بمزايا طبيعية في مجال الذكاء الاصطناعي.
بالطبع، قد لا يتمكن بعض بائعي الخدمات السحابية من قبول أن تقودهم الشركات الناشئة ويريدون التهام السوق بالكامل بأنفسهم. إنها باهظة الثمن وبطيئة ولا تشكل تهديدًا مباشرًا.
والحقيقة هي أن هناك بالفعل بعض مسارات تطبيقات الذكاء الاصطناعي قصيرة العمر للغاية، ولكن لا يزال هناك العديد من المسارات طويلة العمر التي لم يتم اكتشافها بعد، وتطبيقات الذكاء الاصطناعي لا يفوز فيها الفائز بكل شيء. يعد التوسع من التطبيقات إلى الأنظمة الأساسية أو التقنيات أيضًا مسارًا أكثر جدوى.
لذلك، يجب أن نلقي نظرة عقلانية على قدرة الشركات الكبيرة على غزو طبقة التطبيقات. اقتراحنا هو أن الشركات الناشئة في مجال الذكاء الاصطناعي يمكنها تقديم التطبيقات بثقة.
نصيحة للشركات الناشئة العاملة في مجال الذكاء الاصطناعي: انتبه إلى شريان حياة المنتج
كما ذكرنا سابقًا، يمكن للشركات الناشئة في مجال الذكاء الاصطناعي إنشاء تطبيقات بأمان، ولكن يجب عليها مراعاة أداء نموذج الذكاء الاصطناعي وتجنب البقاء فيه. ويتجلى هذا الوضع بشكل مباشر في أن منتجات الذكاء الاصطناعي قد تفقد قاعدة الطلب الخاصة بها وتذبل تدريجياً خلال بضعة أشهر، وقد يحدث هذا الوضع بشكل متكرر.
تحتاج تطبيقات الذكاء الاصطناعي إلى استخدام خدمات النماذج الكبيرة، ويستمر أداء النماذج الكبيرة في التحسن. هذا التحسن ليس تحسينًا في بُعد واحد مثل "السرعة"، ولكنه تغيير في جميع الجوانب مثل جودة الإخراج وطول الإخراج وإمكانية التحكم في الإخراج. ستؤدي كل ترقية مهمة في التكنولوجيا إلى تخلف منتجات طبقة التطبيقات الحالية من الناحية التكنولوجية وإنشاء فرص جديدة ومنافسين جدد.
نطلق على الوقت الذي يحتفظ فيه تطبيق الذكاء الاصطناعي بالمزايا والضرورة في الإستراتيجية/المنتج/التكنولوجيا باسم "شريان الحياة".
فيما يلي بعض الأمثلة ذات شرايين الحياة الأقصر:
• عندما يدعم ChatGPT/Claude تحميل الملفات، يصبح ChatPDF غير ضروري
•عندما يدعم Office365 برنامج Copilot، ستفقد المنتجات التي تستخدم الذكاء الاصطناعي لرسم PPT مزاياها
• عند ظهور GPT-3.5، لن يعد Jasper ضروريًا
**بالنظر إلى أن صناعة الذكاء الاصطناعي تتطور بسرعة، فإن شريان الحياة المحدود هو القاعدة. لذلك، فإن قبول حقيقة أن شريان الحياة محدود ومحاولة اختيار اتجاه ذو شريان حياة أطول سيساعد في الحفاظ على المزايا طويلة المدى وضرورة المنتج. **
بشكل عام، يمكن تقسيم شريان الحياة ببساطة إلى مستويات 3/6/12 شهرًا.
•3 أشهر: الوظائف التي لم يتوفر لدى الشركات الكبيرة الوقت الكافي لتنفيذها (مثل وظائف المكتب/ChatGPT التي لم يتوفر لها الوقت الكافي لتنفيذها)
• 6 أشهر: يصعب تنفيذه ولا يمكن دمجه في الحلول الحالية، ولكن المزايا/الضروريات ستختفي مع تحسين أداء الذكاء الاصطناعي (مثل إطار الذكاء الاصطناعي العام)
•12 شهرًا: المزايا/الضروريات يمكن أن تستمر لفترة طويلة ولا تتأثر بسهولة بالشركات الكبرى/التطورات التكنولوجية (مثل معانقة الوجه)
*إن دورة حياة منتجات المنصة ليست بالضرورة طويلة، ففي نهاية المطاف، المتاجر هي أيضًا منصات
تحتاج الشركات الناشئة إلى شريان حياة مدته 6 أشهر فقط لتحديد اتجاهها، ومن الصعب الحصول على شريان حياة مدته 12 شهرًا.
عندما يصل شريان حياة المنتج إلى النهاية، هناك حالتان بشكل عام. الوضع الأول هو اختفاء المزايا وتحتاج تكنولوجيا ترقية المنتج إلى إعادة البناء.يرجى الرجوع إلى "الأداء أولاً" أعلاه؛ والموقف الثاني هو اختفاء الضرورة وسيتم استبدال المنتج تدريجيًا.في هذا الوقت، سيتم استبدال المنتج لا يزال هناك عدة أشهر من "عمر التشغيل" كافية للشركات الناشئة لاختيار الاتجاه التالي.
نصيحة للشركات الناشئة في مجال الذكاء الاصطناعي: يمكن لـ Web3+AI القيام بذلك
حاليًا، هناك العديد من المشاريع الريادية حول موضوع Web3+AI، ومع ذلك، نظرًا لعدم اليقين بشأن تطور التكنولوجيا والمرحلة المبكرة من السوق، فإن موضوع Web3+AI سيظل به العديد من المتغيرات في المستقبل.
الغرض من هذا المقال هو إيجاد اليقين مع احتمالية عالية للصواب في حالة عدم اليقين، لذلك لا يزال المؤلف يأمل في طرح بعض الأفكار واقتراح بعض المحاور والتوجهات التي قد تكون لها فرص للرجوع إليها من قبل الشركات الناشئة و الباحثين المهتمين.
• نزع السيادة/اللامركزية
في الوقت الحاضر، لا يقدم القادة في صناعة الذكاء الاصطناعي سوى نماذج مغلقة المصدر، ولا يمكن السيطرة على الاستقرار والشفافية والحياد في تقديم خدماتهم المستمرة. قد تصبح إزالة السيادة/اللامركزية موضوعًا مهمًا في صناعة الذكاء الاصطناعي، أي توفير خدمات ذكاء اصطناعي مستقرة وشفافة ومحايدة بناءً على البنية الأساسية لنزع السيادة/اللامركزية.
إن إلغاء السيادة/اللامركزية هو "بديل" و"ردع" يمكن أن يزيد بشكل كبير من التكاليف غير الأخلاقية لشركات الذكاء الاصطناعي المركزية/السيادية ويمنعها من استخدام نماذج الذكاء الاصطناعي في المجالات العسكرية والطائفية والسياسة وغيرها من الجوانب.
في الحالات القصوى، بمجرد أن لا تصبح خدمات الذكاء الاصطناعي المركزية/السيادية متاحة/جديرة بالثقة لسبب ما، يمكن أن يستمر الذكاء الاصطناعي غير السيادي/اللامركزي في تقديم خدمات متاحة للغاية لمنع البلدان/المناطق الفردية وحتى البشرية من فقدان الذكاء الاصطناعي.
• التطبيق العملي لقوة الحوسبة
خلف تحول ETH من إثبات العمل (PoW) إلى إثبات الحصة (PoS) تكمن المعضلة المنتقدة المتمثلة في "التعدين لا يولد قيمة". يمكن أن يوفر الجمع بين Web3 و AI سيناريو عمليًا لقوة الحوسبة، وذلك لتحقيق استيعاب قوة حوسبة الأسهم وتعزيز نمو إجمالي قوة الحوسبة، وما إلى ذلك التأثير.
•الأصول الافتراضية
يعد الذكاء الاصطناعي أحد الأصول الأصلية لقوة الحوسبة والتخزين، ويمكن أن يوفر الجمع بين Web3 والذكاء الاصطناعي قناة لتحويل الذكاء الاصطناعي إلى أصول افتراضية، وإنشاء أصول افتراضية أصلية حقيقية لـ Web3 مع تحقيق إنشاء قيمة صناعة الذكاء الاصطناعي.
•متغيرات لتطبيقات Web3
قد يوفر الجمع بين Web3 وAI وظائف جديدة وفرص نمو لتطبيقات Web3، ويمكن إعادة تصميم تطبيقات Web3 الحالية بالكامل.
مكتوب في النهاية: نحن في سبتمبر، هل لا يزال الذكاء الاصطناعي يستحق بدء عمل تجاري الآن
اسمحوا لي أن أتحدث عن الاستنتاج أولاً: إنه أمر جدير بالاهتمام، ويمكن استخدام هذا الاستنتاج حتى حلول السنة الصينية الجديدة باحتمال كبير.
غالبًا ما يكون تصور الناس للمواقف متحيزًا، وأنا لست استثناءً. البعض متفائل للغاية والبعض الآخر متشائم للغاية. تواصل المؤلف ذات مرة مع فريقين. يعتقد أحد الفريقين أنه سيكون قادرًا على بناء وكيل ذكاء اصطناعي في الربع الأول من العام المقبل، بينما يشعر الفريق الآخر أن الذكاء الاصطناعي مناسب فقط لإدارة قاعدة المعرفة. من الواضح أن الأول متفائل للغاية، في حين أن الفريق الآخر يعتقد أن الذكاء الاصطناعي مناسب فقط لإدارة قاعدة المعرفة. هذا الأخير متشائم للغاية.
عند وضع خطط طويلة المدى، فإن التفاؤل الزائد أو التشاؤم الزائد سيؤدي إلى مخاطر، والملاحظات المتداولة على نطاق واسع غالبًا ما تكون هذه الملاحظات شديدة التحيز، مما يجعل التفكير المستقل ثمينًا للغاية. لذلك، بغض النظر عما إذا كان القارئ يمكنه قبول آراء هذه المقالة، طالما أن القارئ لديه تفكير وحكم مستقل أثناء عملية القراءة، سيكون المؤلف سعيدًا للغاية.
وأخيراً أعلن. إذا كانت لديك فكرة جيدة لبدء تشغيل الذكاء الاصطناعي أو كان لديك بالفعل مشروع مكتمل، فلا تتردد في التواصل مع أصدقاء NGC (مثلي).
نحن نحدد المشاريع ذات الابتكارات الثورية، التي تهدف إلى حل المشكلات من خلال حلول تتميز بالبساطة والقدرة على تحمل التكاليف والسرعة والتفرد وملاءمة السوق للمنتج.