NGC Ventures: نحن في شهر سبتمبر، فهل يستحق الذكاء الاصطناعي بدء عمل تجاري الآن؟

المؤلف الأصلي: شيري، NGC Ventures

مقدمة

تم الانتهاء من المسودة الأولى لهذا المقال في وقت فراغي في نهاية شهر أغسطس، وبعد نشره على عجل، تلقيت الكثير من النصائح، فقمت بإضافة وتغيير وحذف بعض المحتوى لتجنب إضحاك الناس.

يقيّم محتوى هذه المقالة بشكل أساسي الوضع الحالي لصناعة الذكاء الاصطناعي من منظور استثماري، ويعكس ويخمّن مسارات التكنولوجيا/المنتج للشركات المختلفة، ويلخص بشكل تجريدي استراتيجيات الشركات في صناعة الذكاء الاصطناعي. ولذلك، هناك حتما إغفالات في الأجزاء المتعلقة بتقنيات محددة، يرجى تحملني.

لكن في التحليل النهائي، لا تزال العديد من الشركات الكبرى التي يمكنها نشر الأبحاث ممزقة، ولا يبدو أن أحدًا قادر على تقييم مدى صحة محتوى هذه المقالة. تمامًا مثل تسجيل GPT-3.5 مع GPT-4، يبدو الأمر معقولًا، لكنه يكون مجردًا بعض الشيء عندما تفكر فيه.

ولذلك يوصي المؤلف باعتبار هذه المقالة بمثابة "حكم" تم تشكيله بعد جمع معلومات عن الصناعات غير المؤكدة. وبما أنه حكم، فيجب أن يكون الموقف واضحا، ويجب أن يكون البيان ذا معنى. وأما هل هي صحيحة أم لا، فليختبرها الزمن.

يعتقد المؤلف دائمًا أن: الصناعة الجديدة صاخبة، ومن الصواب دائمًا استخدام عقلك والجرأة على إصدار الأحكام. وبالنسبة لأسئلة الصواب والخطأ، فإن المعدل الصحيح للتخمين الأعمى هو 50%، واحتمال التخمين الخاطئ ثلاث مرات متتالية هو 12.5%. وحتى لو كان مستوى الحكم على مستوى رمي العملة المعدنية، فإنه ذو معنى. ليس من المخيف إصدار حكم، لكن الأفظع هو أن دقة الحكم أقل من دقة رمي العملة المعدنية.

قبل أن أبدأ هذه المقالة رسميًا، أود أن أشكر الأشخاص التاليين على عملهم، الذي قدم مصدر إلهام وبيانات قيمًا لهذه المقالة. بالطبع، نظرًا لأن العديد من الاستدلالات في هذه المقالة تعتمد على هذه الأعمال، فإذا كانت هناك أخطاء فيها أو كان فهم المؤلف خاطئًا، فلن تكون الاستدلالات في هذه المقالة قوية بعد الآن، ويُطلب من القراء الحكم بأنفسهم. لا تشكل هذه المقالة نصيحة استثمارية، ولا تكاد تشكل نصيحة استثمارية.

  • مركز سلسلة الفكر: جهد متواصل لقياس الأداء المنطقي للنماذج اللغوية الكبيرة (
  • ليما: الأقل هو الأكثر للمحاذاة (
  • يونيو 2023، مراجعة مرحلية لضبط التعليمات (
  • بنية GPT-4، البنية التحتية، مجموعة بيانات التدريب، التكاليف، الرؤية، وزارة التربية والتعليم (

حسنًا، فلنبدأ هذه المقالة رسميًا.

نموذج بالحجم الطبيعي: إطلاق صاروخ إلكتروني

الخطوة الأولى في مناقشة الذكاء الاصطناعي في عام 2023 هي مناقشة ما إذا كان لا يزال من الممكن القيام بريادة الأعمال واسعة النطاق.

لقد تحول الآن النموذج الكبير (التدريب المسبق) إلى مشكلة إطلاق الصاروخ، وطالما تم إطلاق النار والاتجاه الصحيح، يمكن لأي شخص أن يفعل ذلك. ويمكن القول أن تدريب النماذج الكبيرة يشبه إطلاق الصواريخ السيبرانية.

والأمر غير البديهي هو أن المستثمرين يستخفون بصعوبة تدريب النماذج الضخمة، ولكنهم يبالغون في تقدير صعوبة إطلاق صواريخ حقيقية. وبنفس التكلفة البالغة 60 مليون دولار أمريكي، سيشعر المستثمرون أن هناك فرصة ثانية لإطلاق صاروخ فاشل، ويعتبر الفشل في تدريب نموذج كبير مضيعة للمال.

لا يزال GPT-4 يستهلك 60 مليون دولار من كفاءة استخدام وحدة معالجة الرسومات الخاصة بـ OpenAI (يُقال إنها تبلغ حوالي 30%). هذه مسألة {الأداء = الكفاءة × التكلفة}، والأداء يشكل عائقا. إذا لم تتمكن الشركات الناشئة الأخرى من تحقيق تأثيرات أداء أكبر من 30٪ × 60 مليون = 18 مليون دولار، فقد يستخدم المستخدمون GPT-4 مباشرة.

في الوقت الحالي، العديد من الشركات التي تدعي أنها تقوم بتدريب نماذج كبيرة لديها جولات تمويل تتراوح بين مليون دولار أمريكي و5 ملايين دولار أمريكي. بمعنى آخر، حتى الشركات التي لديها أكبر قدر من التمويل لا تملك سوى ذخيرة كافية لدعم عملية إطلاق واحدة. حتى لو وصل معدل استخدام وحدة معالجة الرسومات لهذا الإطلاق إلى 100%، فسيكون من الصعب تجاوز GPT-4.

من هذا المنظور، من الأفضل إطلاق الصواريخ، لأن معظم الصواريخ الحالية هي مركبات إطلاق، تحمل أقمارًا صناعية إلى السماء، وسعة الحمولة الواحدة محدودة، لذا يمكن لشركات الصواريخ الصغيرة أن تتلقى طلبات للأقمار الصناعية لم يكن لدى الآخرين الوقت الكافي لها. للاطلاق.

تختلف النماذج الكبيرة، فالتكلفة الحدية للتوسع الأفقي للنماذج الكبيرة هي فقط تكلفة قوة الحوسبة، ويمكن توسيع تكلفة قوة الحوسبة بشكل مرن، مما يعني أنه بالنسبة للشركات ذات النماذج الكبيرة، فإن ربح كل طلب هو ربح مجاني. ، لا توجد أي تكلفة إضافية تقريبًا، والقدرة على التنفيذ كبيرة جدًا. بالنسبة للشركات النموذجية الكبيرة المنشأة حديثًا ذات الجودة الرديئة، فمن الصعب تلقي الطلب الفائض.

وما لم يتم تخفيض تكلفة التدريب بشكل كبير، حتى لو كانت البنية الكاملة لـ GPT-4 معروفة، فسيكون من الصعب على العديد من الشركات صنع نموذج كبير يمكن طرحه في السوق على المدى القصير.

التخصيص: مواجهة مشكلة "الفائز يأخذ كل شيء".

في صناعة الأجهزة، هناك ظاهرة شائعة تتمثل في تحقيق أرباح مبكرة من خلال الاحتياجات المخصصة، ثم تحقيق اختراقات تكنولوجية (أو معادلة) من خلال الأرباح المبكرة. ومع ذلك، فإن التخصيص في صناعة النماذج الكبيرة لا يكاد يكون منفذاً للوافدين الجدد.

فيما يتعلق بهذا الحكم، فإن التفسير بسيط للغاية: فالأغلبية العظمى من النماذج المضبوطة بدقة لا يمكنها اللحاق بـ GPT-4. وحتى لو لحقت بالركب، فإن استخدام GPT-4 مباشرة للتعميم أرخص، ويتطلب عددًا أقل من الموظفين، ويتطلب قدرًا أقل من الحظ. متطلبات البيانات أقل. وطالما أن فجوة الأداء بين GPT-4 والنماذج الأخرى لا تزال موجودة، فلا يمكن أن يكون التخصيص هو الحل لشركات النماذج الكبيرة.

من الأمثلة النموذجية للغاية شركة Jasper، التي تستخدم GPT-3 المضبوطة بدقة لخدمة عملاء المؤسسات. ومع ذلك، بعد أن أصدرت OpenAI ChatGPT (GPT-3.5)، خسر مستخدموها بسرعة. لأنه يمكن الحصول على مخرجات Jasper ببساطة عن طريق إدخال GPT-3.5 دون استخدام "إصدار سابق" يتم تعميمه بشكل سيء ويقتصر على الاستخدام الداخلي.

بالمقارنة مع الشركات الجديدة، فإن Jasper على الأقل لديه فترة زمنية للتطوير من GPT-3 إلى GPT-3.5. ومع ذلك، تحتاج الشركات الجديدة الآن إلى مواجهة ضغط GPT-3.5 منخفض التكلفة وعالي السرعة وGPT-4 عالي الأداء في نفس الوقت.

ولذلك، فإن احتمال البقاء على أمل تجميع الأرباح من خلال التخصيص لتحقيق اختراقات تكنولوجية منخفض للغاية.

الضبط الدقيق: ضروري، لا تؤمن بالخرافات

لدى صناعة الذكاء الاصطناعي الحالية توقعات غير واقعية فيما يتعلق بالضبط الدقيق، وهي توقعات مبالغ فيها من حيث التنفيذ الفني المحدد والإيقاع الفني على المستوى الكلي.

يشير الضبط الدقيق الذي تتم مناقشته حاليًا في الصناعة في الغالب إلى "استنادًا إلى النموذج المُدرب مسبقًا، بحيث يمكنه توليد إجابات متوافقة مع نوايا الإنسان". يمكن أن يسمى هذا النوع من الضبط الدقيق "المحاذاة"، وهو مواءمة الإجابات مع النية البشرية، بدلاً من إضافة الذكاء إلى النموذج الكبير.

وفقًا لنتائج الأبحاث الخاصة بأوراق بحثية متعددة، يجب أن تأتي معرفة النماذج الكبيرة بشكل أساسي من التدريب المسبق، في حين يتم استخدام الضبط الدقيق بشكل أكبر للمحاذاة.

التفسير البسيط هو أن التدريب المسبق يحدد قدرة الدماغ، والضبط الدقيق يحدد اللغة الأم. إن ضبط النموذج الذي تم تدريبه مسبقًا هو عملية "القضاء على الأمية".

ومع ذلك، غالبًا ما يُنظر إلى الضبط الدقيق في الصناعة على أنه وسيلة "لإضافة الذكاء" إلى النموذج، أي تحسين أداء النموذج وزيادة المعرفة بالنموذج من خلال الضبط الدقيق. ويُعتقد أنه بهذه الطريقة، يتم تحقيق "الكأس المقدسة" الذكاء الاصطناعي" يمكن الوصول إليه. هذا الخط من التفكير متحيز إلى حد ما.

أولا وقبل كل شيء، لم يتحسن أداء النموذج نفسه، ولكنه يمكن أن يتماشى بشكل أفضل مع نوايا الإنسان. وإذا تجاوز تعقيد المهمة أداء النموذج، فإن الضبط الدقيق لن يؤدي إلى النتائج المتوقعة. إن الأمر أشبه بجعل العقل البشري يقوم بإجراء حسابات كمية، وهي ليست مسألة تعليم إذا لم يكن من الممكن القيام بذلك.

ثانيًا، يتم تنفيذ "ملحق المعرفة" في جزء "محاذاة النية"، ويكون التأثير أشبه بـ "الببغاء". أي: أن النموذج إنما يقلد ما يقوله الخبراء دون أن يفهم المعنى. على الرغم من أن العديد من الصناعات يمكن أن تحصل على حلول جيدة من خلال "الترديد" (ففي نهاية المطاف، معظم الصناعات ليست معقدة...)، فمن الواضح أن هذه ليست النتيجة التي ينبغي لنا أن نسعى إلى تحقيقها على المدى الطويل.

أخيرًا، بالنسبة للتدريب على "تكملة مجموعات البيانات الإضافية، وتحسين أداء النموذج، وزيادة المعرفة بالنموذج"، ينبغي اعتبار أن النموذج لديه القدرة على "التعلم المتزايد/التعلم المستمر"، أي المعلمات الكاملة للنموذج يمكن تحسينها من خلال مجموعات البيانات المتزايدة. وهذا ليس مفهومًا في نفس فئة ما يسمى بـ "ضبط التعليمات".

بشكل عام، الضبط الدقيق مهم جدًا، ولكن من الخطأ أن يكون لدينا موقف "خرافي" تجاه الضبط الدقيق الحالي، وخاصة الاندفاع لختم الضبط الدقيق الحالي باعتباره الكأس المقدسة، وهو تمامًا "على الصرح" في الفيزياء اليوم "لا يوجد سوى سحابتين داكنتين عائمتين."

إذا نظرنا خطوة إلى الوراء، إذا كان من الممكن بالفعل حل الحاجة إلى "زيادة الذكاء" من خلال الضبط الدقيق للتعليمات، وإجراء بحث بسيط عن المتجهات، وتوصيل المعرفة مباشرة إلى السياق، وكتابة بعض القوالب ببساطة، فهناك احتمال كبير أنه يمكن تحقيق نفس النتائج أو حتى أفضل منها.

الجميع يحب الضبط الدقيق، وربما يكون أيضًا نوعًا من إحياء مهارات الكيمياء في العصر الحديث...

التوقعات للنماذج الكبيرة: أربع عمليات حسابية

(لاحظ أن هذا الجزء من المحتوى يعتمد بالكامل على البيانات التي كشف عنها ديلان باتل، ولا يمكن التحقق من موثوقيتها في الوقت الحالي)

يعتمد تدريب GPT-4 على سلسلة A من بطاقات N كفاءة التدريب 30% مدة التدريب حوالي شهرين التكلفة حوالي 60 مليون المبلغ الإجمالي للمعلمة {1.7 تريليون = 110 مليار × 16 نموذجًا خبيرًا}. يمكنه التعامل مع مشكلة واحدة. المعلمات حوالي 280 مليار.

بمعنى آخر، هناك العديد من المعلمات الأساسية التي من شأنها أن تسبب تغييرات في نمط تدريب النماذج الكبيرة.

  • كفاءة التدريب: زيادة من 30% إلى 60% يمكن أن تقصر الوقت بشكل مباشر بمقدار الضعف
  • زيادة كثافة طاقة الحوسبة: بعد التغيير من السلسلة A إلى السلسلة H ثم إلى البطاقة المخصصة للذكاء الاصطناعي، تم تحسين كثافة طاقة الحوسبة، ويمكن حل العديد من المشكلات التي تؤثر على كفاءة البنية
  • انخفضت تكلفة الطاقة الحاسوبية: قام لاو هوانغ (مؤسس شركة Nvidia) بخصم بطاقة الرسوميات، وانخفضت التكلفة بشكل كبير
  • تحسين كفاءة المعلمة : هناك مجال لتحسين كفاءة المعلمة للنموذج وبالرجوع إلى الماضي يمكن عادة تحسين كفاءة المعلمة للنموذج الجديد عدة مرات مقارنة بالنموذج القديم ومن الممكن استخدام 30٪ لمعلمات GPT-4 لتحقيق تأثيرات مماثلة.

لتلخيص ذلك، فإن تكلفة تدريب نموذج بأداء مستوى GPT-4 من الصفر قد تبلغ 10 إلى 20 ضعف مساحة التحسين، أي أنه يمكن ضغطها إلى 3 ملايين دولار أمريكي إلى 6 ملايين دولار أمريكي. وهذه التكلفة مكلفة للغاية. فعالة للشركات الناشئة والشركات الكبيرة وأكثر قبولا.

قد يستغرق هذا التغيير حوالي عامين حتى يكتمل.

في الوقت الحاضر، لا تزال تكنولوجيا النماذج الكبيرة السائدة تعتمد على المحولات، ولم تتغير البنية التحتية، ولم يتم استنفاد فكرة تحسين الكيمياء وإضافة المعلمات لإنشاء المعجزات. يتم تنفيذ تدريب GPT-4 على أساس قوة حوسبة محدودة للغاية، ووقت التدريب ليس طويلاً بما يكفي.

إذا كانت المعلمات تنمو خطيًا مع وقت التدريب، فقد يكون الحد الأعلى لمعلمات النموذج المشابه لمعمارية GPT-4 حوالي 10 تريليون، أي أن وقت التدريب يتضاعف (× 2)، وتكون بطاقة الرسوميات المتوازية تمت مضاعفة (× 2) ، وكفاءة التدريب بنصف السرعة (× 1.5)، وكفاءة المعلمة بنصف الارتفاع (× 1.5)، والنتيجة النهائية أفضل بعشر مرات. ووفقاً لأسلوب الرغبة في المخاطرة في وادي السيليكون، فإن الاحتمالية العالية لتحقيق هذه المعلمة سيتم تحقيقها خلال عام، بغض النظر عما إذا كان الأداء قد تحسن أم لا.

ومع ذلك، بعد الوصول إلى 10 تريليون معلمة، من غير المعروف تمامًا ما إذا كان LLM لا يزال بإمكانه استخدام فكرة زيادة المعلمات لتحقيق المعجزات.

إذا كان التحسن في أداء النموذج من حيث عدد المعلمات يتناقص بشكل هامشي، فمن المرجح أن يكون 10 تريليون هو الحد الأدنى. ومع ذلك، هناك أيضًا تخمين بأن عدد المعلمات يحسن أداء النموذج بزيادة هامشية، على غرار "إذا كان الشخص ذكيًا بما فيه الكفاية، فيمكنه تعلم كل شيء بسرعة". الأول جيد. وإذا كان الأخير صحيحا، فإن أداء النموذج قد يتزايد بشكل كبير، وسوف يكون ما سيحدث في ذلك الوقت غير قابل للتنبؤ به على الإطلاق.

من الصعب التنبؤ بالكيمياء، ولكن من السهل التنبؤ بإيقاع استراتيجية الشركة. يعد النموذج ذو المعلمة الإجمالية 10 تريليون نقطة نهاية على مستوى المعلم بالنسبة لمعظم المؤسسات، سواء كانت عملاقة مثل Google/MS/APPL أو OpenAI أصغر، ومن الممكن التوقف والقيام ببعض عمليات الاستكشاف الفني.

يمكن تحويل تفضيل المؤسسات/رأس المال للمخاطرة إلى "وقت التحمل"، فإذا كان وقت التحمل بأكمله عبارة عن حرق مكثف للنفقات، فسيكون من الصعب تجاوز 6 أشهر. لا تنمو الحرفية البشرية بالسرعة الكافية، وعادة ما تستغرق الدورة 5 سنوات أو أكثر. لذلك، في غضون 5 سنوات، يمكن تقدير مقدار المعلمة النهائية للنموذج ويجب أن يتراوح بين 20 تريليون إلى 50 تريليون. وما لم يحدث تقدم كبير في التكنولوجيا/الهندسة المعمارية مرة أخرى، فإن احتمال تجاوز هذا الحجم منخفض للغاية.

تعدد الوسائط: الفيل في الغرفة

تعد تعدد الوسائط بمثابة الفيل الموجود في الغرفة وقد يؤثر بشكل عميق على مشهد مضمار السباق.

التعريف البسيط للوسائط المتعددة هو: دعم إدخال وإخراج معلومات الوسائط المتعددة. هذا التعريف فضفاض للغاية، على سبيل المثال، بعض المنتجات الموجودة في السوق والتي تدعي أنها قادرة على إجراء إدخال متعدد الوسائط هي في الواقع طبقة من التعرف الضوئي على الحروف (OCR) على السطح الخارجي لـ ChatBot. هناك أيضًا نماذج تلبي تمامًا تعريف تعدد الوسائط، لكن أدائها ليس ممتعًا. حتى قدرة إدخال الصور متعددة الوسائط في GPT-4 لم يتم فتحها على نطاق واسع، ويمكن ملاحظة أن هذه الوظيفة ليست مستقرة جدًا.

ومع ذلك، فإن إطلاق الوسائط المتعددة ليس بعيدًا. هناك احتمال كبير أن يدعم GPT-5 تعدد الوسائط محليًا، أي أنه يحتاج إلى إعادة تصميم الهيكل وإعادة التدريب. وفقًا للمنطق المذكور أعلاه، لا تزال معلمات النموذج الكبير لديها مجال للنمو من 10 إلى 50 مرة، وينبغي أن يكون كافيًا لوضع إمكانات متعددة الوسائط فيه. لذلك، من المتوقع أن تظهر النماذج متعددة الوسائط ذات التوفر العالي والأداء العالي في غضون عامين، ومن المتفائل أن ذلك سيستغرق عامًا تقريبًا.

تعدد الوسائط هو الفيل الموجود في الغرفة، يعلم الجميع أنه سيكون هناك شيء من هذا القبيل في النهاية، لكن العديد من المنتجات/الأبحاث/الاستراتيجيات تتجاهل وجودها، لذلك يكون هناك سوء تقدير في الأجزاء الرئيسية.

على سبيل المثال، من الناحية النظرية، سيتم قمع نماذج الصورة الفردية بشدة من خلال النماذج متعددة الوسائط، ولكن حاليًا تتجاهل معظم الأبحاث/الاستثمارات هذه المشكلة، مما يؤدي إلى تقييمات عالية جدًا لبعض الشركات التي تركز على نماذج الصور. ومن المرجح أن تفقد هذه الشركات الحواجز التقنية وتتحول إلى مقدمي خدمات في المستقبل. وينبغي لنظام التقييم الخاص بها أن يشير إلى مقدمي الخدمات وليس شركات التكنولوجيا.

إذا كنت تريد أن تحكي قصة "الاستثمار يعتمد على الأشخاص، فإن نفس الفريق يمكنه تحويل الأعمال"، فقط تظاهر بأنني لم أقل ذلك. الأساطير موجودة دائمًا، لكن لا يمكنك تصديقها عندما تقوم بالبحث.

من يمكنه تدريب GPT-4: يمكنك ذلك، ولكن ليس ضروريًا

لا يستغرق تكرير الإكسير وقتًا طويلاً، وتقوم الشركات الكبرى بشراء بطاقات الرسومات. الشيء الوحيد الواضح جدًا هو أنه في غضون عام، ستتمكن الشركات الكبيرة من تدريب نماذج مستوى GPT-4. ولكن ما إذا كنت تريد التدريب أم لا هو سؤال آخر.

في مجال الألعاب، هناك اقتراح كلاسيكي يسمى "العب Genshin Impact مع Genshin Impact"، أي: عندما يتمكن اللاعبون من اختيار لعب Genshin Impact أو منتج منافس لـ Genshin Impact، إذا لم يكن المنتج المنافس بجودة Genshin إمباكت، إذن يمكنهم لعب دور جينشين إمباكت، الإله الأصلي.

وينطبق نهج "الفائز يأخذ كل شيء" أيضًا على صناعة النماذج واسعة النطاق. إذا اتبعت شركة ما OpenAI، فبعد نصف عام من البحث والتطوير، فإنها تطلق نموذجها الكبير الخاص بها بأداء 90٪ مشابه لـ GPT-4، على أمل طرحه في السوق. في هذا الوقت ستواجه الشركة المشاكل التالية:

  • تتمتع OpenAI بميزة النطاق المتمثلة في الموارد السحابية والتكاليف المنخفضة
  • تم استخدام واجهة برمجة تطبيقات OpenAI على نطاق واسع في رموز المنتجات، ومن الصعب استبدالها.
  • لا يزال منتج الشركة لا يتفوق على GPT-4
  • سيتم إصدار منتج الجيل التالي من OpenAI (ربما GPT-5) قريبًا

ويمكن ملاحظة أن الشركة تتعرض لضغوط كبيرة. بدلاً من تدريب GPT-4، من الأفضل المراهنة مباشرة على نموذج الجيل التالي (مقارنة بـGPT-5). وبعد ذلك ستتغير المشكلة من "مشكلة منتج منافس مماثل" إلى "مشكلة الابتكار التكنولوجي". وهذا عبء لا تستطيع الشركات الصغيرة تحمله.

لذلك، فإن مناقشة "من يمكنه تدريب GPT-4" هي قضية ميتة استراتيجيًا، وبدلاً من التفكير في هذه المشكلة، من الأفضل العثور على اتجاه أكثر يقينًا وفرصًا.

نصيحة للشركات الناشئة في مجال الذكاء الاصطناعي: ضع الأداء في المقام الأول، وتجنب الركود

كتب المؤلف العديد من المقالات التي تشكو من langchain، والسبب الأساسي هو أن langchain لا يترك مجالًا للمطورين لتحسين الأداء. يطلق عليه بشكل ملطف "الإطار العالمي". ومن أجل ضمان العالمية، تم التخلي عن مجال كبير لتحسين أداء النماذج الكبيرة، مثل الحوار متعدد الجولات والتحكم في التنسيق الذي يتم تنفيذه عن طريق الضبط الدقيق. تتضمن البرامج المشابهة التوجيه/Auto-GPT/BabyAGI، وما إلى ذلك، وكلها ترغب في بناء "إطار عمل يمكن أن يستمر مدى الحياة".

والحقيقة الموضوعية هي أن شركة OpenAI أصدرت استدعاء الوظائف في شهر مايو. والعديد من الأماكن المزعجة في الكود لديها حلول تنفيذ أفضل، وتكلفة تنفيذ حلول أفضل هي إعادة بناء الأجزاء الرئيسية من كود المنتج. في أغسطس، أصدرت شركة OpenAI أذونات لضبط GPT-3.5، والعديد من الروابط التي تتطلب تحكمًا دقيقًا في المخرجات لديها حلول محتملة جديدة.

ولذلك، يتعين على الشركات الناشئة أن تواجه خياراً رئيسياً: هل ينبغي لها أن تختار ① تحسين الأداء وإعادة تصميم المنتجات بشكل مستمر، أو ② الحد من استخدام الميزات الجديدة واستخدام الميزات القديمة دائماً من أجل التطوير؟

بالنسبة لريادة الأعمال في تطبيقات التكنولوجيا الجديدة، لا يمثل "التطوير" عملية كتابة التعليمات البرمجية فحسب، بل يمثل أيضًا "الحد الأعلى" لوظائف/استراتيجيات المنتج. كلما زاد الأداء الذي يمكن التحكم فيه، زادت الوظائف النظرية للمنتج وزادت المرونة الإستراتيجية.

إن تطور التكنولوجيا لا يمكن التنبؤ به، وقد تؤدي الإبداعات التكنولوجية البسيطة إلى تغييرات حساسة للغاية في المشهد التنافسي. وينبغي للشركات البادئة أن تتمتع بقدرات مضادة للهشاشة في مجال تطوير التكنولوجيا.

—— من الناحية الإنسانية، الأمر هو: الأداء أولاً، وتجنب البقاء. على مستوى التطوير، استخدم ميزات جديدة؛ فيما يتعلق بالمنتجات، فكر في الوظائف التي يمكن أن تؤديها الميزات الجديدة؛ فيما يتعلق بالاستراتيجية، فكر في تأثير الميزات الجديدة على الإستراتيجية.

في "Guo Qin Lun"، ذكر أنه بعد تأسيس أسرة تشين، تمت مصادرة الأسلحة المعدنية في العالم وصبها في اثني عشر تمثالًا برونزيًا للقضاء على احتمالية الانتفاضة المدنية. ولكن من المعروف أن أسرة تشين كانت قصيرة العمر. إن الاهتمام بالتغيير أكثر فائدة من تجاهله.

نصيحة للشركات الناشئة في مجال الذكاء الاصطناعي: أنشئ التطبيقات بثقة

هناك خطر خفي شائع جدًا في تطبيق الشركات الناشئة: دخول الشركات الكبيرة. لا تشمل الشركات الكبرى هنا عمالقة التطبيقات فقط، مثل Meta/Byte/Tencent، ولكن أيضًا الشركات الرائدة في مجال الذكاء الاصطناعي، مثل OpenAI.

عادة ما يكون هناك سببان لدخول الشركات الكبيرة إلى السوق: نشر فرص المنتجات، وتقليص المنبع والمصب.

"تطوير فرص المنتجات" هو معنى حرفي، وتشعر الشركات الكبرى أن هذا الاتجاه يستحق القيام به، لذلك تفعل ذلك.

"القطع من المنبع إلى المصب" هو في الغالب خطوة عاجزة. ربما يكون ذلك لأنني قمت بتطوير نموذج واسع النطاق يتم قياسه مقابل OpenAI، ولكن بسبب مشكلة الفائز يأخذ كل شيء في النموذج واسع النطاق، هناك لا يوجد مستخدمون، مما يؤدي إلى حرق التكاليف، ولا إيرادات، ولا بيانات، مما يؤدي بدوره إلى تأخر الأداء تدريجيًا. في هذا الوقت، يعد قطع المصب وتطوير تطبيقات محددة واستخدام التكنولوجيا الخاصة هو الخيار الوحيد.

وفقًا للتجربة التاريخية، وبسبب مشكلة الهيكل التنظيمي، كلما اقتربت الشركة من المصب، كان من الأسهل أن تتخلف عن الركب في مجال التكنولوجيا، وكلما كانت التكنولوجيا أكثر تخلفًا، كلما زاد حاجتها إلى المصب. سوف تتنافس شركات التكنولوجيا المزعومة هذه في نهاية المطاف على نفس المكانة البيئية مثل شركات طبقة التطبيقات.

ومع ذلك، في ساحة معركة طبقة التطبيقات، نظرًا لأن تقنية الذكاء الاصطناعي كانت موجودة لفترة قصيرة فقط، فإنها لا تتمتع بمزايا فعالة وقابلة لإعادة الاستخدام على نطاق واسع، وتتشابه نقاط البداية للشركات الكبيرة والشركات الناشئة. بالمقارنة مع الشركات الكبيرة، تعتبر الشركات الناشئة أكثر كفاءة ورؤية ثاقبة، ومن الأسهل الاستفادة منها.

الموقف الجدير بالملاحظة هو أن جميع المواد الترويجية لـ MS Azure تقريبًا تدور الآن حول OpenAI، لكن مصنعًا كبيرًا مثل Microsoft يعتمد تمامًا على OpenAI كمنصة له، مما يثبت من الجانب أن الشركات الناشئة تتمتع بمزايا طبيعية في مجال الذكاء الاصطناعي.

وبطبيعة الحال، قد لا يتمكن بعض البائعين السحابيين من قبول أن تقودهم شركات ناشئة ويريدون أكل السوق بالكامل بأنفسهم. إنها مكلفة وبطيئة ولا تشكل تهديدًا مباشرًا.

والحقيقة هي أن هناك بالفعل بعض المسارات قصيرة العمر لتطبيقات الذكاء الاصطناعي، ولكن لا يزال هناك العديد من المسارات طويلة العمر التي لم يتم اكتشافها، وتطبيقات الذكاء الاصطناعي لا يفوز فيها الفائز بكل شيء. يعد التوسع من التطبيقات إلى الأنظمة الأساسية أو التقنيات أيضًا مسارًا أكثر جدوى.

لذلك، يجب أن نلقي نظرة عقلانية على قدرة الشركات الكبيرة على غزو طبقة التطبيقات. اقتراحنا هو أن الشركات الناشئة في مجال الذكاء الاصطناعي يمكنها تقديم التطبيقات بثقة.

نصيحة للشركات الناشئة في مجال الذكاء الاصطناعي: انتبه إلى شريان حياة المنتج

كما ذكرنا سابقًا، يمكن للشركات الناشئة في مجال الذكاء الاصطناعي إنشاء تطبيقات بأمان، ولكن يجب عليها مراعاة أداء نموذج الذكاء الاصطناعي وتجنب البقاء فيه. ويتجلى هذا الوضع بشكل مباشر في أن منتجات الذكاء الاصطناعي قد تفقد قاعدة الطلب الخاصة بها وتذبل تدريجياً خلال بضعة أشهر، وقد يحدث هذا الوضع بشكل متكرر.

تتطلب تطبيقات الذكاء الاصطناعي خدمات تستخدم نماذج كبيرة، ويستمر أداء النماذج الكبيرة في التحسن. هذا التحسين ليس تحسينًا أحادي البعد مثل "السرعة"، ولكنه تغيير شامل في جودة الإخراج وطول الإخراج وإمكانية التحكم في الإخراج. ستؤدي كل ترقية مهمة في التكنولوجيا إلى تخلف تكنولوجيا منتجات طبقة التطبيقات الحالية وخلق فرص ومنافسين جدد.

**نشير إلى الوقت الذي يحافظ فيه تطبيق الذكاء الاصطناعي على المزايا والضرورة في الإستراتيجية/المنتج/التكنولوجيا باسم "شريان الحياة". **

فيما يلي بعض الأمثلة ذات شرايين الحياة الأقصر:

  • عندما يدعم ChatGPT/Claude تحميل الملفات، لن يكون ChatPDF ضروريًا بعد الآن
  • عندما يدعم Office 365 برنامج Copilot، ستفقد المنتجات التي تستخدم الذكاء الاصطناعي لرسم PPT مزاياها
  • لم يعد جاسبر ضروريًا عند ظهور GPT-3.5

**بالنظر إلى التطور السريع لصناعة الذكاء الاصطناعي، فإن شريان الحياة المحدود هو القاعدة. لذلك، فإن قبول حقيقة أن شريان الحياة محدود ومحاولة اختيار اتجاه ذو شريان حياة أطول للتنمية يفضي إلى الحفاظ على المزايا طويلة المدى وضرورة المنتج. **

بشكل عام، يمكن تقسيم شريان الحياة ببساطة إلى مستويات 3/6/12 شهرًا.

  • 3 أشهر: الوظائف التي لم يكن لدى الشركات الكبرى الوقت الكافي للقيام بها (مثل الوظائف التي لم يكن لدى المكتب/ChatGPT الوقت الكافي للقيام بها)
  • 6 أشهر: يصعب تنفيذه ولا يمكن دمجه في الحلول الحالية، ولكن المزايا/الضرورة ستختفي مع تحسن أداء الذكاء الاصطناعي (مثل إطار الذكاء الاصطناعي العام)
  • 12 شهرًا: المزايا/الضروريات يمكن أن تكون موجودة لفترة طويلة ولا تتأثر بسهولة بالشركات الكبرى/التطورات التكنولوجية (مثل معانقة الوجه)

*دورة حياة منتجات المنصات ليست بالضرورة طويلة، فالمتاجر هي أيضًا منصات.

عندما تحدد شركة ناشئة اتجاهها، فإنها تحتاج فقط إلى شريان حياة مدته ستة أشهر. ومن الصعب الحصول على شريان حياة مدته 12 شهرا.

عندما يصل شريان حياة المنتج إلى النهاية، هناك حالتان بشكل عام. الوضع الأول هو اختفاء المزايا، وتحتاج تكنولوجيا ترقية المنتج إلى إعادة البناء، يرجى الرجوع إلى "الأداء أولاً" أعلاه؛ والموقف الثاني هو اختفاء الضرورة، وسيتم استبدال المنتج تدريجيًا. لا يزال المنتج لديه عدة أشهر من "عمر التشغيل" وهو ما يكفي للشركات الناشئة لاختيار الاتجاه التالي.

نصيحة للشركات الناشئة في مجال الذكاء الاصطناعي: Web3+AI يمكن أن تفعل ذلك

في الوقت الحاضر، هناك العديد من المشاريع الريادية حول موضوع Web3+AI، ولكن بالنظر إلى عدم اليقين بشأن التطور التكنولوجي والمرحلة المبكرة من السوق، فإن موضوع Web3+AI سيظل له العديد من المتغيرات في المستقبل.

تهدف هذه المقالة إلى إيجاد يقينيات ذات احتمالية عالية للصواب بين حالات عدم اليقين، لذلك لا يزال المؤلف يأمل في استلهام بعض الإلهام واقتراح بعض المواضيع والاتجاهات التي قد تكون لها فرص للرجوع إليها من قبل الشركات الناشئة والباحثين المهتمين.

  • نزع السيادة/اللامركزية

حاليًا، لا يقدم القادة في صناعة الذكاء الاصطناعي سوى نماذج مغلقة المصدر، ولا يمكن السيطرة على الاستقرار والشفافية والحياد في تقديم خدماتهم المستمر. قد تصبح إزالة السيادة/اللامركزية موضوعًا مهمًا في صناعة الذكاء الاصطناعي، وهي: استنادًا إلى الهيكل الأساسي لنزع السيادة/اللامركزية، لتوفير خدمات ذكاء اصطناعي مستقرة وشفافة ومحايدة.

إن إلغاء السيادة/اللامركزية هو "حل بديل" و"ردع"، يمكن أن يزيد بشكل كبير من التكلفة غير الأخلاقية لشركات الذكاء الاصطناعي المركزية/ذات السيادة ويمنعها من استخدام نماذج الذكاء الاصطناعي في الجوانب العسكرية والطائفية والسياسة وغيرها من الجوانب.

في الحالات القصوى، بمجرد أن لا تصبح خدمة الذكاء الاصطناعي المركزية/السيادية متاحة/موثوقة لسبب ما، يمكن للذكاء الاصطناعي اللامركزي/اللامركزي الاستمرار في تقديم خدمات متاحة للغاية لمنع البلدان/المناطق الفردية وحتى إصابة البشر بالشلل من فقدان خدمات الذكاء الاصطناعي.

  • التطبيق العملي للقوة الحاسوبية

خلف تحول ETH من إثبات العمل (PoW) إلى إثبات الحصة (PoS) تكمن المعضلة المنتقدة المتمثلة في "التعدين لا يولد قيمة"، حيث يمكن أن يوفر الجمع بين Web3 والذكاء الاصطناعي سيناريو عمليًا لقوة الحوسبة، وبالتالي تحقيق استيعاب قوة حوسبة المخزون وتعزيز نمو الحوسبة الإجمالية. القوة، الخ. التأثير.

  • الأصول الافتراضية

يعد الذكاء الاصطناعي أحد الأصول الأصلية لقوة الحوسبة والتخزين، ويمكن أن يوفر الجمع بين Web3 وAI قناة لتحويل الذكاء الاصطناعي إلى أصول افتراضية، وإنشاء أصول افتراضية أصلية حقيقية لـ Web3 مع تحقيق إنشاء قيمة صناعة الذكاء الاصطناعي.

  • المتغيرات لتطبيقات Web3

قد يوفر الجمع بين Web3 وAI وظائف جديدة وفرص نمو لتطبيقات Web3، ويمكن إعادة تصميم تطبيقات Web3 الحالية بالكامل.

مكتوب في النهاية: نحن في شهر سبتمبر، فهل لا يزال الذكاء الاصطناعي يستحق بدء عمل تجاري الآن؟

اسمحوا لي أن أتحدث عن الاستنتاج أولاً: إنه أمر جدير بالاهتمام، ويمكن استخدام هذا الاستنتاج حتى حلول السنة الصينية الجديدة باحتمال كبير.

غالبًا ما يكون تصور الناس للمواقف متحيزًا، وأنا لست استثناءً. البعض متفائل للغاية والبعض الآخر متشائم للغاية. تواصل المؤلف ذات مرة مع فريقين. يعتقد أحد الفريقين أنه سيكون قادرًا على بناء وكيل ذكاء اصطناعي في الربع الأول من العام المقبل، بينما يشعر الفريق الآخر أن الذكاء الاصطناعي مناسب فقط لإدارة قاعدة المعرفة. من الواضح أن الأول متفائل للغاية، بينما يشعر الفريق الآخر بأن الذكاء الاصطناعي مناسب فقط لإدارة قاعدة المعرفة. هذا الأخير متشائم للغاية.

عند التخطيط طويل المدى، سيقع كل من التفاؤل المفرط والتشاؤم المفرط في الحفرة، وغالبًا ما تكون التعليقات المنتشرة على نطاق واسع ذات انحرافات كبيرة، لذا فإن التفكير المستقل ثمين للغاية. لذلك، بغض النظر عما إذا كان القراء يمكنهم قبول وجهات نظر هذه المقالة، طالما أن القراء لديهم تفكير وحكم مستقل في عملية القراءة، سيكون المؤلف سعيدًا جدًا.

وأخيرا، ضع إعلانا. إذا كانت لديك فكرة جيدة لبدء تشغيل الذكاء الاصطناعي أو لديك بالفعل مشروع قيد التنفيذ، فلا تتردد في التواصل مع الأصدقاء في NGC (مثلي).

شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • مشاركة
تعليق
0/400
لا توجد تعليقات
  • تثبيت