بعد أن اكتسحت ChatGPT العالم ، تم دفع الذكاء الاصطناعي إلى منفذ جديد ، وأصبح بالفعل موضوعًا ساخنًا كأداة إنتاجية ذكية تخريبية. في الوقت الحاضر ، رفعت البلدان والمناطق المتقدمة في جميع أنحاء العالم من تطوير صناعة الذكاء الاصطناعي إلى الاستراتيجية الوطنية ، ويتم تنفيذ التقنيات والتطبيقات الناشئة ذات الصلة بشكل مستمر. مع التطور المتعمق للموجة الجديدة للذكاء الاصطناعي ، توشك ثورة صناعية بقيادة تقنية الذكاء الرقمي على الظهور ، كما أنها فتحت مقدمة "عصر النموذج الكبير" في جميع مناحي الحياة.
لماذا يمكن أن تقود النماذج اللغوية الكبيرة اتجاه الذكاء الاصطناعي؟ ما هي فرص الاستثمار للذكاء الاصطناعي المحلي؟ في الآونة الأخيرة ، قامت Titanium Capital بدعوة Lin Junchao ، مدير الاستثمار في Rongyi Capital ، لمشاركة الموضوع: النظر في الفرص الاستثمارية للذكاء الاصطناعي من منظور السوق الأولية. السيد لين حاصل على درجة البكالوريوس في الهندسة الكهربائية والإلكترونية ودرجة الماجستير مع مرتبة الشرف الأولى من جامعة كوليدج لندن (UCL) ، ولديه ثلاث سنوات من الخبرة في تنظيم المشاريع وست سنوات من الخبرة في الاستثمار في الأسهم. تركز استثماراتها على أدوات تطوير البرمجيات الأساسية ، Metaverse و AIGC ، بما في ذلك Jingye Intelligence و Smart Open Source China ومشاريع أخرى. مضيف هذه المشاركة هو Wu Kai ، العضو المنتدب لشركة Titanium Capital. وفيما يلي سجل المشاركة:
** لماذا يمكن أن يقود نموذج اللغة الكبير اتجاه AI **
تاريخ موجز لتطور الذكاء الاصطناعي
منذ أن اقترح شانون ألعاب الكمبيوتر في عام 1950 ، شهد الذكاء الاصطناعي أكثر من 70 عامًا من التطوير. يمكننا تقسيمها تقريبًا إلى أربع مراحل: عصر التنوير المبكر + عصر نظام الخبراء (الخمسينيات والسبعينيات) ، والتعلم الآلي + عصر رؤية الكمبيوتر (الثمانينيات والتسعينيات) ، وعصر التعلم العميق (2006-2017) ، وعصر النموذج اللغوي متعدد الوسائط + الكبير (2018 إلى الوقت الحاضر).
حدث الحدث البارز في مرحلة التنوير المبكرة في الندوة الصيفية لكلية دارتموث في عام 1956. تم اقتراح مفهوم الذكاء الاصطناعي لأول مرة في الاجتماع ، والذي بدأ رسميًا مقدمة للذكاء الاصطناعي. خلال هذه الفترة ، أول روبوت دردشة ELIZA طورته MIT في عام 1966 ، أول نظام خبير DENDRAL ، واقترح ديفيد مار مفاهيم رؤية الكمبيوتر وعلم الأعصاب الحسابي في عام 1976.
في عصر التعلم الآلي ، هناك شخصية بارزة ، وهي الأب الروحي لمنظمة العفو الدولية الذي ترك Google منذ بعض الوقت - جيفري هينتون. في عام 1986 ، اقترح خوارزمية backpropagation ، والتي جعلت تدريب الشبكة العصبية على نطاق واسع ممكنًا ومهدت الطريق لشبكات عصبية لاحقة وتعلم عميق. في الوقت نفسه ، ظهرت العديد من الأحداث والشخصيات البارزة أيضًا في هذه المرحلة ، مثل لعبة الطاولة في عام 1979 ، وانتصار ديب بلو على بطل العالم للشطرنج كاستروف في عام 1997. في عام 2006 ، اقترح جيفري هينتون وآخرون رسميًا مفهوم التعلم العميق ، وبالتالي إدخال الذكاء الاصطناعي في المرحلة الثالثة - عصر التعلم العميق.
في عصر التعلم العميق ، اقترح جيفري هينتون الشبكة العصبية التلافيفية AlexNet في عام 2012 وفاز في مسابقة تصنيف الصور ImageNet. كان معدل الخطأ الإجمالي 10.8٪ أقل من المركز الثاني ، وافتتح رسميًا السنة الأولى من التعلم العميق في رؤية الكمبيوتر. في آذار (مارس) 2013 ، استحوذت Google على شركة DNNResearch التابعة لجيفري هينتون مقابل 44 مليون دولار أمريكي. ومنذ ذلك الحين ، بدأت Google في قيادة تطوير الذكاء الاصطناعي العالمي ؛ في عام 2015 ، كان TensorFlow ، وهو إطار التعلم العميق الأكثر تأثيرًا في العالم ، مفتوح المصدر ؛ في عام 2016 ، هزم AlphaGo تسعة dan Go master Li Sedol 4: 1 ؛ في عام 2017 ، أطلق نموذج Transformer الحالي ، والذي أطلق منذ ذلك الحين نموذج Transformer الحالي. في الوقت نفسه ، جنبًا إلى جنب مع موجة الذكاء الاصطناعي التي تقودها Google ، تم أيضًا إنشاء حيدات الذكاء الاصطناعي مثل Scale AI و HuggingFace و OpenAI في عام 2016. كما قامت شركة Meta العملاقة للإنترنت بفتح إطار عمل التعلم العميق الأكثر فائدة Pytorch في عام 2017.
ظهرت OpenAI ، الشركة الرائدة في عصر نماذج اللغات الكبيرة ، لأول مرة في أوائل أبريل 2019. وهزمت OpenAI Five التي طورتها فريق OG بطل العالم Dota2 بميزة مطلقة تبلغ 2: 0 ، ثم أصدرت GPT-3 مع 175 مليار معلمة في مايو 2020 ، و ChatGPT (GPT-3.5) في نوفمبر 2022 ، و GPT-4 في مارس 2023. منذ ذلك الحين ، بدأ نموذج Google في القيادة رسميًا. كما قام عمالقة الإنترنت / البرمجيات مثل Google و Meta و Microsoft بتعديل استراتيجياتهم وشاركوا بنشاط في مسابقة النماذج واسعة النطاق. منذ ChatGPT في نهاية عام 2022 ، رأينا أن الشركات المصنعة الرئيسية في جميع أنحاء العالم قد دخلت في نموذج واسع النطاق ، كما أطلقت الجامعات المحلية وعمالقة التكنولوجيا والشركات الناشئة وما إلى ذلك باستمرار منتجات وتطبيقات نموذجية متنوعة على نطاق واسع.
يمكن إرجاع تاريخ تطوير الذكاء الاصطناعي في الصين إلى إنشاء معهد Microsoft Asia Research Institute في عام 1998. واليوم ، يأتي المؤسسون والفرق الأساسية وراء الشركات المحلية المعروفة مثل Innovation Works و Baidu و Kingsoft و Alibaba و SenseTime و Questyle جميعًا من معهد Microsoft Asia Research Institute. تم إدراج الدفعة الأولى من شركات الذكاء الاصطناعي المحلية iFlytek و Dahua و Hikvision في سوق الأسهم A حوالي 2008-2010. من عام 2011 إلى عام 2015 ، ظهرت العديد من الشركات الناشئة في مجال رؤية الكمبيوتر في الصين ، مثل Megvii (تأسست عام 2011) و YITU (تأسست عام 2012) و SenseTime (تأسست عام 2014) و Yuncong (تأسست عام 2015). في عام 2018 ، تم إنشاء الفريق الوطني - معهد بكين تشى يوان لأبحاث الذكاء الاصطناعي. كما استفاد تطوير النماذج الكبيرة هذه المرة من هذه الموجة. منذ عام 2002 ، تم إدراج الشركات المرتبطة بالذكاء الاصطناعي مثل Cambrian و SenseTime و Haitian Ruisheng و Yuncong في مجلس ابتكار العلوم والتكنولوجيا وبورصة هونغ كونغ.
سحر ChatGPT و GPT-4
لماذا يسمح لنا ChatGPT و GPT-4 بالشعور بشكل حدسي باختلاف وقوة موجة الذكاء الاصطناعي هذه من الماضي؟ يمكن رؤيتها بشكل أساسي من الجوانب التالية:
** أولاً ، من وجهة نظر المستخدم ، هذه المرة هي طريقة تفاعل شبيهة جدًا بالبشر. ** عند التحدث مع ChatGPT ، يتم إنشاء المحتوى كلمة بكلمة ، ويتم إنشاء الإجابة أثناء التفكير. في الوقت نفسه ، لديه أيضًا القدرة على جولات متعددة من الحوار. بالإضافة إلى ذلك ، يمكن أن تلعب أيضًا بعض الأدوار ، مثل المترجمين والمستشارين النفسيين وما إلى ذلك.
** ثانيًا ، القدرة على التعميم ، تنعكس بشكل أساسي في القدرة على فهم المتطلبات بسرعة وإعطاء إجابات دقيقة نسبيًا بدون سياق. ** يعتمد هذا على دعم مجموعة ما قبل التدريب الهائلة وهندسة التلميح.
** ثالثًا: سلسلة التفكير. ** القدرة على فهم السياق والسياق حتى النصوص الطويلة. على سبيل المثال ، يتمتع كلود 2 الذي تم إصداره حديثًا بسعة معالجة سياق تبلغ 100000 رمز مميز ، والتي يمكنها بشكل أساسي تغذية كتاب كامل فيه للمعالجة. في الوقت نفسه ، هناك أيضًا قدرة منطقية قوية ، يمكنها تفكيك المشكلة تدريجياً واستنتاجها وفقًا لطريقة التفكير البشري.
في الواقع ، تظهر هذه القدرات مع زيادة معلمات النموذج وتمديد وقت التدريب. بالإضافة إلى ذلك ، يمكننا أن نرى أن GPT-4 لها نتائج ممتازة في الاختبارات البشرية المختلفة ، والتي تصل أساسًا إلى مستوى طلاب الجامعات المحتملين.
تكوين النموذج اللغوي الكبير
بالعودة إلى نموذج اللغة الكبيرة نفسه ، أوصي الجميع بمشاهدة خطاب الكلمة الرئيسي حول حالة GPT الذي شاركه المؤسس المشارك لـ OpenAI Andrej Karpathy في مؤتمر مطوري Microsoft. قام بتفكيك عملية التدريب للنموذج الكبير إلى أربع مراحل:
** في مرحلة ما قبل التدريب ، يلزم قدر كبير من بيانات التدريب منخفضة الجودة نسبيًا (بما في ذلك الكتب ، والزحف على الإنترنت ، والأوراق ، وما إلى ذلك) و 99٪ من قوة الحوسبة والوقت في عملية تدريب النموذج الكبير بأكملها لتدريب نموذج أساسي. ** على سبيل المثال ، يتطلب تدريب نموذج أساسي LLaMA 650 مليار متغير 2048 وحدة معالجة رسومات Nvidia A100 ، والتي تستغرق 21 يومًا ، وتبلغ تكلفة التدريب بالكامل حوالي 5 ملايين دولار أمريكي. لذلك ، فإن تدريب نموذج أساسي ليس مناسبًا للشركات الناشئة ، وهذه الموارد والتكاليف متاحة بشكل عام فقط للمصنعين الكبار.
** يتم الإشراف على الخطوة الثانية وضبطها على النموذج الأساسي ، ** وذلك لتدريب طراز SFT ، مثل Vicuna-13B ونماذج مفتوحة المصدر شائعة أخرى ، يتم الإشراف عليها وضبطها بدقة. في هذه المرحلة ، يجب توفير كمية صغيرة فقط من البيانات عالية الجودة ، والطلب على قوة الحوسبة صغير نسبيًا.
** المرحلتان الثالثة والرابعة هما نمذجة المكافأة ومراحل التعلم المعزز ، أي تعلم التغذية المرتدة للتعزيز البشري لمؤسسة رال إتش إف. ** من خلال هاتين المرحلتين ، سيكون إخراج النموذج أفضل بكثير من نموذج الضبط الدقيق والنموذج الأساسي ، ولكن سيتم التضحية بانتروبيا النموذج الأساسي.
** من منظور صناعة السوق الأولية لمعرفة فرص الذكاء الاصطناعي **
بالنظر إلى فرص الاستثمار في الذكاء الاصطناعي بشكل منهجي من منظور الاستثمار في السوق الأولية ، يمكن تقسيمها إلى طبقة أساسية وطبقة نشر وطبقة تطبيق.يعمل مجتمع نموذج الذكاء الاصطناعي من خلال هذه الطبقات الثلاث.
** يمكن تقسيم الطبقة الأساسية إلى طبقة البنية التحتية وطبقة البيانات وطبقة الخوارزمية. **
الطبقة السفلية من طبقة البنية التحتية هي طاقة الحوسبة ، وهي أيضًا المكان الذي يواجه حاليًا أكبر قدر من الاختناق المباشر ، والآن يتم حظر كل من Nvidia و AMD GPU في الصين. تواجه شركة Huawei Kunpeng ، الشركة الرائدة في مجال قوة الحوسبة المحلية ، مشكلة انقطاع الشريط ، وفي المستقبل ، قد تواجه الصين ضغوطًا متزايدة فيما يتعلق بقوة الحوسبة المتطورة. في الوقت نفسه ، لا تزال هناك مشكلة استخدام GPU. حتى بالنسبة لـ OpenAI ، هناك عدد كبير من مهندسي Nvidia يقيمون في الموقع للضبط اليدوي ، لكن استخدام GPU الخاص بها هو فقط 50٪ -60٪. فوق قوة الحوسبة توجد طبقة البرامج الأساسية حول النموذج الكبير ، مثل تخزين البيانات الأصلية للذكاء الاصطناعي ، ونقل البيانات ، وأمن البيانات وغيرها من الأدوات ومنصات التطوير والصيانة حول البيانات ، بما في ذلك قواعد بيانات المتجهات ، LLMOps ، MLOps ، إلخ.
قد يكون هناك المزيد من الفرص في طبقة البيانات ، لأن النموذج الأساسي قد يتم تطويره من قبل الشركات الرائدة في المستقبل ، وسيكون هناك عدد كبير من النماذج الأساسية مفتوحة المصدر ، لذلك ليست هناك حاجة لإنفاق الكثير من المال لتطوير النموذج الأساسي الخاص بك. يجب أن نركز على تراكم البيانات للصناعات العمودية والمؤسسات نفسها ، وكيفية تشكيل تطبيقات واسعة النطاق يكون العملاء على استعداد لدفع ثمنها. في الوقت الحالي ، تتمثل أكبر مشكلة في النماذج الكبيرة في كيفية الحصول على مجموعات بيانات عالية الجودة ومجموعات بيانات صناعية عمودية.لقد رأى الجميع إمكانات النماذج الكبيرة في مجالات الصناعة والعلوم والطب والقانون والتمويل والتعليم. قد تكمن الفرص المستقبلية في كيفية الحصول على بيانات عالية الجودة بكفاءة ، وكيفية معالجة البيانات متعددة الوسائط ، وكيفية تحديد ، وكيفية الاستفادة من البيانات ، وكيفية تأكيد الحقوق ، وكيفية التداول ، وكيفية حماية الأمن ، وما إلى ذلك.
يكمن جوهر طبقة الخوارزمية في إطار التعلم العميق والنموذج الأساسي
يمكن وصف إطار التعلم العميق بأنه نظام التشغيل للذكاء الاصطناعي. فهو ينسق نشر موارد الحوسبة إلى أسفل ، ويتعهد بقدرات بناء نماذج خوارزمية الذكاء الاصطناعي لأعلى ، ويوفر عددًا كبيرًا من مكتبات المشغلين ، ومكتبات النماذج ، ودروس المستندات.إنه أيضًا بيئة في الطبيعة ويقلل من عتبة التطوير. في الوقت الحالي ، تعد أطر التعلم العميق السائدة في العالم هي TensorFlow و Meta Pytorch من Google. وفي الصين ، توجد Baidu Fei Paddle و Huawei Shengsi و Oneflow ، والتي كانت قد حصلت عليها سابقًا شركة Light Years Beyond.
يحتوي النموذج الأساسي نفسه أيضًا على تنوع ، على سبيل المثال ، من حيث المسارات التقنية ، هناك CNN و RNN و GAN و Transformer وما إلى ذلك. من المرجح أن يؤدي هذا الاتجاه إلى ولادة الشركات التي تبلغ قيمتها السوقية مئات المليارات أو حتى التريليونات ، ولكنها أيضًا ساحة المعركة الرئيسية التي تشهد منافسة شديدة.
في عصر حرب المائة نموذج ، أصبح تقييم النموذج أداة أساسية لقياس قدرات النماذج المختلفة. في الوقت الحالي ، ظهرت أدوات تقييم متنوعة للنماذج الصغيرة التقليدية (GLUE ، SuperGLUE ، إلخ) ، ونماذج اللغة الكبيرة (HELM ، BIG-Bench ، إلخ) ونماذج اللغة الصينية الكبيرة (SuperCLUE ، C- ، إلخ) في السوق. مثل SuperCLUE و C- ، تمت إضافة عدد كبير من الأسئلة ذات الخصائص الصينية (فكر ماو تسي تونغ ، المبادئ الأساسية للمسك ، إلخ) والخصائص الصينية (التعبيرات الاصطلاحية ، والقصائد ، والصينية الكلاسيكية ، وما إلى ذلك) وأبعاد أخرى إلى مجموعات التقييم الخاصة بهم. انطلاقًا من نتائج التقييم ، باستثناء GPT-4 و GPT-3.5 و Claude ، فإن منتجات النماذج المحلية واسعة النطاق أفضل من النماذج الخارجية الأخرى في أداء التقييم الإجمالي ، وبالتالي فإن ضرورة تدريب النماذج الصينية واسعة النطاق عالية جدًا.
يمكن تقسيم طبقة التطبيق إلى نماذج كبيرة عامة ونماذج كبيرة للصناعة العمودية.نحن نركز بشكل أساسي على الجيل الجديد من أدوات الإنتاجية التي تدعم الذكاء الاصطناعي في مجال النماذج الكبيرة العامة وفرص التطبيق للنماذج الكبيرة في مختلف مجالات الصناعة الرأسية.
** إلى C — أداة إنتاجية مدعمة بالذكاء الاصطناعي **
في عصر الوباء ، شهدت أدوات الإنتاجية القائمة على التعاون مثل Notion و Figma و Canva تغييرات. وبالمثل ، في ظل هذه الموجة من الذكاء الاصطناعي ، ستؤدي أدوات الإنتاجية أيضًا إلى ثورة جديدة.
الآن نرى أن النماذج الكبيرة قد اخترقت بدرجات متفاوتة في النصوص ، والكود ، والصورة ، والموسيقى ، والفيديو ، وثلاثي الأبعاد ، وما إلى ذلك ، تظهر العديد من المنتجات الجديدة والتطبيقات الجديدة واحدة تلو الأخرى ، مثل روبوتات الدردشة في مجال النص ومساعد طيار المنتج المكتبي ، مساعد الطيار GitHub في مجال الكود ، Midjourney و Stable Diffusion في مجال الصور ، AI Stefanie Run ، والتي كانت شائعة في مجال الموسيقى ، مثل شركة Kingsway ، مثل شركة Kingsway ، وما إلى ذلك. ، Zhipu Huazhang ، وما إلى ذلك ، أطلقت أيضًا منتجات مماثلة للذكاء الاصطناعي. ، تعمل على تغيير شكل أدوات الإنتاجية التقليدية بدرجات متفاوتة ، لكنها تقتصر حاليًا على أدوات الكفاءة في عملية الإنتاج الصناعي في مختلف المجالات ، ولا يمكنها تحقيق الذكاء الاصطناعي العام بالمعنى الحقيقي.
في الوقت نفسه ، يمكن ملاحظة أن الشركات المصنعة مثل Microsoft Office و Adobe Photoshop و Unity و Notion تتبنى أيضًا بنشاط هذه الموجة من الذكاء الاصطناعي ، وتضمين إمكانات الذكاء الاصطناعي العام في منتجاتها وسلاسل الأدوات الخاصة بها. كان يعتقد في الأصل أن ظهور Midjourney و Stable Diffusion سيحل محل Photoshop تمامًا ، ولكن تم اكتشاف لاحقًا أن الذكاء الاصطناعي العام AGI ، بسبب مشاكل في التحكم والجوانب الأخرى ، جعل Photoshop مدمجًا مع إمكانات إنشاء الذكاء الاصطناعي أكثر قوة وسهولة في الاستخدام.
يعد المجال ثلاثي الأبعاد حاليًا أحد أصعب المجالات لتنفيذ الذكاء الاصطناعي ، والعامل الأساسي هو وجود عدد قليل جدًا من البيانات ثلاثية الأبعاد عالية الجودة. في الوقت الحالي ، يتم استكشاف AGI للمحتوى ثلاثي الأبعاد وقيادته بشكل أساسي بواسطة NVIDIA و Unity و Stability.ai ومعاهد البحث العلمي ، ولكن في هذه المرحلة ، لا يزال بشكل أساسي أدوات تجريبية ومبعثرة ، ولا يزال هناك طريق طويل لنقطعه قبل أن يتم تطبيقه في المجالات الصناعية مثل المؤثرات الخاصة للأفلام والتلفزيون والألعاب و metaverse.
** إلى B - نموذج الصناعة الرأسي **
في الوقت الحالي ، معظم منتجات النماذج واسعة النطاق التي أطلقتها الشركات المصنعة الكبرى هي نماذج واسعة النطاق للأغراض العامة. ومع ذلك ، عند مواجهة الصناعات الرأسية ، يحتاج عملاء B-end إلى نماذج كبيرة عالية الدقة وعالية الاتساق وسهلة النشر يمكنها حل مشكلات سيناريو محددة بكفاءة مع بيانات أقل وقدرة حوسبة أقل. يعتمد أحدث طراز كبير من Pangu 3.0 صادر عن Huawei على النموذج الأساسي الكبير ، مضيفًا نماذج كبيرة من صناعة N L1 وقدرات نموذج مشهد X L2.
تتمثل النقاط الرئيسية الأساسية للنماذج الكبيرة للصناعة الرأسية في مجموعات بيانات الصناعة عالية الجودة والقدرات الهندسية لضبط النموذج وضغطه ونشره. هذه أيضًا نقطة فرصة استثمارية ، تمامًا مثل فرصة الحاوية في عصر السحابة الأصلية ، يحتاج عدد كبير من الشركات الصغيرة والمتوسطة الحجم B في الصناعات التقليدية إلى الاعتماد على مصنعي الحاويات المتخصصين لمساعدتهم على الشروع في طريق السحابة الأصلية.
في الوقت الحالي ، كان هناك الكثير من الاستكشاف والممارسة في الخارج في مجال النماذج الكبيرة للصناعة الرأسية ، مثل BloombergGPT في مجال FinGPT. حولت بلومبرج البيانات المالية المتراكمة في الأربعين عامًا الماضية إلى مجموعة بيانات مالية من 365 مليار رمز ، ودمجت مع مجموعات البيانات العامة لتدريب 50 مليار معلمة خاصة بها.
أخيرًا ، دعنا نتحدث عن التركيز الرأسمالي لمسار الذكاء الاصطناعي العام في الخارج: ** من منظور مبلغ الاستثمار ، فإن الخمسة الأوائل هم تطبيقات النصوص التسويقية والصوت ودعم العملاء / روبوتات خدمة العملاء والصور ومنصات MLOps. **
سؤال وجواب
** Q1: يبدو أن شركات خدمات التعهيد التي تقدم التعليقات التوضيحية على البيانات وتساعد في تطوير الذكاء الاصطناعي تعمل بشكل جيد جدًا في الآونة الأخيرة. ما هو اتجاهك الاستثماري؟ **
ج: نحن نولي اهتماما لهذين الاتجاهين حاليا. يركز مجال تصنيف البيانات بشكل أساسي على كيفية استخدام هذه الشركات لقدرات النماذج الكبيرة لتحسين كفاءة وضع العلامات ، مثل استخدام GPT-4 لتسمية النص و SAM لتسمية الصور. نظرًا لأن المنافسة الأساسية الحالية في مجال تصنيف البيانات هي الكفاءة والربح الإجمالي ، فمن يمكنه تحقيق تصنيف أكثر كفاءة بمساعدة قدرات النموذج الكبيرة. فيما يتعلق بخدمات النماذج واسعة النطاق ، ستكون مماثلة لفرص الحاويات في عصر السحابة الأصلية. هناك حاجة إلى البائعين المحترفين لخفض عتبة التدريب على النماذج واسعة النطاق ، والتطوير ، والنشر ، ومساعدة كل مؤسسة على تحقيق حرية النموذج على نطاق واسع.
** Q2: يوجد للذكاء الاصطناعي الآن فئتان: TO C و TO B. هل تعتقد أن الفرصة أكبر بالنسبة لـ TO C أو TO B؟ **
ج: نولي المزيد من الاهتمام لـ TO B. نظرًا لوجود عدد كبير جدًا من عمالقة الإنترنت في مجال TOC ، خاصة في الأماكن التي بها بيئة تطبيق APP محلية قوية ، فمن الأسهل على الشركات المصنعة الكبرى تضمين إمكانات الذكاء الاصطناعي في تطبيقاتها الخاصة. لذلك ، فإننا نولي المزيد من الاهتمام لقدرات تكامل البيانات والفهم التجاري والقدرات الهندسية.
** Q3: حتى بالنسبة للنماذج الكبيرة التي تحتوي على أكثر من مليار معلمة ، تم الإبلاغ عن أكثر من 80 معلمة في الصين. ماذا عن اتجاه الاستثمار في النموذج الكبير؟ كيف تختار بين المصدر المفتوح والمغلق المصدر؟ **
ج: فيما يتعلق بالمصدر المفتوح والمصدر المغلق ، من الضروري التفكير في كيفية الاستفادة الجيدة من المصدر المفتوح وكيفية استخدام نموذج المصدر المفتوح للتسويق ، على سبيل المثال ، لدى LLaMA قيود تجارية ضمن اتفاقية المصدر المفتوح. يتطلب المصدر المغلق البيئة والدعم الخاصين به ، والذي قد يتم الحفاظ عليه فقط من قبل الشركات المصنعة الكبيرة ذات القدرة والموارد المالية.
** س 4: من منظور رواد الأعمال في مجال الذكاء الاصطناعي ، يمكن تقسيمهم إلى ثلاث فئات. فئة واحدة تأتي من المصانع الكبرى والمؤسسين المشهورين بالفعل. الفئة الأخرى أكاديميون وأكاديميون وخبراء من جامعة تسينغهوا أو مجالات أخرى. هناك أيضًا فئة من رواد الأعمال الذين يميلون إلى أن يكونوا على مستوى القاعدة. أي من هذه الفئات الثلاث تفضل؟ **
ج: ظهرت العديد من موجة العارضات الكبيرة في الصين بعد أن أصدرت Open AI نماذج كبيرة مثل ChatGPT و LLaMA و Bloom كمصادر مفتوحة. بالطبع ، هناك أيضًا العديد من الشركات المصنعة الكبيرة التي تتطلع إلى المستقبل والشركات الناشئة الأكاديمية في الصين والتي كانت تستكشف قبل هذه الموجة من طفرة النماذج واسعة النطاق.
بالنسبة للفرق الأكاديمية ، فإن كيفية تحقيق التسويق هي الأكثر تحديًا. لذلك لا أعتقد أنه من الضروري القيام بذلك بنفسك في المستقبل. على سبيل المثال ، يمكن للتعاون بين OpenAI و Microsoft أن يمنح إمكانيات نموذجية واسعة النطاق للمصنعين الكبار. نحن نبحث الآن عن أهداف حول الصين مفتوحة المصدر ، لأن لديها خط إنتاج IDE وتحتاج إلى مساعد طيار ، لذلك نحن نبحث عن إمكانية التعاون مع الفرق الأكاديمية. أعتقد أن هذا النهج أكثر جدوى.
** س 5: ما هي الصناعات العمودية في الجانب ب التي من المرجح أن تحقق اختراقات تجارية؟ **
ج: نظرًا للتعميم وتعدد الأساليب لقدرة النموذج الكبير ، فإن المجال القانوني هو سيناريو شائع جدًا ، والطلب على محتوى النص كبير جدًا. تتمتع النماذج الأكبر حجمًا بهذه الإمكانية ، على الرغم من أنه لا تزال هناك بعض المشكلات التي يتعين حلها من حيث الدقة. بالإضافة إلى ذلك ، تعتبر منتجات المساعد الشخصي أيضًا سيناريو يمكن تخيله ، على الرغم من أن دورة التطوير قد تكون أطول.
شاهد النسخة الأصلية
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
Lin Junchao: النظر إلى الفرص الاستثمارية للذكاء الاصطناعي من منظور السوق الأولية
المصدر: معهد تيتانيوم كابيتال للبحوث
لماذا يمكن أن تقود النماذج اللغوية الكبيرة اتجاه الذكاء الاصطناعي؟ ما هي فرص الاستثمار للذكاء الاصطناعي المحلي؟ في الآونة الأخيرة ، قامت Titanium Capital بدعوة Lin Junchao ، مدير الاستثمار في Rongyi Capital ، لمشاركة الموضوع: النظر في الفرص الاستثمارية للذكاء الاصطناعي من منظور السوق الأولية. السيد لين حاصل على درجة البكالوريوس في الهندسة الكهربائية والإلكترونية ودرجة الماجستير مع مرتبة الشرف الأولى من جامعة كوليدج لندن (UCL) ، ولديه ثلاث سنوات من الخبرة في تنظيم المشاريع وست سنوات من الخبرة في الاستثمار في الأسهم. تركز استثماراتها على أدوات تطوير البرمجيات الأساسية ، Metaverse و AIGC ، بما في ذلك Jingye Intelligence و Smart Open Source China ومشاريع أخرى. مضيف هذه المشاركة هو Wu Kai ، العضو المنتدب لشركة Titanium Capital. وفيما يلي سجل المشاركة:
** لماذا يمكن أن يقود نموذج اللغة الكبير اتجاه AI **
تاريخ موجز لتطور الذكاء الاصطناعي
منذ أن اقترح شانون ألعاب الكمبيوتر في عام 1950 ، شهد الذكاء الاصطناعي أكثر من 70 عامًا من التطوير. يمكننا تقسيمها تقريبًا إلى أربع مراحل: عصر التنوير المبكر + عصر نظام الخبراء (الخمسينيات والسبعينيات) ، والتعلم الآلي + عصر رؤية الكمبيوتر (الثمانينيات والتسعينيات) ، وعصر التعلم العميق (2006-2017) ، وعصر النموذج اللغوي متعدد الوسائط + الكبير (2018 إلى الوقت الحاضر).
حدث الحدث البارز في مرحلة التنوير المبكرة في الندوة الصيفية لكلية دارتموث في عام 1956. تم اقتراح مفهوم الذكاء الاصطناعي لأول مرة في الاجتماع ، والذي بدأ رسميًا مقدمة للذكاء الاصطناعي. خلال هذه الفترة ، أول روبوت دردشة ELIZA طورته MIT في عام 1966 ، أول نظام خبير DENDRAL ، واقترح ديفيد مار مفاهيم رؤية الكمبيوتر وعلم الأعصاب الحسابي في عام 1976.
في عصر التعلم الآلي ، هناك شخصية بارزة ، وهي الأب الروحي لمنظمة العفو الدولية الذي ترك Google منذ بعض الوقت - جيفري هينتون. في عام 1986 ، اقترح خوارزمية backpropagation ، والتي جعلت تدريب الشبكة العصبية على نطاق واسع ممكنًا ومهدت الطريق لشبكات عصبية لاحقة وتعلم عميق. في الوقت نفسه ، ظهرت العديد من الأحداث والشخصيات البارزة أيضًا في هذه المرحلة ، مثل لعبة الطاولة في عام 1979 ، وانتصار ديب بلو على بطل العالم للشطرنج كاستروف في عام 1997. في عام 2006 ، اقترح جيفري هينتون وآخرون رسميًا مفهوم التعلم العميق ، وبالتالي إدخال الذكاء الاصطناعي في المرحلة الثالثة - عصر التعلم العميق.
في عصر التعلم العميق ، اقترح جيفري هينتون الشبكة العصبية التلافيفية AlexNet في عام 2012 وفاز في مسابقة تصنيف الصور ImageNet. كان معدل الخطأ الإجمالي 10.8٪ أقل من المركز الثاني ، وافتتح رسميًا السنة الأولى من التعلم العميق في رؤية الكمبيوتر. في آذار (مارس) 2013 ، استحوذت Google على شركة DNNResearch التابعة لجيفري هينتون مقابل 44 مليون دولار أمريكي. ومنذ ذلك الحين ، بدأت Google في قيادة تطوير الذكاء الاصطناعي العالمي ؛ في عام 2015 ، كان TensorFlow ، وهو إطار التعلم العميق الأكثر تأثيرًا في العالم ، مفتوح المصدر ؛ في عام 2016 ، هزم AlphaGo تسعة dan Go master Li Sedol 4: 1 ؛ في عام 2017 ، أطلق نموذج Transformer الحالي ، والذي أطلق منذ ذلك الحين نموذج Transformer الحالي. في الوقت نفسه ، جنبًا إلى جنب مع موجة الذكاء الاصطناعي التي تقودها Google ، تم أيضًا إنشاء حيدات الذكاء الاصطناعي مثل Scale AI و HuggingFace و OpenAI في عام 2016. كما قامت شركة Meta العملاقة للإنترنت بفتح إطار عمل التعلم العميق الأكثر فائدة Pytorch في عام 2017.
ظهرت OpenAI ، الشركة الرائدة في عصر نماذج اللغات الكبيرة ، لأول مرة في أوائل أبريل 2019. وهزمت OpenAI Five التي طورتها فريق OG بطل العالم Dota2 بميزة مطلقة تبلغ 2: 0 ، ثم أصدرت GPT-3 مع 175 مليار معلمة في مايو 2020 ، و ChatGPT (GPT-3.5) في نوفمبر 2022 ، و GPT-4 في مارس 2023. منذ ذلك الحين ، بدأ نموذج Google في القيادة رسميًا. كما قام عمالقة الإنترنت / البرمجيات مثل Google و Meta و Microsoft بتعديل استراتيجياتهم وشاركوا بنشاط في مسابقة النماذج واسعة النطاق. منذ ChatGPT في نهاية عام 2022 ، رأينا أن الشركات المصنعة الرئيسية في جميع أنحاء العالم قد دخلت في نموذج واسع النطاق ، كما أطلقت الجامعات المحلية وعمالقة التكنولوجيا والشركات الناشئة وما إلى ذلك باستمرار منتجات وتطبيقات نموذجية متنوعة على نطاق واسع.
يمكن إرجاع تاريخ تطوير الذكاء الاصطناعي في الصين إلى إنشاء معهد Microsoft Asia Research Institute في عام 1998. واليوم ، يأتي المؤسسون والفرق الأساسية وراء الشركات المحلية المعروفة مثل Innovation Works و Baidu و Kingsoft و Alibaba و SenseTime و Questyle جميعًا من معهد Microsoft Asia Research Institute. تم إدراج الدفعة الأولى من شركات الذكاء الاصطناعي المحلية iFlytek و Dahua و Hikvision في سوق الأسهم A حوالي 2008-2010. من عام 2011 إلى عام 2015 ، ظهرت العديد من الشركات الناشئة في مجال رؤية الكمبيوتر في الصين ، مثل Megvii (تأسست عام 2011) و YITU (تأسست عام 2012) و SenseTime (تأسست عام 2014) و Yuncong (تأسست عام 2015). في عام 2018 ، تم إنشاء الفريق الوطني - معهد بكين تشى يوان لأبحاث الذكاء الاصطناعي. كما استفاد تطوير النماذج الكبيرة هذه المرة من هذه الموجة. منذ عام 2002 ، تم إدراج الشركات المرتبطة بالذكاء الاصطناعي مثل Cambrian و SenseTime و Haitian Ruisheng و Yuncong في مجلس ابتكار العلوم والتكنولوجيا وبورصة هونغ كونغ.
سحر ChatGPT و GPT-4
لماذا يسمح لنا ChatGPT و GPT-4 بالشعور بشكل حدسي باختلاف وقوة موجة الذكاء الاصطناعي هذه من الماضي؟ يمكن رؤيتها بشكل أساسي من الجوانب التالية:
** أولاً ، من وجهة نظر المستخدم ، هذه المرة هي طريقة تفاعل شبيهة جدًا بالبشر. ** عند التحدث مع ChatGPT ، يتم إنشاء المحتوى كلمة بكلمة ، ويتم إنشاء الإجابة أثناء التفكير. في الوقت نفسه ، لديه أيضًا القدرة على جولات متعددة من الحوار. بالإضافة إلى ذلك ، يمكن أن تلعب أيضًا بعض الأدوار ، مثل المترجمين والمستشارين النفسيين وما إلى ذلك.
** ثانيًا ، القدرة على التعميم ، تنعكس بشكل أساسي في القدرة على فهم المتطلبات بسرعة وإعطاء إجابات دقيقة نسبيًا بدون سياق. ** يعتمد هذا على دعم مجموعة ما قبل التدريب الهائلة وهندسة التلميح.
** ثالثًا: سلسلة التفكير. ** القدرة على فهم السياق والسياق حتى النصوص الطويلة. على سبيل المثال ، يتمتع كلود 2 الذي تم إصداره حديثًا بسعة معالجة سياق تبلغ 100000 رمز مميز ، والتي يمكنها بشكل أساسي تغذية كتاب كامل فيه للمعالجة. في الوقت نفسه ، هناك أيضًا قدرة منطقية قوية ، يمكنها تفكيك المشكلة تدريجياً واستنتاجها وفقًا لطريقة التفكير البشري.
في الواقع ، تظهر هذه القدرات مع زيادة معلمات النموذج وتمديد وقت التدريب. بالإضافة إلى ذلك ، يمكننا أن نرى أن GPT-4 لها نتائج ممتازة في الاختبارات البشرية المختلفة ، والتي تصل أساسًا إلى مستوى طلاب الجامعات المحتملين.
تكوين النموذج اللغوي الكبير
بالعودة إلى نموذج اللغة الكبيرة نفسه ، أوصي الجميع بمشاهدة خطاب الكلمة الرئيسي حول حالة GPT الذي شاركه المؤسس المشارك لـ OpenAI Andrej Karpathy في مؤتمر مطوري Microsoft. قام بتفكيك عملية التدريب للنموذج الكبير إلى أربع مراحل:
** في مرحلة ما قبل التدريب ، يلزم قدر كبير من بيانات التدريب منخفضة الجودة نسبيًا (بما في ذلك الكتب ، والزحف على الإنترنت ، والأوراق ، وما إلى ذلك) و 99٪ من قوة الحوسبة والوقت في عملية تدريب النموذج الكبير بأكملها لتدريب نموذج أساسي. ** على سبيل المثال ، يتطلب تدريب نموذج أساسي LLaMA 650 مليار متغير 2048 وحدة معالجة رسومات Nvidia A100 ، والتي تستغرق 21 يومًا ، وتبلغ تكلفة التدريب بالكامل حوالي 5 ملايين دولار أمريكي. لذلك ، فإن تدريب نموذج أساسي ليس مناسبًا للشركات الناشئة ، وهذه الموارد والتكاليف متاحة بشكل عام فقط للمصنعين الكبار.
** يتم الإشراف على الخطوة الثانية وضبطها على النموذج الأساسي ، ** وذلك لتدريب طراز SFT ، مثل Vicuna-13B ونماذج مفتوحة المصدر شائعة أخرى ، يتم الإشراف عليها وضبطها بدقة. في هذه المرحلة ، يجب توفير كمية صغيرة فقط من البيانات عالية الجودة ، والطلب على قوة الحوسبة صغير نسبيًا.
** المرحلتان الثالثة والرابعة هما نمذجة المكافأة ومراحل التعلم المعزز ، أي تعلم التغذية المرتدة للتعزيز البشري لمؤسسة رال إتش إف. ** من خلال هاتين المرحلتين ، سيكون إخراج النموذج أفضل بكثير من نموذج الضبط الدقيق والنموذج الأساسي ، ولكن سيتم التضحية بانتروبيا النموذج الأساسي.
** من منظور صناعة السوق الأولية لمعرفة فرص الذكاء الاصطناعي **
بالنظر إلى فرص الاستثمار في الذكاء الاصطناعي بشكل منهجي من منظور الاستثمار في السوق الأولية ، يمكن تقسيمها إلى طبقة أساسية وطبقة نشر وطبقة تطبيق.يعمل مجتمع نموذج الذكاء الاصطناعي من خلال هذه الطبقات الثلاث.
الطبقة السفلية من طبقة البنية التحتية هي طاقة الحوسبة ، وهي أيضًا المكان الذي يواجه حاليًا أكبر قدر من الاختناق المباشر ، والآن يتم حظر كل من Nvidia و AMD GPU في الصين. تواجه شركة Huawei Kunpeng ، الشركة الرائدة في مجال قوة الحوسبة المحلية ، مشكلة انقطاع الشريط ، وفي المستقبل ، قد تواجه الصين ضغوطًا متزايدة فيما يتعلق بقوة الحوسبة المتطورة. في الوقت نفسه ، لا تزال هناك مشكلة استخدام GPU. حتى بالنسبة لـ OpenAI ، هناك عدد كبير من مهندسي Nvidia يقيمون في الموقع للضبط اليدوي ، لكن استخدام GPU الخاص بها هو فقط 50٪ -60٪. فوق قوة الحوسبة توجد طبقة البرامج الأساسية حول النموذج الكبير ، مثل تخزين البيانات الأصلية للذكاء الاصطناعي ، ونقل البيانات ، وأمن البيانات وغيرها من الأدوات ومنصات التطوير والصيانة حول البيانات ، بما في ذلك قواعد بيانات المتجهات ، LLMOps ، MLOps ، إلخ.
قد يكون هناك المزيد من الفرص في طبقة البيانات ، لأن النموذج الأساسي قد يتم تطويره من قبل الشركات الرائدة في المستقبل ، وسيكون هناك عدد كبير من النماذج الأساسية مفتوحة المصدر ، لذلك ليست هناك حاجة لإنفاق الكثير من المال لتطوير النموذج الأساسي الخاص بك. يجب أن نركز على تراكم البيانات للصناعات العمودية والمؤسسات نفسها ، وكيفية تشكيل تطبيقات واسعة النطاق يكون العملاء على استعداد لدفع ثمنها. في الوقت الحالي ، تتمثل أكبر مشكلة في النماذج الكبيرة في كيفية الحصول على مجموعات بيانات عالية الجودة ومجموعات بيانات صناعية عمودية.لقد رأى الجميع إمكانات النماذج الكبيرة في مجالات الصناعة والعلوم والطب والقانون والتمويل والتعليم. قد تكمن الفرص المستقبلية في كيفية الحصول على بيانات عالية الجودة بكفاءة ، وكيفية معالجة البيانات متعددة الوسائط ، وكيفية تحديد ، وكيفية الاستفادة من البيانات ، وكيفية تأكيد الحقوق ، وكيفية التداول ، وكيفية حماية الأمن ، وما إلى ذلك.
يكمن جوهر طبقة الخوارزمية في إطار التعلم العميق والنموذج الأساسي
يمكن وصف إطار التعلم العميق بأنه نظام التشغيل للذكاء الاصطناعي. فهو ينسق نشر موارد الحوسبة إلى أسفل ، ويتعهد بقدرات بناء نماذج خوارزمية الذكاء الاصطناعي لأعلى ، ويوفر عددًا كبيرًا من مكتبات المشغلين ، ومكتبات النماذج ، ودروس المستندات.إنه أيضًا بيئة في الطبيعة ويقلل من عتبة التطوير. في الوقت الحالي ، تعد أطر التعلم العميق السائدة في العالم هي TensorFlow و Meta Pytorch من Google. وفي الصين ، توجد Baidu Fei Paddle و Huawei Shengsi و Oneflow ، والتي كانت قد حصلت عليها سابقًا شركة Light Years Beyond.
يحتوي النموذج الأساسي نفسه أيضًا على تنوع ، على سبيل المثال ، من حيث المسارات التقنية ، هناك CNN و RNN و GAN و Transformer وما إلى ذلك. من المرجح أن يؤدي هذا الاتجاه إلى ولادة الشركات التي تبلغ قيمتها السوقية مئات المليارات أو حتى التريليونات ، ولكنها أيضًا ساحة المعركة الرئيسية التي تشهد منافسة شديدة.
في عصر حرب المائة نموذج ، أصبح تقييم النموذج أداة أساسية لقياس قدرات النماذج المختلفة. في الوقت الحالي ، ظهرت أدوات تقييم متنوعة للنماذج الصغيرة التقليدية (GLUE ، SuperGLUE ، إلخ) ، ونماذج اللغة الكبيرة (HELM ، BIG-Bench ، إلخ) ونماذج اللغة الصينية الكبيرة (SuperCLUE ، C- ، إلخ) في السوق. مثل SuperCLUE و C- ، تمت إضافة عدد كبير من الأسئلة ذات الخصائص الصينية (فكر ماو تسي تونغ ، المبادئ الأساسية للمسك ، إلخ) والخصائص الصينية (التعبيرات الاصطلاحية ، والقصائد ، والصينية الكلاسيكية ، وما إلى ذلك) وأبعاد أخرى إلى مجموعات التقييم الخاصة بهم. انطلاقًا من نتائج التقييم ، باستثناء GPT-4 و GPT-3.5 و Claude ، فإن منتجات النماذج المحلية واسعة النطاق أفضل من النماذج الخارجية الأخرى في أداء التقييم الإجمالي ، وبالتالي فإن ضرورة تدريب النماذج الصينية واسعة النطاق عالية جدًا.
يمكن تقسيم طبقة التطبيق إلى نماذج كبيرة عامة ونماذج كبيرة للصناعة العمودية.نحن نركز بشكل أساسي على الجيل الجديد من أدوات الإنتاجية التي تدعم الذكاء الاصطناعي في مجال النماذج الكبيرة العامة وفرص التطبيق للنماذج الكبيرة في مختلف مجالات الصناعة الرأسية.
** إلى C — أداة إنتاجية مدعمة بالذكاء الاصطناعي **
في عصر الوباء ، شهدت أدوات الإنتاجية القائمة على التعاون مثل Notion و Figma و Canva تغييرات. وبالمثل ، في ظل هذه الموجة من الذكاء الاصطناعي ، ستؤدي أدوات الإنتاجية أيضًا إلى ثورة جديدة.
الآن نرى أن النماذج الكبيرة قد اخترقت بدرجات متفاوتة في النصوص ، والكود ، والصورة ، والموسيقى ، والفيديو ، وثلاثي الأبعاد ، وما إلى ذلك ، تظهر العديد من المنتجات الجديدة والتطبيقات الجديدة واحدة تلو الأخرى ، مثل روبوتات الدردشة في مجال النص ومساعد طيار المنتج المكتبي ، مساعد الطيار GitHub في مجال الكود ، Midjourney و Stable Diffusion في مجال الصور ، AI Stefanie Run ، والتي كانت شائعة في مجال الموسيقى ، مثل شركة Kingsway ، مثل شركة Kingsway ، وما إلى ذلك. ، Zhipu Huazhang ، وما إلى ذلك ، أطلقت أيضًا منتجات مماثلة للذكاء الاصطناعي. ، تعمل على تغيير شكل أدوات الإنتاجية التقليدية بدرجات متفاوتة ، لكنها تقتصر حاليًا على أدوات الكفاءة في عملية الإنتاج الصناعي في مختلف المجالات ، ولا يمكنها تحقيق الذكاء الاصطناعي العام بالمعنى الحقيقي.
في الوقت نفسه ، يمكن ملاحظة أن الشركات المصنعة مثل Microsoft Office و Adobe Photoshop و Unity و Notion تتبنى أيضًا بنشاط هذه الموجة من الذكاء الاصطناعي ، وتضمين إمكانات الذكاء الاصطناعي العام في منتجاتها وسلاسل الأدوات الخاصة بها. كان يعتقد في الأصل أن ظهور Midjourney و Stable Diffusion سيحل محل Photoshop تمامًا ، ولكن تم اكتشاف لاحقًا أن الذكاء الاصطناعي العام AGI ، بسبب مشاكل في التحكم والجوانب الأخرى ، جعل Photoshop مدمجًا مع إمكانات إنشاء الذكاء الاصطناعي أكثر قوة وسهولة في الاستخدام.
** إلى B - نموذج الصناعة الرأسي **
في الوقت الحالي ، معظم منتجات النماذج واسعة النطاق التي أطلقتها الشركات المصنعة الكبرى هي نماذج واسعة النطاق للأغراض العامة. ومع ذلك ، عند مواجهة الصناعات الرأسية ، يحتاج عملاء B-end إلى نماذج كبيرة عالية الدقة وعالية الاتساق وسهلة النشر يمكنها حل مشكلات سيناريو محددة بكفاءة مع بيانات أقل وقدرة حوسبة أقل. يعتمد أحدث طراز كبير من Pangu 3.0 صادر عن Huawei على النموذج الأساسي الكبير ، مضيفًا نماذج كبيرة من صناعة N L1 وقدرات نموذج مشهد X L2.
تتمثل النقاط الرئيسية الأساسية للنماذج الكبيرة للصناعة الرأسية في مجموعات بيانات الصناعة عالية الجودة والقدرات الهندسية لضبط النموذج وضغطه ونشره. هذه أيضًا نقطة فرصة استثمارية ، تمامًا مثل فرصة الحاوية في عصر السحابة الأصلية ، يحتاج عدد كبير من الشركات الصغيرة والمتوسطة الحجم B في الصناعات التقليدية إلى الاعتماد على مصنعي الحاويات المتخصصين لمساعدتهم على الشروع في طريق السحابة الأصلية.
في الوقت الحالي ، كان هناك الكثير من الاستكشاف والممارسة في الخارج في مجال النماذج الكبيرة للصناعة الرأسية ، مثل BloombergGPT في مجال FinGPT. حولت بلومبرج البيانات المالية المتراكمة في الأربعين عامًا الماضية إلى مجموعة بيانات مالية من 365 مليار رمز ، ودمجت مع مجموعات البيانات العامة لتدريب 50 مليار معلمة خاصة بها.
أخيرًا ، دعنا نتحدث عن التركيز الرأسمالي لمسار الذكاء الاصطناعي العام في الخارج: ** من منظور مبلغ الاستثمار ، فإن الخمسة الأوائل هم تطبيقات النصوص التسويقية والصوت ودعم العملاء / روبوتات خدمة العملاء والصور ومنصات MLOps. **
سؤال وجواب
** Q1: يبدو أن شركات خدمات التعهيد التي تقدم التعليقات التوضيحية على البيانات وتساعد في تطوير الذكاء الاصطناعي تعمل بشكل جيد جدًا في الآونة الأخيرة. ما هو اتجاهك الاستثماري؟ **
ج: نحن نولي اهتماما لهذين الاتجاهين حاليا. يركز مجال تصنيف البيانات بشكل أساسي على كيفية استخدام هذه الشركات لقدرات النماذج الكبيرة لتحسين كفاءة وضع العلامات ، مثل استخدام GPT-4 لتسمية النص و SAM لتسمية الصور. نظرًا لأن المنافسة الأساسية الحالية في مجال تصنيف البيانات هي الكفاءة والربح الإجمالي ، فمن يمكنه تحقيق تصنيف أكثر كفاءة بمساعدة قدرات النموذج الكبيرة. فيما يتعلق بخدمات النماذج واسعة النطاق ، ستكون مماثلة لفرص الحاويات في عصر السحابة الأصلية. هناك حاجة إلى البائعين المحترفين لخفض عتبة التدريب على النماذج واسعة النطاق ، والتطوير ، والنشر ، ومساعدة كل مؤسسة على تحقيق حرية النموذج على نطاق واسع.
** Q2: يوجد للذكاء الاصطناعي الآن فئتان: TO C و TO B. هل تعتقد أن الفرصة أكبر بالنسبة لـ TO C أو TO B؟ **
ج: نولي المزيد من الاهتمام لـ TO B. نظرًا لوجود عدد كبير جدًا من عمالقة الإنترنت في مجال TOC ، خاصة في الأماكن التي بها بيئة تطبيق APP محلية قوية ، فمن الأسهل على الشركات المصنعة الكبرى تضمين إمكانات الذكاء الاصطناعي في تطبيقاتها الخاصة. لذلك ، فإننا نولي المزيد من الاهتمام لقدرات تكامل البيانات والفهم التجاري والقدرات الهندسية.
** Q3: حتى بالنسبة للنماذج الكبيرة التي تحتوي على أكثر من مليار معلمة ، تم الإبلاغ عن أكثر من 80 معلمة في الصين. ماذا عن اتجاه الاستثمار في النموذج الكبير؟ كيف تختار بين المصدر المفتوح والمغلق المصدر؟ **
ج: فيما يتعلق بالمصدر المفتوح والمصدر المغلق ، من الضروري التفكير في كيفية الاستفادة الجيدة من المصدر المفتوح وكيفية استخدام نموذج المصدر المفتوح للتسويق ، على سبيل المثال ، لدى LLaMA قيود تجارية ضمن اتفاقية المصدر المفتوح. يتطلب المصدر المغلق البيئة والدعم الخاصين به ، والذي قد يتم الحفاظ عليه فقط من قبل الشركات المصنعة الكبيرة ذات القدرة والموارد المالية.
** س 4: من منظور رواد الأعمال في مجال الذكاء الاصطناعي ، يمكن تقسيمهم إلى ثلاث فئات. فئة واحدة تأتي من المصانع الكبرى والمؤسسين المشهورين بالفعل. الفئة الأخرى أكاديميون وأكاديميون وخبراء من جامعة تسينغهوا أو مجالات أخرى. هناك أيضًا فئة من رواد الأعمال الذين يميلون إلى أن يكونوا على مستوى القاعدة. أي من هذه الفئات الثلاث تفضل؟ **
ج: ظهرت العديد من موجة العارضات الكبيرة في الصين بعد أن أصدرت Open AI نماذج كبيرة مثل ChatGPT و LLaMA و Bloom كمصادر مفتوحة. بالطبع ، هناك أيضًا العديد من الشركات المصنعة الكبيرة التي تتطلع إلى المستقبل والشركات الناشئة الأكاديمية في الصين والتي كانت تستكشف قبل هذه الموجة من طفرة النماذج واسعة النطاق.
بالنسبة للفرق الأكاديمية ، فإن كيفية تحقيق التسويق هي الأكثر تحديًا. لذلك لا أعتقد أنه من الضروري القيام بذلك بنفسك في المستقبل. على سبيل المثال ، يمكن للتعاون بين OpenAI و Microsoft أن يمنح إمكانيات نموذجية واسعة النطاق للمصنعين الكبار. نحن نبحث الآن عن أهداف حول الصين مفتوحة المصدر ، لأن لديها خط إنتاج IDE وتحتاج إلى مساعد طيار ، لذلك نحن نبحث عن إمكانية التعاون مع الفرق الأكاديمية. أعتقد أن هذا النهج أكثر جدوى.
** س 5: ما هي الصناعات العمودية في الجانب ب التي من المرجح أن تحقق اختراقات تجارية؟ **
ج: نظرًا للتعميم وتعدد الأساليب لقدرة النموذج الكبير ، فإن المجال القانوني هو سيناريو شائع جدًا ، والطلب على محتوى النص كبير جدًا. تتمتع النماذج الأكبر حجمًا بهذه الإمكانية ، على الرغم من أنه لا تزال هناك بعض المشكلات التي يتعين حلها من حيث الدقة. بالإضافة إلى ذلك ، تعتبر منتجات المساعد الشخصي أيضًا سيناريو يمكن تخيله ، على الرغم من أن دورة التطوير قد تكون أطول.